linux awk數組操作詳細介紹

用awk進行文本處理,少不了就是它的數組處理。那麽awk數組有那些特點,一般常見運算又會怎麽樣呢。我們先看下下面的一些介紹,結合例子我們會講解下它的不同之處。在 awk 中數組叫做關聯數組(associative arrays),因爲下標記可以是數也可以是串。awk 中的數組不必提前聲明,也不必聲明大小。數組元素用 0 或空串來初始化,這根據上下文而定。例如:

 

一、定義方法

 

1:可以用數值作數組索引(下標)

Tarray[1]=“cheng mo”
Tarray[2]=“800927”

2:可以用字符串作數組索引(下標)

Tarray[“first”]=“cheng ”
Tarray[“last”]=”mo”
Tarray[“birth”]=”800927”

使用中 print Tarray[1] 將得到”cheng mo” 而 print Tarray[2] 和 print[“birth”] 都將得到 ”800927” 。

 

二、數組相關函數

[chengmo@localhost ~]$ awk --version
GNU Awk 3.1.5

使用版本是:3.1以上,不同版本下面函數不一定相同

  • 得到數組長度(length方法使用

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}'
4 4

length返回字符串以及數組長度,split進行分割字符串爲數組,也會返回分割得到數組長度。

 

(asort使用):

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}'
4

asort對數組進行排序,返回數組長度。

 

  • 輸出數組內容(無序,有序輸出):

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'
4 test
1 it
2 is
3 a

 

for…in 輸出,因爲數組是關聯數組,默認是無序的。所以通過for…in 得到是無序的數組。如果需要得到有序數組,需要通過下標獲得。

 

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k<=tlen;k++){print k,tA[k];}}' 
1 it
2 is
3 a
4 test

注意:數組下標是從1開始,與c數組不一樣。

 

 

  • 判斷鍵值存在以及刪除鍵值:

一個錯誤的判斷方法

[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}' 
no found
a a1
b b1
c

 

以上出現奇怪問題,tB[“c”]沒有定義,但是循環時候,發現已經存在該鍵值,它的值爲空,這裏需要注意,awk數組是關聯數組,只要通過數組引用它的key,就會自動創建改序列.

 

正確判斷方法:

[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if( "c" in tB){print "ok";};for(k in tB){print k,tB[k];}}'  
a a1
b b1

if(key in array) 通過這種方法判斷數組中是否包含”key”鍵值。

 

刪除鍵值:

[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}'                     
b b1

 

delete array[key]可以刪除,對應數組key的,序列值。

 

三、二維數組使用(多維數組使用)

awk的多維數組在本質上是一維數組,更確切一點,awk在存儲上並不支持多維數組。awk提供了邏輯上模擬二維數組的訪問方式。例 如,array[2,4] = 1這樣的訪問是允許的。awk使用一個特殊的字符串SUBSEP (\034)作爲分割字段,在上面的例子中,關聯數組array存儲的鍵值實際上是2\0344。

 

類似一維數組的成員測試,多維數組可以使用 if ( (i,j) in array)這樣的語法,但是下標必須放置在圓括號中。
類似一維數組的循環訪問,多維數組使用 for ( item in array )這樣的語法遍曆數組。與一維數組不同的是,多維數組必須使用split()函數來訪問單獨的下標分量。split ( item, subscr, SUBSEP)

 

[chengmo@localhost ~]$ awk 'BEGIN{

for(i=1;i<=9;i++)
{
  for(j=1;j<=9;j++)  
  {
tarr[i,j]=i*j;
print i,"*",j,"=",tarr[i,j];
  }
}
}'
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6

……

可以通過array[k,k2]引用獲得數組內容.

 

方法二:

[chengmo@localhost ~]$ awk 'BEGIN{
for(i=1;i<=9;i++)
{
  for(j=1;j<=9;j++)  
  {
tarr[i,j]=i*j;
  }
}
for(m in tarr)              
{
split(m,tarr2,SUBSEP);
print tarr2[1],"*",tarr2[2],"=",tarr[m];
}
}'

 

以上是awk對數組的處理相關,希望對大家有用。

更多相關文章
  • 摘自 open group 網站 ,原文鏈接:http://pubs.opengroup.org/onlinepubs/009695399/basedefs/netdb.h.html NAME     netdb.h - definitions for network database operat ...
  • Linux發行版知識:關于openSUSE的詳細介紹http://linux.ccidnet.com/art/302/20070813/1176123_1.html SUSE是德國最著名的Linux發行版,在全世界範圍中也享有較高的聲譽.SUSE自主開發的軟件包管理系統YaST也大受好評.SUSE于 ...
  •                               詳細介紹Linux重定向的使用     Linux重定向是指修改原來默認的一些東西,對原來系統命令的默認執行方式進行改變,比如說簡單的我不想看到在顯示器的輸出而是希望輸出到某一文件中就可以通過Linux重定向來進行這項工作. Linux默認 ...
  • Linux發行版知識:關于Fedora的詳細介紹http://linux.ccidnet.com/art/302/20070813/1176115_1.html Fedora 專案是由 Red Hat 贊助,由開源社區與 Red Hat 工程師合作開發的專案統稱.Fedora 的目標,是推動自由和開 ...
  • Android系統在超級終端下必會的命令大全(六) kill1.作用kill命令用來中止一個進程.2.格式kill [ -s signal | -p ] [ -a ] pid -kill -l [ signal ]3.參數-s:指定發送的信號.-p:模擬發送信號.-l:指定信號的名稱列表.pid:要 ...
  • Java輸入輸出流的使用詳細介紹
    Java輸入輸出流的使用詳細介紹1.什麽是IO       Java中I/O操作主要是指使用Java進行輸入,輸出操作. Java所有的I/O機制都是基于數據流進行輸入輸出,這些數據流表示了字符或者字節數據的流動序列.Java的I/O流提供了讀寫數據的標准方法.任何Java中表示數據源的對象都會提供 ...
  • Ehcache詳細介紹
    Ehcache 是現在最流行的純Java開源緩存框架,配置簡單.結構清晰.功能強大,最初知道它,是從Hibernate的緩存開始的.網上中文的EhCache材料以簡單介紹和配置方法居多,如果你有這方面的問題,請自行google:對于API,官網上介紹已經非常清楚,請參見官網:但是很少見到特性說明和對 ...
  • 詳細介紹java中的枚舉類型本文介紹的是java中的枚舉類型,對于枚舉類型的相關知識,我們也介紹過不少方面的內容.希望本文能夠給你帶來幫助,一起來看.AD: 枚舉其實就是一種類型,跟int, char 這種差不多,就是定義變量時限制輸入的,你只能夠賦enum裏面規定的值.建議大家可以看看,這兩篇文章 ...
一周排行
  • mysql的數據庫屬性,字符集爲utf8 – UTF-8 Unicode,排序規則爲utf8_general_ci,struts提交中文無亂碼,只需在spring配置文件,datasource加上 <prope ...
  • LVM很好很強大
    LVM (Logic Volume Management,邏輯卷管理),是傳統商業Unix ...
  • SELECT COUNT(*) TABLES, table_schema FROM information_schema.TABLES   WHERE table_schema = '數據庫' GROUP BY ta ...
  • 基本數據的類型的大小是固定的,這裏就不多說了.對于非基本類型的Java對象,其大小就值得商榷.在Java中,一個空Object對象的大小是8byte,這個大小只是保存堆中一個沒有任何屬性的對象的大小.看下面語句:Ob ...
  • 今日獲取微信返回CODE  發現用EL取不到URL中?後面的參數搜索後用下面方法解決:$.extend({  getUrlVars: function(){    var vars = [], hash;    va ...
  • 1. WordPress主題開發http://www.wordpress.la/codex-WordPress%E4%B8%BB%E9%A2%98%E5%BC%80%E5%8F%91.html 2.WordPress ...
  • 辦證囧,辦證難,可我們有些證件又不能不辦,否則更不方便.用什麽消除辦證難?靠技術. 大數據,或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到撷取.管理.處理.並整理成爲幫助企業經 ...
  • 工作中遇到的asp.net專案使用forms認證.以前雖然用過,但其原理並不了解,現在甚至對什麽是form認證也完全不知道了.對一樣東西如果不清楚其原理,不知其所以然,那麽死記硬背是無濟于事的.asp.net提供了三 ...
  • 將實體打散成不可再分的微粒,這樣就可以使設計靈活化,最大限度的減少數據冗余.以CRM系統爲例,雖然管理是基于一組控制元素而不是一個控制元素的,設計的時候還是以一個控制元素爲基礎.     linux的cgroup系統 ...