AWK入门

2164阅读 0评论2012-09-18 无赖皮肤
分类:Python/Ruby

awk常常用于处理数据和生成报告。它以逐行扫描的方式,查找匹配某个特定模式
的文本,同时可以对匹配的行进行非常精细的操作。


** awk的格式:

: awk 'pattern {action}' filename


*** pattern

其中pattern指的就是匹配的模式,类似于grep,不过和sed的匹配更相似。例如
'/ ^mail /'就是匹配以mail开始的行。

*** action

action类似于sed在匹配模式后面跟上的命令,它的所用就是对匹配到的文本进行
某种操作。例如'/ ^mail / {print $1}',它将匹配以mail开头的行,并将其第
一个字段打印出来。

** awk的工作原理

awk以一行作为输入,并将该行赋给内部变量$0;接着,awk将根据分割符将行分
割成多个字段,每一个字段按照顺序存储在$1, $2... 最多可以达到100个。这个
很类似shell脚本的参数,$0代表本身,$1往后是位置参数,代表每一个参数。接
着awk可以对每一个字段进行相应的操作,这是grep和sed很难实现的。



  1. ~$ awk '/calls/ {print $2, $5}' test
  2. System provided
  3. Library within
  4. # 首先匹配包含calls的行,接着显示第2和第5个字段。


** awk环境变量


  1. |-----+------------|
  2. | NF | 字段数 |
  3. |-----+------------|
  4. | NR | 记录数 |
  5. |-----+------------|
  6. | FS | 分割符 |
  7. |-----+------------|
  8. | OFS | 输出分割符 |
  9. |-----+------------|

上一篇:在Emacs中直接使用stardict查单词
下一篇:grep命令详解