linux日志log查询常用命令

一般的log文件都是需要过滤

1.grep 过滤查找

查询ip 221.2.100.138的log

grep '221.2.100.138' web.access.log

grep 221.2.100.138 web.access.log

less web.access.log |grep "221.2.100.138"

统计error行数

grep error web.access.log |wc -l

将error重定向(linux是>python是>>)到文件中

grep error web.access.log >mylog1.txt

其他常用参数,位置放在前面后面都可以

-i 　　不区分大小写 grep -i 'HTTP' web.access.log或者grep 'HTTP' -i web.access.log

-n 输出行号

-c 统计行数

支持正则

2.sed 行筛选

显示第1行

[root@localhost ~]# sed -n '1p' log.log

12.3.4.3 122:33:33:#3 /post/dfdjfk/dff 400

显示第1-3行

[root@localhost ~]# sed -n '1,3p' log.log

12.3.4.3 122:33:33:#3 /post/dfdjfk/dff 400

12.3.4.5.5 343:44:$:444 /get/fd/ddf error

127.0.0.1 2018:09:01:56 /post/ffdf 200

常用选项：
        -n∶不使用的时候，会把所有数据都显示出来，但如果加上 -n 参数后，只显示经过处理的那几行
        -e∶直接在指令列模式上进行 sed 的动作编辑；
        -f∶直接将 sed 的动作写在一个档案内， -f filename 则可以执行 filename 内的sed 动作；
        -r∶sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)
        -i∶直接修改读取的档案内容，而不是由萤幕输出。

常用命令：
        a   ∶新增， a 的后面可以接字串，而这些字串会在新的一行出现(目前的下一行)～
        c   ∶取代， c 的后面可以接字串，这些字串可以取代 n1,n2 之间的行！
        d   ∶删除，因为是删除啊，所以 d 后面通常不接任何咚咚；
         i   ∶插入， i 的后面可以接字串，而这些字串会在新的一行出现(目前的上一行)；
         p  ∶列印，亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作～
         s

命令是直接使用，参数是-一起使用

格式：

sed '/模式/' d filename或者sed '/模式d/' filename都可以。删除查询条件为模式的行

eg：删除以#开头的行，并将修改写入文件

sed '/^#/' d -i filename

如果不加-i是显示在屏幕上，这时候可以把结果重定向到文件中

sed '/^#/' d filename>filename_new 覆盖写入w

sed '/^#/' d -i filename>>filename_new追加写入aw

sed -n '/2015:08:39:59/,/2015:08:40:02/' p web.access.log 打印出这个时间段的log,p是打印的意思

sed -n '/2015:08:39:59/,/2015:08:40:02/' web.access.log |awk '{print $4,$5}'

awk分列

语法awk '{print $1}'打印第一列

awk -F : '{print $1}' 以：为分隔符打印出第一列比如每行的数据格式是aa:bb,执行以后会取到aa，要想这个时候取值aa和bb，执行awk -F :'{print $1,$2}'

awk '{if(表达式){语句}}'

（1） awk '{print}' 打印所有列

（2）打印第一行的所有数据 awk 'NR==1{print}'

（3）打印第二行第一列 awk 'NR==2{print $1}'

grep '106.39.249.119' web.access.log | awk '{print $1,$2}' 打印出含有106这个ip地址的第一列和第二列

awk '{if($1=="106.39.241.119"){print $1,$2}}' web.access.log 打印出ip地址是106的第一列和第二列

awk '$1=="106.39.249.119" {print $1,$2}' web.access.log同上

其他组合用法

1.统计wc

统计行数（line） |wc -l more filename|wc -l或者wc -l filename

统计单词数（word） |wc -w

统计字符数 |wc -c （bytes）

2.排序sort 经常与|管道符使用

|sort -n 按照数字进行排序，不加，会出现1后面是10这种排序

|sort -nr 反序reverse排序

3.去重uniq

经常与管道符结合使用|

|uniq -c 将该重复的数据的行数统计出一般在uniq -c|sort -n使用，因为uniq会把数字统计出来，然后sort -n按照数字进行排序

|uniq -d 只显示重复的行

|uniq -u 只显示不重复的行

例子：

统计出访问日志中有多少个不同的ip

awk '{print $1}' web.access.log |sort|uniq -c|wc -l

统计访问最高的ip

cat access.log|awk '{print $2}'|uniq -c|sort -nr|head -n 1

或者

cat acess.log|awk '{print $2}'|uniq -c|sort -nr|sed '1p'

字符转换tr，以下转换不会对源文件进行操作

tr '#' '!' 把#全部转换成！

cat a.log |tr 'a-z' 'A-Z'