awk和sed截取nginx和tomcat时间段日志

1 nginx日志截取示例

  日志路径:/usr/local/nginx/logs, 截取access.log中2019年3月24日17点00~02之间的日志:

  写法1:

cat access.log | awk '$4 >="[24/Mar/2019:17:00:00" && $4 <="[24/Mar/2019:17:02:00"'

  写法2:

cat access.log | egrep "24/Mar/2019" | awk -F':' '$2 = 17 && $3 >= 00 && $3 <= 02'

  写法3:

cat access.log |egrep "24/Mar/2019" |sed -n '/17:00:00/,/17:02:00/p'

2 tomcat日志截取示例

  日志路径:/usr/local/tomcat/logs, 截取catalina.out中2019年3月24日17点00~02之间的日志:

   写法1:

sed -n '/2019-03-24 17:00:/,/2019-03-24 17:02:/p'  catalina.out

  写法2:

cat catalina.out| egrep "2019-03-24" | awk -F':' '$2 = 17 && $3 >= 00 && $3 <= 02'

3 awk统计nginx日志的ip访问量

  nginx日志事先截取一部分:tail -n500 access.log >access.log1

  第一种:使用awk sort,$1表示以空格为分割符的第一列,也就是文件中的ip地址,使用sort对结果排序,uniq -c进行计数,最后sort -n是以“数字”来排序,针对统计后的访问次数来排序

awk '{print $1}' access.log1|sort |uniq -c|sort -n
      1 113.111.9.152
      1 203.208.60.22
      1 66.85.6.225
      2 121.32.197.253
      2 121.69.66.226
      2 123.132.237.10
      2 218.75.223.169
      2 58.216.212.226
      2 58.246.39.218
      2 59.110.50.24
      4 223.223.203.106
      6 111.193.230.31
      8 180.170.208.189
     11 121.249.192.131
     12 218.89.241.229
     12 222.65.85.75
     17 202.106.149.226
     22 39.107.204.192
     24 111.160.58.154
     81 1.202.225.46
    101 47.75.230.56
    185 39.155.239.138

  第二种:awk for,即数组; 默认变量为0,对每一行的$1作为key,count数组++,实现ip的计数。计数结束后END。然后把结果打印出来,最后sort -n以“数字”排序。

awk '{count[$1]++;}END{for(i in count){printf("%s	%s
", count[i], i);}}' access.log1|sort -n
1	113.111.9.152
1	203.208.60.22
1	66.85.6.225
2	121.32.197.253
2	121.69.66.226
2	123.132.237.10
2	218.75.223.169
2	58.216.212.226
2	58.246.39.218
2	59.110.50.24
4	223.223.203.106
6	111.193.230.31
8	180.170.208.189
11	121.249.192.131
12	218.89.241.229
12	222.65.85.75
17	202.106.149.226
22	39.107.204.192
24	111.160.58.154
81	1.202.225.46
101	47.75.230.56
185	39.155.239.138

  补充:如果是倒序,需要加上-r(以相反的顺序来排序),-k(选择以哪个区间进行排序), 如统计nginx日志里访问次数最多的前10个IP

awk '{print $1}' access.log1|sort |uniq -c|sort -nr -k1 |head -n 10
    185 39.155.239.138
    101 47.75.230.56
     81 1.202.225.46
     24 111.160.58.154
     22 39.107.204.192
     17 202.106.149.226
     12 222.65.85.75
     12 218.89.241.229
     11 121.249.192.131
      8 180.170.208.189

   这里不加-k也是默认...

4 取nginx日志访问接口次数

  通过上面的方法将某个时间段日志取出来,查询该时间段访问接口最多的前10:

cat tongji.sh 
#!/bin/bash
 #统计接口的访问次数
 TODAY=`date +%d/%b/%Y`
 cat $1 |awk -F '"' '{print $2}'|awk '{split($2,res,"?") ; print res[1] }'|sort|uniq -c|sort -gr |head -n10

  

  可以根据适当需求调整参数

原文地址:https://www.cnblogs.com/qianjingchen/p/10590598.html