Kapacitor之TICK脚本,监控输出

  好久没更新博客园了,说来也惭愧,之前说好每隔几天更新一个的,虽然没什么人看,但是作为一个记录,回顾也是能有新的认识,这篇博客是讲的目前我在工作中使用的一个结束点,这个技术点目前网上资料少之甚少,也是希望给刚接触的人一个大概的思路,稍作分析下。说了这么多其实我也是个半吊子,也就间接性的踌躇满志,想到一出是一出,写下这个博客都是脑子一热,只是在自己使用的过程中遇到很多问题,解决的比较艰难,查资料又查不了,只能看官方文档,官方文档又是全英文的,阅读起来速度又比较慢,看翻译之后的有很多翻译根本就不对,会导致对方法的错误理解和使用。总之贼鸡儿烦,所以下面的东西希望对你有所帮助,讲的内容不多,也不深,只是给刚刚接触的一个介绍,和自己的一个记录,说了这么多自己都不知道说啥,欲言又止,作为一个程序员在生活中没有那么多时间去扯犊子,所以我就在这多唠叨几句了,对了我还有一个学习的群,有兴趣的可以进来玩玩,494696003 反正没事进来唠唠嗑啥的也是不错的。

 

首先申明:一下内容仅供参考,切勿转发。
阅读一下文章需要对TICK架构脚本 有一定了解,起码知道TICK是干嘛的,里面的一部分语法是怎样的。
熟悉一下TICK的官方文档有一定的必要,否则可能不知道我在说啥。

 

 

 

 

下面我们去看下tick里面的脚本长什么样

 

 

在这个地方给大家介绍一下 脚本为啥要这样写:
TICK 遵循一定的规范,官网可以查。
|query(sql) 此节点可以执行sql的查询语句,
.period(10m) 此链接方法 是属于query下的,意为查询时间的范围,也就是说如果到时候你的sql写完之后 会在真正执行的时候在你的sql后面拼接 where xx - xx 时间的范围查询,这个范围就是你设定的 10m
.window(10) 以此类推 一下就不多做说明,这个也是属于query的连接方法,意为每个多长时间我们的脚本去执行一次这个查询的时间,也就是10分钟去执行一次查询。
.groupBy('ciid') 这是根据给定的字段进行分组。
|eval 
这个节点是TICK脚本中用于业务计算的一个节点,通过lambda表达式能够对以上查询出来的数据进行计算。
计算的时候在tick中 只有浮点数和整数的概念,所以计算的2侧的数据类型要一致否则脚本运行出错。

|influxDBOut() 
这个节点是将以上的数据计算之后 输出到制定的数据库中。
.databases(xx)
.measurement(xx)

以上数据库均是Influxdb

  

以下是我写的一个脚本:计算CPU使用率的一个模板 脚本
var period = 10m

var window = 10m

var to_kpiid = 'PM-00-01-001-05'

var to_kpiname = 'kpi_cpu_usage'

var sql = 'select mean(value) as value from kpi_mock.autogen."PM-00-01-001-01"'

var ciid = ''

var ciname = ''

var citype = ''

var cpu_idle = batch
    |query(sql)
        .period(period)
        .every(window)
        .align()

var usage = cpu_idle
    |eval(lambda: 100.0 - float("value"))
        .as('value')
    |delete()
        .tag('kpiname')
        .tag('kpiid')
        .tag('ciid')
        .tag('ciname')
        .tag('citype')
    |default()
        .tag('kpiname', to_kpiname)
        .tag('kpiid', to_kpiid)
        .tag('ciid', ciid)
        .tag('ciname', ciname)
        .tag('citype', citype)
    |influxDBOut()
        .database('kpi_mock')
        .measurement(to_kpiid)

 

如何定义一个模板(template 此处batch为例,stream类似)

batch_avg_test为自己取名 带上.tick 即你的tick脚本 类型为batch 

./kapacitor define-template batch_avg_test -tick batch_avg_test.tick -type batch 

如何根据一个模板创建具体的任务(task)
在创建具体任务的时候 你需要根据模板参数 写一个相应的json文件,将参数传入模板当中 生成具体的任务
PM-XX-XX-XX-XX:为任务名称
batch_avg_test:模板名称(即刚上面创建的模板)
test.json:传入数据的json文件
xxx.autogen 制定脚本当中执行sql语句和输出数据库的 保留策略(见官方文档)

./kapacitor define PM-XX-XX-XX-XX -template batch_avg_test -vars test.json -dbrp xxx.autogen  

在kapacitor的后台当中 有很多命令都是查看 任务 模板 状态 ,这些都在官方文档有介绍,我这列出一些图给大家进行参考结合自己的理解。

 这个是查看 定义脚本之后生成的模板命令,展示的就是模板。

想要查看具体模板的信息 如下图

这个是查看 根据模板 生成具体的任务, 展示的是任务

想要查看每一个任务的具体的状态信息可以执行,可以查看到具体的执行时间,写入的节点数等等...

如果在操作的过程中,状态那边的节点数都是0 如果有error 那个error那里会显示出具体的个数,但是不会显示具体的错误。具体错误查看下面讲解。

相信大家现在对TICK 具体是什么有一定的了解了吧。
下来我们查看下如何查看我们的TICK脚本 都执行了什么,错在了,怎么查看日志

  

 还记得第一张图中有一个 KapaData的目录吗,进去到log 目录下执行

grep PM-XX-XX-XX-XX *.log 

其中 PM-XX-XX-XX-XX 代表着你具体的执行任务的名称

这样你就知道你的任务具体是怎么跑,出什么错都会在这里显示,还有sql 语句,将sql复制去influxdb 执行就能对比出来数据是否正确了。

以上是使用TICK 的一整套的流程,具体的计算方式需要阅读官方文档,例如计算,保留策略,节点,链接方法,精度等问题。

所有运行都没问题的情况下,你只需查看influxdb数据库产生的表中的数据是否正确即可。这样一整套TICK脚本监控指标就完成了。


文中有很多没有详细讲解,毕竟时间有限,篇幅有限,如有时间继续细化内容。(如有差错望博友指正以至于及时修改,浅显讲解勿喷~都是有素质的人)
在这里祝大家工作顺利,所有BUG都能顺利结局~

再见

  

 

 

原文地址:https://www.cnblogs.com/yeszero/p/9013034.html