Cassandra监控

注:本文转自:http://eric100.blog.51cto.com/2535573/1717792

Opscenter用户手册

1.       OpsCenter简介

DataStaxOpsCenter是一个可视化管理和监控Apache Cassandra和DataStax Enterprise工具。OpsCenter简化了管理任务:

  • 添加扩展集群

  • 配置nodes

  • 查看性能指标

  • 修复问题

  • 监控集群情况

  • 主要功能

OpsCenter主要功能如下:

Dashboard 

概述显示任何警报和多个集群的仪表板。

仪表板显示性能指标监测的概况。

可以在仪表板中添加和编辑图表。

配置管理

基本的集群配置。

管理任务,比如使用简单的单击操作添加集群。

可视化的集群配置。

使用agent管理多个集群。

多个node管理。

下载PDF的集群报告。

only企业版的功能

仅支持DataStax Enterprise版本。

监控DSE内存tables的功能。

查看spark console。

主备切换,自动失效转移。

安全,可以定义用户角色。

DSE管理服务:

  • Backup服务 – 允许自动或手动备份。

  • Repaire服务 – 执行修复操作在DSE集群。

  • Capacity服务 – 监控集群性能,预测性能趋势。

  • Best Practice服务 – 执行预定义的best practice规则,校验集群环境的变量属性。

  • 性能服务 – 监控能行指标,并通过提示建议快速修复问题

告警:

  • 内置通知功能。

  • warning告警

  • 从Cassandra,Analytics和Search nodes收集指标,并存储在OpsCenter创建的keyspace中。

批量管理多个节点。

当新node添加或删除时,Rebalance数据。

生成诊断的tarball,支持问题的排除。

Hadoop Job  Tracker集成。

查看过去一周的历史指标。

1.2.    OpsCenter架构概览

通过Cassandra和DataStaxEnterprise安装DataStax agents。Agents使用Java Management Extensions (JMX)来监控管理每个node。

wKioL1ZZV9ihlrfoAACM3KKXmuI609.png

2.       安装OpsCenter

2.1.    准备

最小的硬件环境:

  • 2 CPU cores

  • 2 GB of RAM available to OpsCenter

权限和软件环境:

  • 如果希望对配置的values加密,需安装pycryptolibrary

  • 安装JRE或JDK。

  • 建议使用最新版本的浏览器。OpsCenter不支持InternetExplorer和 Microsoft Edge。

  • Python 2.6+

 

2.2.   安装步骤

1、下载OpsCenter

$ curl -Lhttp://downloads.datastax.com/community/opscenter.tar.gz | tar xz

文件已包含DataStaxagent。

2、进入opscenterversion_number目录

$ cd opscenter-version_number

3、启动OpsCenter

$ bin/opscenter

注意:使用bin/opscenter –f是在前台启动

4、浏览器打开OpsCenter

http://opscenter-host:8888/

3.       安装DataStax agents

通过OpsCenter添加完集群之后,会在Dashboard上显示agents状态。

OpsCenter会尝试自动安装agents,如果失败需要在每个节点上手动安装。

3.1.    前置条件

  • Root或sudo安装agents。

  • JMX连接可用在集群节点上。

  • SSH可用。

  •   OpsCenter诊断tarball特性需要GNU1.16版本以上。CentOS/RHEL需要6以上。

3.2.    步骤

1、打开浏览器,访问http://opscenter_host:8888

http://1.2.3.4:8888/

当首次开启OpsCenter,会提示你连接集群:

wKioL1ZZWNHh2YGFAAAv3Tlonww527.png

2、点击ManageExisting Cluster,出现Add Cluster对话框。

wKiom1ZZWJigiLMHAABvwFIhh3Q247.png

3、在Add Cluster,输入集群节点的Hostnames或IP地址,设置JMX和Native Transport端口号,点击Save Cluster

OpsCenter连接到集群后,在Dashboard顶部会出现Fix连接。

4、点击Fix连接开始安装agents

wKioL1ZZWVfQWCHuAAAMp2G-dWA236.png

5、在Install Node Agent,点击EnterCredentials

6、在Node SSH Credentials,输入username和其他验证信息,点击Done。

7、在Install Node Agent对话框,点击Install on all nodes。

8、如果提示,点击Accept Fingerprint添加节点主机。

3.3.    结果

DataStax agents已经被安装部署到集群节点上。

如果你不能够通过OpsCenter UI安装agents,请参考手动部署agents。

3.4.    手动部署agents

3.4.1.       前置条件

  • Cassandra或DataStax Enterprise集群正在运行。

  • OpsCenter已经安装。

  • 集群节点JMX可用。

  • OpsCenter诊断tarball特性需要GNU1.16版本以上。CentOS/RHEL需要6以上。

  • SYSSTAT工具(用来手机I/O指标,yuminstall –y sysstat)

3.4.2.       步骤

  1. 下载DataStax agent tarball

$ curl -Lhttp://downloads.datastax.com/community/datastax-agent-version_number.tar.gz| tar xz

  1. 切入到agent目录

$ cd datastax-agent-version_number

  1. address.yaml中设置stomp_interface为OpsCenter的IP地址(需要手动创建此文件)

$ echo "stomp_interface:reachable_opscenterd_ip" >> ./conf/address.yaml

  1. 如果在opscenterd.conf中开启了SSL,则在address.yaml添加SSL。

$ echo "use_ssl: 1" >>./conf/address.yaml

  1. 开启agent

$ bin/datastax-agent

使用-f选项可以运行在前台

3.5.    OpsCenter 参考

3.5.1.       OpsCenter 和DataStax agent端口号

端口号

描述

OpsCenter端口号

8888

OpsCenter web地址端口。Opscenterd监听来自浏览器的HTTP端口号,在opscenterd.conf中配置。

50031

OpsCenter对于Job Tracker的HTTP代理端口。Opscenterd进程监听浏览器查看Hadoop Job Tracker页面的HTTP端口号,在opscenterd.conf中配置(只支持DataStax  Enterprise)

61620

OpsCenter监控端口号。Opscenterd进程监听来自agent的TCP交互。在opscenterd.conf中配置。

DataStax agent端口号

7199

JMX监控端口号。每个agent节点会打开一个JMX连接

8012

Hadoop Job Tracker client端口号(只支持DataStax Enterprise)

8012

Hadoop Job Tracker website端口号(只支持DataStax  Enterprise)

8012

Hadoop Task Tracker website端口号(只支持DataStax Enterprise)

9042

native transport端口号,在cassandra.yaml中配置的native_transport_port

61621

DataStax agent端口号

22

SSH端口号。在opscenterd.conf中配置。

Solr和Demo applications端口号

8983

Solr端口号和Demo  applications端口号

LDAP服务端口号

389

非SSL LDAP和AD默认端口号。在opscenterd.conf中配置。

636

SSL LDAP和AD默认端口号。在opscenterd.conf中配置。

3.5.2.       安装配置路径

3.5.2.1.   非服务tarball安装默认文件路径

文件路径与tarball安装路径相同。

安装文件列表如下:

Directory

Location

/agent

Agent安装文件

/bin

启动和配置二进制命令

/content

Web应用文件

/conf

配置文件

/doc

License文件

/lib and /src

Library文件

/log

OpsCenter日志文件

/ssl

agent交互的SSL文件

3.5.3.       启动,停止和重启OpsCenter

非服务tarball步骤:

1、启动opscenterd:

$ install_location/bin/opscenter ##使用-f可前台启动

2、停止和重启opscenterd:

  •  找出opscenterd进程ID(pid),kill掉进程

$ ps -ef | grep opscenter

$ sudo kill pid

  • 启动opscenterd:

$ install_location/bin/opscenter ##使用-f可前台启动

3.5.4.       启动和重启DataStax agents

非服务tarball安装方式步骤:

1、启动agent:

$ install_location/bin/datastax-agent##使用-f可前台启动

2、停止和重启agent:

  •  找出agent进程ID(pid),kill掉进程

$ ps -ef | grep datastax-agent

$ sudo kill pid

  • 启动opscenterd:

$ install_location/bin/ datastax-agent ##使用-f可前台启动

4.       配置

4.1.    配置事件告警

Activities展示了OpsCenterEvent日志页面,包含事件和告警列表。下面的列表展示了事件日志级别:

  • DEBUG (0)

  • INFO (1)

  • WARN (2)

  • ERROR (3)

  • CRITICAL (4)

  • ALERT (5)

告警:

可选的,你可以配置OpsCenter发送告警信息对于选中的日志级别。这些告警可以通过邮箱、HTTP提供。默认告警不可用。

告警可以通过OpsCenter API或UI事件促发。比如,nodetool通过命令行执行move操作将不会促发告警,但是通过OpsCenter Nodes > List View > Other Actions > Move将会促发告警

告警包含的信息:

Field

Description

Example

api_source_ip

发送请求的原IP地址

67.169.50.240

target_node

STREAMING操作的目的地址

10.1.1.11

event_source

事件产生的组件

OpsCenter (i.e., restart, start)

user

事件产生的OpsCenter user

opscenter_user

time

事件时间

1311025650414527

action

事件类型

20

subject

邮件告警主题

[WARN] OpsCenter Event - Node reported as  being down: 127.0.0.1

message

事件描述

Garbage Collecting node 10.1.1.13

level

日志级别的数值

1

source_node

事件发生的原节点

10.1.1.13

level_str

事件日志级别

INFO

4.1.1.       开启邮箱告警

为了启动邮箱告警,需要编辑<config_location>/event-plugins/email.conf文件并提供可用的SMTPserver host和port信息。

4.1.1.1.   前置条件

确保你拥有可用的SMTP帐号可以收发告警。

4.1.1.2.   步骤

  1. 在OpsCenter主机上打开email.conf文件

  2. 设置enabled为1

  3. 提供有效的SMTP的主机、端口号、用户名和密码

  4. 提供有效的邮箱地址,to_addr和from_addr。to_addr值为接受告警帐号

  5.  可选的:设置发送告警级别。默认为监听所有基本

  6. 可选的:自定义发送主题

  7. 保存<config_location>/event-plugins/email.conf。重启OpsCenter。

为了发送告警给多个邮箱地址,创建不同的邮箱配置文件,比如email1.conf,email2.conf

4.1.1.3.   案例

[email]
# set to 1 to enable email
enabled=1
# levels can be comma delimited list of any of the following:
# DEBUG,INFO,WARN,ERROR,CRITICAL,ALERT
# If left empty, will listen for all levels
levels=WARN
smtp_host=smtp.gmail.com
smtp_port=465
smtp_user=mercury@gmail.com
smtp_pass=*********
smtp_use_ssl=1
smtp_use_tls=0
smtp_retries=1
smtp_timeout=5
to_addr=cassandra_admin@acme.com
from_addr=mercury@gmail.com
# Customizable subject for email.  The key specified in {}'s must map to the items provided in json map at the end of
# the emails. For example, some available keys are:
#     node, cluster, datetime, level_str, message, target_node, event_source, success, api_source_ip, user, source_node
# more advanced formatting options explained here: https://docs.python.org/2/library/string.html#formatspec
subject=[{level_str}] OpsCenter Event on {cluster} - {message}

4.2.    配置文件

配置能力,可以修改opscenterd.conf,cluster_name.conf和address.yaml配置文件。

         注意:OpsCenterconsole是最方便修改配置文件的方式。

  • opscenterd.conf:配置OpsCenter daemon属性,路径install_location/conf/opscenterd.conf

  • cluster_name.conf:配置OpsCenter集群监控属性,路径install_location/conf/clusters/cluster_name.conf

  • address.yaml:配置DataStaxagent属性,路径install_location/conf/address.yaml。

    大部分的属性也可以在cluster_name.conf文件中的[agent_config]部分配置。

配置文件优先级:

Opscenter5.2之前版本cluster_name.conf配置优先于address.yaml。Opscenter5.2和之后版本,addresss.yaml优先于cluster_name.conf

4.2.1.       opscenterd.conf配置文件

注意修改文件属性后,需要重启Opscenter才能生效。

[webserver] port

OpsCenter webserver的HTTP连接端口。默认8888。

[webserver] interface

web server监听clientconnections的interface

[webserver] log_path

HTTP交互的日志路径,默认install_location/log/http.log

[logging] level

Opscenter日志级别,可用级别为:TRACE, DEBUG, INFO, WARN, ERROR。默认INFO

[logging] log_path

OpsCenter日志路径,默认install_location/log/opscenterd.log。

5.       OpsCenter使用

5.1.    OpsCenter workspace介绍

5.1.1.       主菜单

wKioL1ZZlpnDOjdiAAAeot_2xb0801.png

从主菜单访问OpsCenter以下功能:

  • New Cluster – 创建一个新的cluster或添加已经存在的cluster。

  • Alerts – 配置告警阀值。只有DataStax Enterprise可用

  • Settings – 访问编辑ClusterConnections和User Roles:

    • Cluster Connections – 修改集群设置或移除集群

    • Users & Roles – 管理用户基于角色认证

  • Help – OpsCenter资源信息

 

5.1.2.       导航菜单

wKiom1ZZlrDSnr0YAABNfMrPwGM500.png

  • Overview – 提供OpsCenter实例的集群概览。

wKioL1ZZl0mRkfcPAACBjJksrxM642.png

  • Dashboard –查看OpsCenter集群信息,监控Cassandra集群性能指标。

wKiom1ZZlxug7NMrAAC-o9yYZwM511.png

  • Nodes – 从不同的角度查看集群(Ring or List View),执行集群节点的维护操作

wKioL1ZZl6PxbgeGAACgi-BdBoc182.png

  • Activities – 展示集群运行的任务,查看OpsCenter日志事件,比如在Eventlog中的OpsCenter启动停止。查看Spark jobs状态。查看那Hadoop Jobs状态。

wKioL1ZZl8Hya9miAABOzW48XoQ096.png

  • Data – 管理keyspaces和tables

wKiom1ZZl4LwRNKhAAA4q-TFfHE313.png

Services - DataStax Enterprise管理服务

 

5.2.    节点监控和管理

 

5.2.1.      Ring View

Ring View展示了集群节点作为ring的节点,可以从此诊断节点健康,数据分布等。点击cluster > Nodes> Ring,访问Ring View

wKiom1ZZl-HTOer2AADGzK_0AwY741.png

Ring view解释:

  • 健康概览。监控图标从左到右:Normal,Medium,High load,节点down

  • 颜色表示节点健康状态,由系统负载决定。0–0.999为Normal (green),1–5 Medium (yellow),5+ High (red),down(gray)

节点详情:

鼠标悬浮在节点上,将会展示节点详情。详情是实时更新的。

wKioL1ZZmHLwzIVlAABJoh9QD6Q269.png

点击节点,将会展示节点详情的对话框,展示更多的信息。使用Actions菜单可以在节点上运行多种操作。

wKiom1ZZmCzBUFg4AAD-lmmJV-A088.png

5.2.2.       List View

List View是RingView另一种展示。List View提供了当查看数据时,更快的访问和更多的灵活性。所有数据都是实时更新的。

点击cluster > Nodes > Listtab,访问List View

wKioL1ZZmK2iE9WvAADToYvyeuQ868.png

查看节点详情:

点击节点,将会展示节点详情的对话框,展示更多的信息。使用Actions菜单可以在节点上运行多种操作。

wKiom1ZZmCzBUFg4AAD-lmmJV-A088.png

5.2.3.       节点管理操作

5.2.3.1.   管理单个节点

从List View或Ring View点击节点,从Actions菜单中选择action

wKioL1ZZmN3g0Bd9AAA6Pv6UCVo902.png

5.2.3.2.   操作详情

1、View Metrics

可以选择指标,生成监控图形

2、Configure

可以配置修改选中节点的cassandra.yaml文件

3、Start/Stop

启动或停止Cassandra进程。

4、Restart

重启Cassandra进程

5、Cleanup

移除节点的rows

6、Compact

执行压缩操作,在大部分Cassandra集群不建议操作。

7、Flush

将内存中的数据(memtables)flush到磁盘(SSTables)

8、Repair

修复副本数据的不一致性。

9、Perform GC

强制JVM执行GC操作

10、Drain

使当前写操作存储在memtables中的数据flush到SSTables,并使此节点变为只读。节点将不再接受新的写入操作。Drain一般用于升级节点。

5.3.    管理keyspaces和tables

5.3.1.       管理keyspaces

步骤:

1、点击左边导航窗口中的Data。展示Keyspaces列表

wKioL1ZZmVXTJ6dtAADDEwwO2Ew538.png

2、选择Keyspaces列表中的一个keyspace

wKiom1ZZmRKzVwIFAADmiqWK0oA753.png

3、在keyspace settings中,点击Edit

wKiom1ZZmXvwVRwOAABmAk0Tv7A890.png

4、点击Delete Keyspace,删除keyspace

5.3.2.       管理tables

步骤:

  1. 点击左边导航窗口中的Data。展示Keyspaces列表

  2. 选中tables列表中的table,将会展示table的CQL statement

wKioL1ZZmgSAcRq5AAC7dTOmu1A544.png

3、其他操作:

  •  Delete:从keyspace中删除此表

  •  View Metrics:展示table的指标

  •  Truncate:删除此表的所有数据

5.4.    集群管理

5.4.1.       删除集群

步骤:

  1. 从主菜单上,点击Settings >Cluster Connections

wKiom1ZZmjbg38lhAACHn1zgGTI157.png

2、点击Delete Cluster

5.4.2.       重启集群

步骤:

  1. 点击ClusterActions菜单中的Restart

wKioL1ZZmtHi8rd1AABWeRvl9fs760.png

2、设置每个节点重启后等待时间。默认60s

3、可选的:选择是否执行Drain在停止之前。

4、点击Restart Cluster

5.4.3.       产生PDF报告

点击Help >Report将产生集群监控PDF报告

wKioL1ZZmwLxR5gnAAAXMV7C5hk691.png

5.5.    性能指标

5.5.1.       使用性能指标

选择Dashboard查看指标类型:

  • 集群性能指标

  • Task指标

  • Table指标

 

5.5.1.1.      创建和编辑性能图

图标可以在一个单元中包含多个指标。比如,一个图标可以包含CPU和磁盘的利用率,读写请求和系统负载。

可以展示告警,集群健康和存储容量。

步骤:

1、点击Dashboard

2、点击Add Graph

3、在Add Metric对话框,选择指标

wKioL1ZZm1DS2czXAACWocsrAn8030.png

4、选择监控的节点

5、可选的:点击table,选择特定的表

6、点击Add Metric

7、点击Save Graph展示指定的指标图表

8、点击图标右上角的title,点击Edit Graph可以编辑图表

wKiom1ZZm3SDOlMxAACSl8L0070613.png

9、点击Add Widget可以开启和关闭Alerts, Cluster Health和Storage Capacity

wKiom1ZZm6iBJZfFAAAh8_Fst54857.png

5.5.1.2.   分组设置性能指标

步骤:

1、点击Dashboard

wKioL1ZZnCvjHrMZAAAidNA9zf8106.png

2、点击Clone可以克隆指标图表

3、点击Make Default,设置为默认

4、点击Rename,可以重命名

5、点击Delete,可以删除

5.5.1.3.   导出导出dashboard

Dashboard导出导入为JSON文件

编辑opscenterd.conf,重启opscenterd

[labs]

enable_dashboard_preset_import_export = True

步骤:

1、点击Dashboard,点击Export

wKioL1ZZnJvy408vAABQcMQbbjk575.png

2、点击Import连接

wKiom1ZZnFaC3M0LAACNOoKpIzw726.png

5.5.2.       集群性能指标

CassandraJVM memory usage

Cassandra 进程使用Java heapmemory的平均值

WriteRequests

在coordinator节点上每秒的写请求数,类似与client写请求

WriteRequest Latency

Client写响应平均时长(以毫秒为单位)。依赖于consistencylevel和replication factor,也包含了写replicas的网络延迟

Read Requests

在coordinator节点上每秒的读请求数,类似与client读请求

 

ReadRequest Latency

Client读响应平均时长(以毫秒为单位)。read latency受到硬盘,网络和应用程序读的方式等影响。比如,使用二级索引,读请求数据大小,client需要的consistency level都将影响read latency。I/O的争用也会增加read latency。当SSTables有很多碎片,compaction跟不上写负载则读也会变慢。

 

JVMCMS Collection Count

JVM每秒并发标记-清除(CMS)垃圾的数量。

JVMCMS Collection Time

CMS垃圾收集时间(ms/sec)

JVMParNew Collection Count

JVM每秒并行执行的新一代垃圾收集的数量

JVMParNew Collection Time

ParNew垃圾收集时间(ms/sec)

DataSize

Cassandra存储数据的大小。建议不超过磁盘的70%,留一些空间维护compaction和repair操作。

Totalbytes compacted

SSTable每秒数据压缩的字节数

Totalcompactions

每秒压缩的数量

5.5.3.       Pending任务指标

Pending tasks常常是由缺少集群资源引起,比如磁盘带宽,网络带宽和内存。

5.5.3.1.   Pending task metrics forwrites(写等待任务指标)

FlushesPending

Flush进程flush memtables到SSTables。这个指标展示了flushmemtables队列的数量。最优数量为0(或较少数量)。值大于0表示有I/O竞争,降低了磁盘性能

Repl.(Replicate) on Write TasksPending (复制等待任务指标)

当插入或修改一行时,此行将会复制到其他节点。调用的是ReplicateOnWriteStage。这个指标跟踪了写进程阶段。在一个低或适中的写负载时,你应该看到0 pending replicate在写任务上(或比较低的数字)。持续的高值表示需要检查下磁盘I/O或网络连接问题

5.5.3.2.   Pending task metrics forreads(读等待任务指标)

ReadRequests Pending

到达集群等待处理的读请求的数量。在一个低或适中的写负载时,你应该看到0 pending read在写任务上(或比较低的数字)。持续的高值表示需要检查下磁盘I/O或网络连接问题。Pending reads也可能表示应用设计没有以有效的方式来访问数据

ReadRepair Tasks Pending

读修复操作队列,等待系统资源的数量。最优数量为0(或比较低的数字)。值大于0表示读修复操作与其他操作存在I/O竞争。对于表来说,降低此table参数read_repair_chance,你需要容忍一定程度的旧数据。

 

CompactionsPending

Compactions队列的数量,等待系统资源。最优数量为0(或比较低的数字)。值大于0表示读操作与compaction操作竞争I/O连接,表示读性能下降。这种情况常常是由于执行频繁的small writes和持久的reads。如果一个节点或集群展示了pending compactions,表示你可能需要增大I/O能力,通过添加节点到集群。你也可以减少I/O连接,通过减少插入/更新请求(比如批量写入)。或则减少SSTables创建的数量,通过增大memtable大小,flush频率。

5.5.3.3.   Pending task metrics forcluster operations(集群操作等待任务指标)

Manualrepair tasks pending

Repair操作数量。Repair是一个资源敏感操作,需要执行:比较副本间的数据,发送改变的row到副本来保证数据的一致性,删除过期的tombstones,重建索引和bloom filters。跟踪这个指标的状态可以帮助你确定repaire操作的过程。它常常不会出现很大的值。

Gossiptasks pending

Cassandra使用gossip协议来发现其他节点的位置和状态信息。每个节点每秒发送一次gossip,与其他节点交换状态信息。Gossip tasks pending表示gossip messages等待发送或接受的数量。最优数量为0(或比较低的数字)。值大于0表示网络可能有问题。

Hintedhandoff pending

当一个节点offline,其他节点在节点不可用期间将会保存rows更新的提示。当节点重新online,它对应的副本将会修复。hinted handoff pending指标表示等待发送给failed节点hints的数量。查看这个指标可以确定failed节点数据是否恢复。Hinted handoff是Cassandra可选的功能。Hints可以配置保存周期(默认1小时)。

Miscellaneoustasks pending

系统修改schema后的等待任务数量。Schema修改需要传播给所有的节点,所以这个指标能够表示schema 不一致的错误。

5.5.4.       Table性能指标

TBL:Local Writes

表的写负载。指标包含所有的写请求到此table,包含来自其他节点的写请求。

TBL:Local Write Latency

成功写入表后的响应事件,单位毫秒。writelatency受到硬盘,网络和写入性质影响(比如consistency levels)

TBL:Write Latency (Stacked)

写数据的响应事件,包含min,median, max, 90%和99%

TBL:Local Reads

读负载

TBL:Local Read Latency

成功读取数据后的响应事件

ReadLatency (Stacked)

读数据的响应事件,包含min, median, max, 90%和99%

TBL:Live Disk Used

存活的SSTables使用的磁盘空间,不包含过时的SSTables

TBL:Total Disk Used

SSTables使用的磁盘空间,包含过时的SSTables

TBL:SSTable Count

SSTables当前数量

TBL:SSTables per Read (Stacked)

读取多少SSTables:包含min,median, max, 90%和99%

TBL:Cell Count

表在分区中存在多少个cells:包含min,median, max, 90%和99%

TBL:Partition Size

表的分区大小:包含min, median,max, 90%和99%

TBL:Pending Reads/Writes

表的读写等待数量。

TBL:Bloom Filter Space Used

bloomfilter文件在磁盘的大小。

TBL:Bloom Filter False Positives

bloom filter误报的数量,比如bloomfilter表示row存在,但实际上不存在的数量

TBL:Bloom Filter False Positive Ratio

bloomfilter误报的百分比

TBL:Bloom Filter Off Heap

bloomfilters使用的heap memory

TBL:Index Summary Off Heap

索引使用的heapmemory

TBL:Compression Metadata Off Heap

compressionmetadata使用的heap memory

TBL:Memtable Off Heap

表当前的memtable使用的heapmemory

TBL:Total Memtable Size

所有的memtables使用内存的空间

TBL:Key Cache Requests

在row key cache读请求的数量

TBL:Key Cache Hits

在row keycache读请求命中的数量

TBL:Key Cache Hit Rate

在row keycache读请求命中的比率

TBL:Row Cache Requests

在row key cache读请求的数量,这个指标只是展示配置的row caching(row caching默认不可用)

TBL:Row Cache Hits

在row key cache读请求命中的数量,这个指标只是展示配置的row caching(row caching默认不可用)

TBL:Row Cache Hit Rate

在row key cache读请求命中的比率,这个指标只是展示配置的row caching(row caching默认不可用)

TBL:SSTable Size

表当前SSTables当前大小

5.5.5.       操作系统性能指标

OS:Memory

展示系统内存的使用:cached,buffered和free

OS:CPU

系统和用户进程使用CPU的时间

OS:Load

系统work数量

OS:Disk usage (GB)

Cassandra使用磁盘空间

OS:Disk Usage (percentage)

Cassandra使用磁盘空间的百分比

 

OS:Disk Throughput

读写操作的百分比,通过测量每秒的MB

OS:Disk Rates

磁盘对于读写操作的平均速度

OS:Disk Latency

磁盘查找消耗的平均时间,单位毫秒

OS:Disk Request Size

请求的平均大小

OS:Disk Queue Size

请求队列的平均数量,对于磁盘延迟问题

OS:Disk Utilization

磁盘I/O消耗CPU时间的百分比

 

原文地址:https://www.cnblogs.com/qiumingcheng/p/5047463.html