Cloud Insight 是一个数据管理平台,支持 Cassandra 的监控。提供数据聚合、过滤、分组的功能,让用户能够在集群环境中,了解 Cassandra 运行整体情况,迅速做出判断。
Cloud Insight Cassandra 监控,默认监控以下性能指标:
想要可视化 Cassandra 的性能,往往需要自建运维系统:利用 Zabbix 等开源工具搭建运维监控平台。这往往意味着大量的工作,以及繁琐的调试过程。
而报警、指标的运算、不同主机间数据的聚合,以及自定义指标的可视化,都需要对接新的开源工具。从而,更多的时间成本和人力成本,会投入进来。
Cloud Insight 探针的安装只需一条指令,且提供 Puppet 对探针进行批量处理。监控 Cassandra 也只需开启 Cassandra 配置文件。过程十分简单。
而且,Cloud Insight 数据的自动抓取和上传,以及丰富的可视化效果,再加上多渠道的报警。让您免于自建运维监控系统的困扰。
Cloud Insight 数据管理功能,能够针对集群中,不同主机的 Cassandra 性能指标,进行聚合、过滤、分组。
通过简单的指标查询,能够快速了解分属于不同功能模块、地域、网段的 Cassandra 的性能的最大值、平均值、最小值。让运维工作更简单、更敏捷。
OneAPM Cloud Insight Agent 通过 JMX 获取 Cassandra 中的性能指标。
由于每个实体最多可以监控 350 个性能指标,所以您需要按照下方的配置方法,修改配置文件来确定自己需要哪些指标。
编辑配置文件 conf.d/cassandra.yaml,使 Cloud Insight Agent 可以与 Cassandra 通信。
instances:
- host: localhost
port: 7199
user: username
password: password
name: cassandra_instance
#trust_store_path: /path/to/trustStore.jks # Optional, should be set if ssl is enabled
#trust_store_password: password
#java_bin_path: /path/to/java #Optional, should be set if the agent cannot find your java executable
# List of metrics to be collected by the integration
init_config:
conf:
- include:
domain: org.apache.cassandra.db
attribute:
- BloomFilterDiskSpaceUsed
- BloomFilterFalsePositives
- BloomFilterFalseRatio
- Capacity
- CompressionRatio
- CompletedTasks
- ExceptionCount
- Hits
- RecentHitRate
- RowCacheRecentHitRate
- KeyCacheRecentHitRate
- LiveDiskSpaceUsed
- LiveSSTableCount
- Load
- MaxRowSize
- MeanRowSize
- MemtableColumnsCount
- MemtableDataSize
- MemtableSwitchCount
- MinRowSize
- ReadCount
- Requests
- Size
- TotalDiskSpaceUsed
- TotalReadLatencyMicros
- TotalWriteLatencyMicros
- UpdateInterval
- WriteCount
- PendingTasks
- exclude:
keyspace: system
attribute:
- MinimumCompactionThreshold
- MaximumCompactionThreshold
- RowCacheKeysToSave
- KeyCacheSavePeriodInSeconds
- RowCacheSavePeriodInSeconds
- PendingTasks
- Scores
- RpcTimeout
- include:
domain: org.apache.cassandra.internal
attribute:
- ActiveCount
- CompletedTasks
- CurrentlyBlockedTasks
- TotalBlockedTasks
- include:
domain: org.apache.cassandra.net
attribute:
- TotalTimeouts
重启 OneAPM Cloud Insight Agent,使配置生效。