北京金石创娱网络科技有限公司,是一家专注于智能移动设备应用以及管理的研发型企业。公司成立于 2014 年,是一家年轻的富有活力的企业,公司由众多富有激情的高科技人才组成。公司致立于智能移动设备的一揽子解决方案,包含手机端,服务器端以及大数据运营相关。
金石创娱,以其在移动互联网独特的视角以及敏锐的嗅觉,走在软件开发的前研,公司致立于智能移动设备的一揽子解决方案,包含手机端,服务器端以及大数据运营相关。目前公司的常期合作伙伴达到十几个,其中包含中国智能手机领军企业,移动互联网软件核心企业以及大型国企等。
此次,Cloud Insight 在北京金石创娱网络科技有限公司的项目中,主要对接人是杨树海先生,公司 CTO,八年软件开发经历,原优亿市场系统架构师、eoe 开发者社区项目负责人,有丰富的移动产品设计和开发经验。
金石创娱利用云主机和本地主机来进行游戏分发,由于游戏面向国内外不同的分发渠道,所以其主机分布在 AWS、青云、阿里云等不同云服务提供商上。所以对主机进行统一的管理和监控,比较困难。
所有的下载请求都通过 NGINX 来承接,并通过 PHP 分发到不同数据库。金石创娱使用了 MySQL、MongoDB 和 Redis,以及大数据层面的 ElasticSearch。使用的数据库和中间件类型繁多。
原有的金石创娱监控方案,是利用青云等云服务提供商提供的控制台,来查看云主机的性能。在数据库和中间件监控上,金石创娱利用 NGINX 状态页进行监控,以及 ElasticSearch 默认的监控模块进行监控。
剩余的数据库和中间件,金石创娱利用 Zabbix 和 Grafana 来自建系统监控系统。
但是监控工具繁多,没有一个统一的系统监控平台,能够达到监控的统一性和高效性。每天需要花上一半的工作时间,对各个主机、数据库、中间件进行人工的巡检。产生问题也不能及时作出反应。而 Zabbix 和 Grafana 的集成和维护成本高,脚本的书写难度大,因此 Redis 等服务还没有进行监控。
Cloud Insight 是一体化解决方案的前提是,Cloud Insight 支持 Ubuntu、CentOS、Redhat 等多种操作系统,以及 Amazon Linux。并兼容 Apache Tomcat、NGINX、Redis、MongoDB 多达 20 多种数据库和中间件。
依赖于 Cloud Insight 一体化的解决方案,用户不再需要不断地升级 Zabbix 或者使用 Zabbix 脚本来支持新的数据库和中间件的监控。而将更多的时间成本,放在发现问题和解决问题上。
而 Cloud Insight Agent 的安装只需一条指令,打开 NGINX 监控只需让状态页处于开启状态,并打开 Cloud Insight NGINX 配置文件即可。彻彻底底解放了运维工程师,不需要学习脚本语法,也可以轻松上手。
安装成功后,可以在平台列表页中,总览所有主机的运行情况,以及运行在上面的数据库、中间件。对平台的运行情况、数据库和中间件指标进行集中展现,能够很大程度地节约用户发现问题的时间。
而 Cloud Insight 默认创建的 NGINX 指标集 • 仪表盘,能够快速了解 NGINX 的运行情况。除此之外,Cloud Insight 提供自定义仪表盘,让用户按照自己的监控需求,添加不同的性能指标来进行监控。依赖于自定义仪表盘,用户能够查看 15 天内的历史数据,做到问题可追溯。并且可以聚合其他平台服务的指标,进行统一展现。
Cloud Insight 能够实现类似 Elastic Search 的集群管理,通过平台拓扑来快速对主机进行分组。在机器较多的情况下,能够快速定位有问题的机器,并且查看其性能指标。
Cloud Insight 在金石创娱的实施过程中,杨树海提到:
“Cloud Insight 很简单,数据直观,UI 也很好看。先前需要花费大量时间来集成不同服务的监控到 Zabbix 的问题,Cloud Insight 也得到了解决:Cloud Insight 安装简单,就拿 PHP-FPM 来说,部署好监控点击进仪表盘,各指标都可以看。相比较以前需要写不同的脚本抓取信息才能看到,Cloud Insight 确实简单很多。而且图表看着确实也不错,30 分钟内数据的比较也一目了然。”
除此之外,金石创娱也使用到了 Application Insight。针对游戏分发,这种对吞吐量高度敏感的场景,杨树海对 Application Insight 吞吐量报表,大为赞赏。