云原生环境中的监控与传统应用程序的监控类似,均包含跟踪指标、日志和事件,而二者的主要区别在于云原生环境中的某些托管对象具有临时性和非持久性。监控可以让运维人员洞察系统当前运行的状况、监测问题并进行及时修复。此外,监控还能跟踪应用程序运行状况、用户行为等。因此,监控是有效运行应用程序的重要组成部分。
Prometheus 是由 SoundCloud 开源的监控告警解决方案,由golang编写,是 CNCF 中 Docker 和 Kubernetes 御用的监控工具。
优势:查询方式灵活且效率高、支持大规模集群监控模式、扩展性强、便于维护。
劣势:需要脚本开发能力,学习成本较高。
Grafana是一个系统监控看板,支持许多不同的数据源。作为跨平台开源的度量分析与可视化套件,Grafana是一个仅由 Javascript 开发的前端工具,通过访问库(如InfluxDB)展示自定义报表、显示图表等。
优点:界面简介友好、插件丰富、拥有强大的功能且支持自由定制。
缺点:需要用户具备一定数据开发能力,故存在学习成本。
Thanos定义:是一组组件,可以组成具有长期存储功能的高可用性Prometheus设置。 其主要目标是简化操作,保留Prometheus的可靠性。
优势:高可用性、高空间利用率、跨集群查询、横向拓展、查询去重、统一查询入口。
适用于云原生场景大型分布式监控。
直播 主题 : 云原生时代热门监控利器的解析应用
直播 时间 : 3月31日(周四)19:00-20:00
讲师简介: 云智慧运维开发工程师-李晨阳
直播亮点:
听众收益:
扫描下方二维码,添加小助手微信,备注「331」获取直播链接
AIOps Developer Meetup是由云智慧AIOps社区推出的,面向广大开发者的系列线上直播及线下分享活动,我们将汇聚AIOps社区专家团的力量给你提供优质的技术内容,无论是技术解读、开源治理、行业解决方案,相信广大developers总能在这里找到你想要的内容。
AIOps社区由云智慧发起,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交流社区。该社区致力于传播AIOps技术,旨在与各行业客户、用户、研究者和开发者们共同解决智能运维行业技术难题、推动AIOps技术在企业中落地、建设健康共赢的AIOps开发者生态。
上期Meetup由云智慧算法总监—严川分享了《AIOps指标相关算法体系分享》 主要内容回顾:
视频回放&ppt资料:添加文中小助手,备注“干货”获取。
|