十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
这篇文章将为大家详细讲解有关k8s node alertmanager监控报警配置方法是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
创新互联建站长期为数千家客户提供的网站建设服务,团队从业经验10年,关注不同地域、不同群体,并针对不同对象提供差异化的产品和服务;打造开放共赢平台,与合作伙伴共同营造健康的互联网生态环境。为巴中企业提供专业的成都网站设计、网站制作、外贸营销网站建设,巴中网站改版等技术服务。拥有10年丰富建站经验和众多成功案例,为您定制开发。概述节点本身的监控主要监控CPU、内存、磁盘IO、文件系统可用空间即可。
比如,对于使用来prometheus的alertmanager来做node报警,rules配置可以参考如下点进行配置即可。
不同的node-exporter版本,对应的metrics也不一样,需要自己对照更改一下。
CPU监控(1 - avg(irate(node_cpu{mode="idle"}[10m])) by (instance)) * 100 < 90
内存监控((node_memory_MemTotal - node_memory_MemFree) / node_memory_MemTotal) * 100 < 90
磁盘IO监控(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10
文件系统可用空间监控max(((node_filesystem_size{fstype=~"ext4|vfat"} - node_filesystem_free{fstype=~"ext4|vfat"}) / node_filesystem_size{fstype=~"ext4|vfat"}) * 100) by (instance) > 90
关于k8s node alertmanager监控报警配置方法是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。