记一次Zabbix异常处理
记一次因缓存过低导致zabbix异常退出的问题。
记一次因缓存过低导致zabbix异常退出的问题。
从0部署一台能够收集Windows硬件信息的Zabbix服务器
作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/211025912047/
相关话题:https://www.cnsre.cn/tags/zabbix/
操作系统:centos 7.4
zabbix版本:zabbix server 3.4.7
客户端:zabbix-agent 3.4.7
监控进程:mysqld
监控端口:3306 tcp
确认客户端已经安装且运行agent

查看进程
查看属于那个用户的 几个进程
mysql 的进程为root用户 两个进程

添加监控项

名称随便写
类型zabbix客户端
键值选则进程数返回数
应用集选则prosesses 进程

proc.num[<name>,<user>,<state>,<cmdline>]
以下是对mysql进程的监控配置,key中的参数说明,
<name>第一个参数是进程名字,没必要填写,填了反而会使监控不太准确(仅个人测试)
<user>第二个参数是运行进程的用户名
<state>第三个为进程的状态 ,一般选则all 包括:all (default), run, sleep, zomb
<cmdline>第四个参数用来指定进程名中包含的字符,对进程进行过滤。
确认更新

创建触发器


选择刚才创建的监控项

插入


修改{hgh3a01:proc.num[,root,all,mysqld].last()}=0
为
{hgh3a01:proc.num[,root,all,mysqld].max(#2)}=2
hgh3a01:主机名称
proc.num[,root,all,mysqld]:监控项
max(#2)}=2 :表示最后两次的接收到的值都是2个进程(ps -ef 看到 mysqld 的进程为两个所以=2 ),说明mysqld进程在运行,则出发报警。
因为我们要测试是否能出发告警,所以要选则 =2 正常的<1 就是没有运行。
稍等几分钟观察看看能不能触发触发器

收到邮箱警告

吧测试的进程改为正常的(因为mysql 运行的进程为两个我这变设置的触发器为进程小于两个进程就发出告警)

保存更新观察是否回复正常


添加监控项

修改端口 保存更新

同监控进程一样(先测试)

收到触发警告

吧之前的值调整为0

测试回复正常

作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/211025912047/
相关话题:https://www.cnsre.cn/tags/zabbix/

作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/211021950307/
相关话题:https://www.cnsre.cn/tags/zabbix/
Zabbix 版本:3.4
操作系统版本:centos7.4
监控分区 / 、/boot 、/home


名称随意填写,键值的话因为我们监控车的是磁盘剩余的百分比所有选则次键值,应用集则选则filsystems


选则添加我们的监控项已经创建。


接下来我们来创建监控项。
监控项名称随意填写。
然后吧严重性选则为一般告警(因为我们短信邮箱告警等级是一般告警以上的告警等级推送)
选则我们刚才创建的监控项

写出监控的分区我们这以home分区为例。

完成以后添加即可。
作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/211021950307/
相关话题:https://www.cnsre.cn/tags/zabbix/

作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/210824854115/
相关话题:https://www.cnsre.cn/tags/zabbix/
新版本附带了可用性,安全性和完整性方面的重大改进列表。Zabbix团队遵循的主要策略是使Zabbix尽可能可用。Zabbix是一种开源,免费的监视解决方案,现在可以在内部和云中部署。在RedHat / IBM,SuSE,Ubuntu的最新版本的平台,容器和Linux发行版中可用。现在,一键式Zabbix部署也可以在Azure,AWS,Google Cloud,IBM / RedHat Cloud,Oracle和Digital Ocean上使用。现在,在Red Hat和Azure市场上提供Zabbix技术支持服务。
此外,Zabbix监视工具还提供了与Messenger,票务和警报系统的大量现成集成。新版本扩展了可以轻松监控的受支持服务和应用程序的列表。
| 环境 | 平台 | CPU/内存 | 数据库 | 硬盘 | 监控主机数 |
|---|---|---|---|---|---|
| 小型 | centOS | 2CPU/1GB | MySQL、InnoDB | 普通 | 100 |
| 中型 | centOS | 2CPU/2GB | MySQL、InnoDB | 普通 | 500 |
| 大型 | Red HatEnterpirse Linux | 4CPU/8GB | MySQL、InnoDB 或PostgreSQL | RAID 10 或 SSD | 大于1000 |
| 超大型 | Red HatEnterpirse Linux | 8CPU/16GB | MySQL、InnoDB 或PostgreSQL | RAID 10 或 SSD | 大于10000 |
Zabbix 前端需要使用下列软件:
| 软件 | 版本 | 备注 |
|---|---|---|
| Apache | 1.3.12 或以上 | |
| PHP | 5.4.0 或以上 |
PHP 扩展库:
| 软件 | 版本 | 备注 |
|---|---|---|
| gd | 2.0 or later | PHP GD 扩展库必须支持 PNG 图像(–with-png-dir)、JPEG 图像 (–with-jpeg-dir) 和 FreeType 2 (–with-freetype-dir). |
| bcmath | php-bcmath (–enable-bcmath) | |
| ctype | php-ctype (–enable-ctype) | |
| libXML | 2.6.15 或以上 | php-xml or php5-dom,如果发布者提供独立的部署包。 |
| xmlreader | php-xmlreader,如果发布者提供独立的部署包。 | |
| xmlwriter | php-xmlwriter,如果发布者提供独立的部署包。 | |
| session | php-session,如果发布者提供独立的部署包。 | |
| sockets | php-net-socket (–enable-sockets) 。用户脚本支持所需要的组件。 | |
| mbstring | php-mbstring (–enable-mbstring) | |
| gettext | php-gettext (–with-gettext)。用于多语言翻译支持。 | |
| ldap | php-ldap。只有在前端使用 LDAP 认证时才需要。 | |
| ibm_db2 | 使用 IBM DB2 作为 Zabbix 后端数据库所需要的组件。 | |
| mysqli | 使用 MySQL 作为 Zabbix 后端数据库所需要的组件。 | |
| oci8 | 使用 Oracle 作为 Zabbix 后端数据库所需要的组件。 | |
| pgsql | 使用 PostgreSQL 作为 Zabbix 后端数据库所需要的组件。 |
|
|
|
|
|
|
|
|
|
|
|
|
安装zabbix报错,提示Requires: libiksemel.so.3()(64bit),该文件为内核链接文件,无法绕过只有解决了这个依赖才可能继续安装,解决的方法为缺什么补什么,它要这个就给它。
|
|
|
|
|
|
安装zabbix报错,提示Requires: libiksemel.so.3()(64bit),该文件为内核链接文件,无法绕过只有解决了这个依赖才可能继续安装,解决的方法为缺什么补什么,它要这个就给它。
|
|
|
|
|
|
|
|
编辑配置文件 /etc/yum.repos.d/zabbix.repo 并启用Zabbix 前端存储库
|
|
|
|
|
|
|
|
|
|
|
|
如何解决ERROR 1819 (HY000): Your password does not satisfy the current policy requirements呢?
|
|
在数据库主机上运行以下代码
|
|
导入初始架构和数据
方法1
|
|
方法2
|
|
|
|
|
|
编辑文件 /etc/opt/rh/rh-nginx116/nginx/conf.d/zabbix.conf,取消注释和设置 listen 和 server_name 指令。
# listen 80;
# server_name example.com;
编辑文件 /etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf ,将 nginx 添加到 listen.acl_users 指令。
listen.acl_users = apache,nginx
然后取消注释并为设置正确的时区。
php_value[date.timezone] = Asia/Shanghai
|
|
检查端口
|
|
连接到新安装的Zabbix前端: http://server_ip
zabbix 页面,将 /etc/opt/rh/rh-nginx116/nginx/nginx.conf 配置文件中的 server 模块注释掉重启即可





Zabbix 5.0 LTS 的安装,快去体验吧。
作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/210824854115/
相关话题:https://www.cnsre.cn/tags/zabbix/

作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/210518420293/
相关话题:https://www.cnsre.cn/tags/zabbix/
自从接触zabbix后,就一直想着怎么才能把告警推送到个人微信上。有这样的想法主要是个人微信的使用频率远远要比钉钉,企业微信,邮箱,飞书等使用频率要高。比如我,就遇到过在周末的时候,因为没有及时登录钉钉查看zabbix告警通知,导致一些告警没来得及处理,对环境产生了影响。
前段时间朋友给推荐了pushplus,一开始主要在jenkins做构建通知用的,后来就想,能不能使用zabbix的告警通知推送到微信上呢?
先介绍下pushplus吧,pushplus 官方介绍
pushplus(推送加)集成了微信、企业微信、钉钉、短信、邮件等实时信息推送平台
你只需要调用简单的API,即可帮助你迅速完成消息的推送,使用简单方便
我们的所做的一切只是为了让推送变的更简单
注册成功后。点击一对多,然后新建一个群组。群组编码作为群组的唯一标示,后续需要使用。群组名称随意填写。
创建成功之后点击群组上的查看二维码,将二维码发给需要加入群组的同事。以后推送的消息加入群组的用户都会收的到。在“订阅人”中可以主动的移除不想要的用户。

然后保存你的token和群组编码。
查看pushplus调用方式.
附上脚本
脚本很简单,shell直接调用接口即可
|
|
你的token创建的群组 中的 群组编码http://www.pushplus.plus/send将脚本部署在alertscripts目录下,如果你不知道在那,你可以回想一下你钉钉告警,或者是企业微信告警的脚本放在那。如果实在记不起来,那就find找下alertscripts目录吧
登录zabbix web端点击管理–报警媒介类型–创建媒体类型

名称:随意写
类型:选择脚本
脚本名称:按照实际名称填写
脚本参数:
{ALERT.SENDTO}
{ALERT.SUBJECT}
{ALERT.MESSAGE}

点击配置–动作–创建动作

动作
名称:随意写
条件:根据自己的告警需求填写

操作
默认操作步骤持续时间:1h
默认标题:你也可以随意写。也可以用下面的。
|
|
消息内容:和标题一样
|
|

操作步骤–点击新的

选择发送到用户,点击添加–admin–选择
仅送到,选择你刚创建的,最后点击添加

最为为这样

恢复操作
恢复操作和操作一样

添加完后

选择管理–用户–admin



添加完过后,接下来就测试吧。
我这边选择了一个触发器调了下告警的值,最后展示下告警以及恢复。




作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/210518420293/
相关话题:https://www.cnsre.cn/tags/zabbix/

作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/210513036112/
相关话题:https://www.cnsre.cn/tags/zabbix/
ubuntu 16 升级18 之后 安装了zabbix agent 今天突然agent掉了 上去的时候发现
报错:
Got singnal [singnal:15(SIGTERM),sender_pid:31392,sender_uid:0,reason:0]. Exiting ...a

后来打算-c 启动然后发现 /usr/sbin/zabbix_agentd 丢了

我尝试着去检查selinux,防火墙,安全组,以及zabbix-agent配置文件等等都没有发现异常的地方,在同一批部署的agent中其他的agent 也暂时没有出现这种情况。
问了很多朋友,因为没有找到原因,日志中给到的信息也不是很多,最后选择了重装zabbix_agent.
最后一次重装,我做选择了手动修改zabbix的配置文件,验证问题,还有待观察。如果各位大佬有知道原因,能够留言或者私信的话我想我会十分感谢。
下面放一个zabbix官方wiki 网名为SwitchZabbix的网友遇到同样问题的分享。
https://www.zabbix.com/forum/zabbix-troubleshooting-and-problems/369895-zabbix-is-not-running-on-frontend
作者:SRE运维博客
博客地址:https://www.cnsre.cn
文章地址:https://www.cnsre.cn/posts/210513036112/
相关话题:https://www.cnsre.cn/tags/zabbix/
