Dependendo do número de hosts em seu zabbix, se caso muito alto, isso pode exigir uma melhor estratégia na definição no tempo de coleta dos itens e descobertas. Alguns exemplos de incidentes comuns abaixo, que podem surgir devido seu zabbix sobrecarregar por demanda.
Zabbix server: Utilization of lld worker processes over 75%
Zabbix server: Utilization of housekeeper processes over 75%
Zabbix server: Utilization of poller processes over 75%


Para resolver, verifique os templates com maior numero de hosts cadastrados, e ajuste o tempo de coleta de itens aumentando-os, isso pode começar pelos menos essenciais, exemplo
Modelo de equipamento
Versão firmware
Nome interface
Não há necessidade de coletar o modelo, versão, nome a cada 5min, nesse exemplo, poderia ser ajustado para 1d talvez. Dependendo de algumas coletas mais essenciais, pode ser aumentando um pouco mais o tempo, de 1m para 3m ou 5m.
A lógica é pura matemática. Imagine que você monitora 10.000 interfaces.
- A cada
1 minuto: Seu Zabbix precisa realizar 10.000 requisições por minuto apenas para esses itens. - A cada
5 minutos: Seu Zabbix precisa realizar apenas 2.000 requisições por minuto para os mesmos itens.
Note abaixo a diferença da fila de consultas, o antes e depois, isso pode ser consultado pelo menu Administração > Fila


Conclusão
Ter um monitoramento eficaz não significa coletar o maior volume de dados no menor tempo possível. Significa coletar o dado certo, no tempo necessário para a tomada de decisão.
Antes de aumentar os StartPollers ou alterar outros recursos como CPU para o seu Zabbix, revise seus templates. O segredo de um Zabbix escalável está na qualidade e na cadência das requisições. Às vezes, o “menos é mais” é a melhor configuração que você pode aplicar.