O que é monitoramento de rede

É a coleta contínua de métricas (CPU, memória, link, sessão BGP, latência), logs (Syslog, NetFlow) e estado (UP/DOWN, threshold) de todos os equipamentos da infraestrutura, com alerta automático quando algo sai do padrão.

Sem monitoramento estruturado, o provedor vira refém de NOC reativo — perde cliente porque não viu o problema antes. SNMP solto resolve no provedor pequeno; pra crescer, precisa de Zabbix com templates específicos, dashboards Grafana e alerta indo pro canal que a equipe usa de verdade (Telegram, Discord).

O que a RASYS faz com monitoramento

  • Zabbix com templates próprios — não os genéricos que vêm de fábrica. Templates pra Huawei NE, Juniper MX, MikroTik, OLT GPON específica do seu fornecedor, com itens que importam (sessão BGP, neighbors OSPF, optical power ONU).
  • LibreNMS pra inventário e métrica duplicada — auto-discovery SNMP, topologia automática, mapa de tráfego. Mantemos uma instância centralizada na Rasys coletando em paralelo, então se a infra do provedor cair a gente ainda enxerga histórico e ajuda a diagnosticar a queda.
  • Dashboards Grafana — visualização operacional (NOC) e executiva (gerência). Datasource Zabbix, InfluxDB, Prometheus.
  • NetFlow / sFlow — análise de tráfego por aplicação, top talkers, deteção de DDoS por flow rate spike. nfdump, ELK, ntopng.
  • Alerting estruturado — Telegram/Slack/email com severidade, deduplicação, escalation se ninguém atender. Sem flood de alerta inútil.
  • Syslog centralizado — rsyslog/syslog-ng pra retenção e search rápido. Forense de incidente fica em minutos, não horas.

Equipamentos com que trabalhamos

Zabbix 6/7, LibreNMS, Grafana, InfluxDB, Prometheus, Elastic/Kibana, ntopng, nfdump, rsyslog, syslog-ng.

Quando faz sentido falar com a gente

Você usa só SNMP simples e perde evento crítico; tem Zabbix mas só com templates genéricos; cliente reclamou de queda antes de você ver; precisa de baseline pra justificar upgrade de enlace.

Fale com a gente. Veja também: Firewall, BGP, Principais Fornecedores.

PERGUNTAS FREQUENTES

Zabbix ou LibreNMS — qual escolher pra provedor?

LibreNMS é mais rápido pra colocar de pé (autodiscovery via SNMP), bom pra inventário de equipamento de rede. Zabbix é mais flexível pra alertas customizados, lógica complexa, integração com sistemas internos. Muitos provedores rodam ambos — LibreNMS pra inventário/grafos, Zabbix pra alerta crítico.

Quanto custa monitorar 1.000 dispositivos com Zabbix?

Zabbix é gratuito (open source). Custo é infra: 1 VM com 4 vCPU / 8GB RAM / 100GB SSD segura 1.000 dispositivos com polling 5min sem problema. Banco MySQL/Postgres separado pra fácil scaling. Operação contínua (templates, alertas, ajustes) é o custo real — e o que mais entrega valor.

NetFlow vale a pena com bordas MikroTik?

Vale. MikroTik gera NetFlow v9 nativo. Coletor (nfsen, nfdump, Akvorado) roda em VM pequena. NetFlow mostra quem está consumindo banda, identifica DDoS antes do impacto, ajuda a decidir peering. Custo de implementar é baixo, valor operacional é alto.

Quais alertas devem acordar plantonista de madrugada?

Apenas o que indica impacto a clientes: B-RAS down, OLT down, link de trânsito caído sem backup, perda de sessão BGP do único upstream, RADIUS down, autoridade DNS própria fora. Alerta de CPU alta, disco enchendo, link com erro CRC — ficam pra horário comercial. Alerta noturno que não exige ação imediata destrói o plantão.