Esta pessoa será responsável pela gestão da plataforma Checkmk, integrando-a com outros sistemas e ferramentas, bem como pela definição de métricas, alertas e dashboards críticos para o negócio.
Atuará de forma transversal entre equipas técnicas e de negócio, com uma abordagem proativa e foco na melhoria contínua.
Responsabilidades
· Liderar a estratégia de observabilidade, definindo padrões e boas práticas;
· Gerir e operar a plataforma de monitoramento baseada em Checkmk (instalação, configuração, tuning e upgrades);
· Integrar o Checkmk com ferramentas de ITSM, notificação e automação por scripts personalizados e middlewares;
· Desenhar dashboards e alertas com Checkmk, Grafana e outras soluções;
· Definir e implementar testes de monitoramento sintético (ex: user journeys, APIs e serviços críticos), preferencialmente com Robot Framework;
· Identificar e implementar processos de automação e remediação para aumentar a eficiência das equipas técnicas;
· Promover a documentação e disseminação de conhecimento técnico entre as equipas.
Requisitos Técnicos:
· Sólida experiência prática com Checkmk (instalação, agentes, custom checks, upgrades);
· Bons conhecimentos de sistemas operacionais Linux e Windows, redes, protocolos e SNMP; ·
Experiência com scripting e automação ;
· Conhecimentos em AWS, Kubernetes são valorizados.
· Domínio de ferramentas e conceitos de logs, métricas e tracing (ex: Prometheus, Grafana, ELK, Graylog ) é valorizado
· Valorizado conhecimentos das ferramentas de Power Platform. Competências Adicionais (Diferenciais):
· Mais de 5 anos de experiência com observabilidade e monitoramento;
· Histórico comprovado com Checkmk;
· Certificações relacionadas a Observabilidade , Monitoração ou DevOps