Visão geral
Este projeto teve como objetivo automatizar o processo de coleta, análise e registro de falhas provenientes de testes de estabilidade, reduzindo a dependência de atividades manuais e aumentando a eficiência operacional.
O problema
Durante a execução de testes de estabilidade em larga escala, falhas eram constantemente geradas e exibidas em dashboards. O processo de registro dessas falhas era totalmente manual e envolvia múltiplas etapas:
- Análise contínua dos dashboards para identificar falhas.
- Verificação manual da existência de registros prévios em sistemas de gerenciamento de issues.
- Criação de novos registros ou atualização de registros existentes.
- Inclusão de informações detalhadas como número de ocorrências, dispositivos afetados e logs.
Esse processo apresentava diversos desafios:
⚠️ Alto consumo de tempo operacional.
⚠️ Propensão a erros humanos.
⚠️ Atividades repetitivas e pouco escaláveis.
⚠️ Baixa eficiência na resposta a falhas.
⚠️ Desvio de foco da equipe de atividades mais estratégicas.
A solução
Foi desenvolvida uma solução automatizada utilizando Python, com integração entre diferentes sistemas via APIs, cobrindo todo o fluxo de registro de falhas:
-
Coleta automatizada de dados
- Consumo de dados de dashboards por meio de APIs internas.
- Extração de informações relevantes sobre falhas (execuções, dispositivos, logs, etc.).
-
Processamento e análise de falhas
- Estruturação dos dados em DataFrames.
- Aplicação de filtros e agrupamentos para identificar eventos relevantes.
-
Integração com sistema de gerenciamento de issues (via API)
- Verificação automática da existência de registros relacionados.
- Atualização de registros existentes com novas ocorrências.
- Clonagem de registros similares de outros projetos quando necessário.
-
Automação do fluxo de decisão
- Definição automática de ações: criar, atualizar ou sinalizar necessidade de ação manual.
- Inclusão de comentários com informações detalhadas e links úteis.
-
Integração com planilhas e metadados
- Uso de dados auxiliares para enriquecimento das informações registradas.
- Padronização das informações inseridas no sistema.
-
Logging e rastreabilidade
- Geração de logs durante execução para acompanhamento e debug.
Resultados
✅ Redução de aproximadamente 20 horas semanais de trabalho manual
✅ Aumento significativo da eficiência operacional no registro de falhas
✅ Maior rapidez na identificação e resposta a problemas
✅ Melhoria na qualidade, consistência e padronização dos dados registrados
✅ Redução de erros humanos no processo de análise e registro
✅ Liberação do time para atuar em atividades mais analíticas e estratégicas