5 min leitura • Guide 523 of 877
Como Usar Kanban para Operações de TI
Times de operações de TI enfrentam interrupções constantes de incidentes, solicitações de usuários e tarefas de manutenção. Os boards Kanban do GitScrum com limites WIP, swimlanes para tipos de trabalho e rastreamento de SLA ajudam times de ops a gerenciar fluxo, manter níveis de serviço e evitar o caos de filas de trabalho não gerenciadas.
Tipos de Trabalho de Operações TI
| Tipo de Trabalho | Prioridade | Tratamento de Fluxo |
|---|---|---|
| Incidentes P1 | Imediato | Lane expedite |
| Incidentes P2 | Mesmo dia | Alta prioridade |
| Solicitações de serviço | Normal | Fluxo padrão |
| Manutenção | Planejado | Agendado |
| Melhorias | Baixa | Quando há capacidade |
Board Kanban de Operações TI
ESTRUTURA DE BOARD DE OPERAÇÕES TI
┌─────────────────────────────────────────────────────────────────────┐
│ EXPEDITE (Incidentes P1) - Sem Limite WIP │
│ ┌─────────────────────────────────────────────────────────────┐ │
│ │ [INC-234] Banco de dados de produção não responde │ │
│ └─────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────────┘
┌─────────┬──────────┬──────────┬──────────┬──────────┬─────────────┐
│ Backlog │ Pronto │ Trabalho │ Review │ Deploy │ Done │
│ (s/ WIP)│ (WIP: 3) │ (WIP: 4) │ (WIP: 2) │ (WIP: 2) │ (s/ WIP) │
├─────────┼──────────┼──────────┼──────────┼──────────┼─────────────┤
│ [REQ] │ [INC] │ [INC] │ [CHG] │ [CHG] │ [INC] ✓ │
│ [REQ] │ [REQ] │ [CHG] │ │ │ [REQ] ✓ │
│ [CHG] │ │ [REQ] │ │ │ [CHG] ✓ │
│ [CHG] │ │ │ │ │ │
│ [IMP] │ │ │ │ │ │
└─────────┴──────────┴──────────┴──────────┴──────────┴─────────────┘
SWIMLANES POR TIPO DE TRABALHO:
┌─────────────────────────────────────────────────────────────────────┐
│ 🔴 Incidentes (P2-P3) │
├─────────────────────────────────────────────────────────────────────┤
│ 📋 Solicitações de Serviço │
├─────────────────────────────────────────────────────────────────────┤
│ 🔧 Mudanças & Manutenção │
├─────────────────────────────────────────────────────────────────────┤
│ 📈 Melhorias │
└─────────────────────────────────────────────────────────────────────┘
Tipos de Work Item
DEFINIÇÕES DE WORK ITEMS
INCIDENTE (INC):
┌─────────────────────────────────────────────────┐
│ Interrupção não planejada de serviço │
│ Objetivo: Restaurar serviço ASAP │
│ │
│ Campos: │
│ ├── Prioridade (P1-P4) │
│ ├── Serviço afetado │
│ ├── Impacto (usuários afetados) │
│ ├── Hora início │
│ └── Hora resolução │
│ │
│ SLAs: │
│ P1: Resposta <15 min, Resolver <4 horas │
│ P2: Resposta <1 hora, Resolver <8 horas │
│ P3: Resposta <4 horas, Resolver <24 horas │
│ P4: Resposta <1 dia, Resolver <1 semana │
└─────────────────────────────────────────────────┘
SOLICITAÇÃO DE SERVIÇO (REQ):
┌─────────────────────────────────────────────────┐
│ Solicitação padrão de usuário │
│ Objetivo: Atender conforme SLA │
│ │
│ Campos: │
│ ├── Tipo de solicitação │
│ ├── Solicitante │
│ ├── Data prazo │
│ └── Status de aprovação │
│ │
│ Exemplos: Pedido de acesso, nova conta, │
│ instalação de software, pedido de hardware │
└─────────────────────────────────────────────────┘
MUDANÇA (CHG):
┌─────────────────────────────────────────────────┐
│ Modificação planejada de infraestrutura │
│ Objetivo: Implementar com segurança │
│ │
│ Campos: │
│ ├── Tipo de mudança (padrão/normal/emergência) │
│ ├── Nível de risco │
│ ├── Plano de rollback │
│ ├── Janela de mudança │
│ └── Aprovação CAB │
└─────────────────────────────────────────────────┘
MELHORIA (IMP):
┌─────────────────────────────────────────────────┐
│ Aprimoramento proativo │
│ Objetivo: Melhorar operações │
│ │
│ Exemplos: Automação, monitoramento, │
│ documentação, melhoria de processo │
└─────────────────────────────────────────────────┘
Planejamento de Capacidade
ALOCAÇÃO DE CAPACIDADE DE OPS
DISTRIBUIÇÃO TÍPICA:
┌─────────────────────────────────────────────────────────────┐
│ │
│ INCIDENTES: 30% │████████░░░░░░░░░░░░░░░░░░│ │
│ SOLICITAÇÕES: 35% │██████████░░░░░░░░░░░░░░░░│ │
│ MUDANÇAS: 25% │███████░░░░░░░░░░░░░░░░░░░│ │
│ MELHORIAS: 10% │███░░░░░░░░░░░░░░░░░░░░░░░│ │
│ │
│ RESERVA PARA EMERGÊNCIAS: │
│ • Sempre reserve 20-30% para incidentes inesperados │
│ • Nunca preencha 100% da capacidade planejada │
│ • Ajuste baseado em histórico de incidentes │
└─────────────────────────────────────────────────────────────┘
MONITORANDO ALOCAÇÃO:
┌─────────────────────────────────────────────────────────────┐
│ Esta semana: │
│ • Incidentes: 45% (acima do planejado ⚠️) │
│ • Solicitações: 30% │
│ • Mudanças: 20% │
│ • Melhorias: 5% (sacrificado por incidentes) │
│ │
│ Ação: Investigar aumento de incidentes │
└─────────────────────────────────────────────────────────────┘
Métricas de SLA
DASHBOARD DE SLA
MÉTRICAS DE INCIDENTES:
┌─────────────────────────────────────────────────────────────┐
│ P1: 100% dentro do SLA (0 violações) │
│ P2: 95% dentro do SLA (1 violação) │
│ P3: 92% dentro do SLA (3 violações) │
│ P4: 88% dentro do SLA (5 violações) │
│ │
│ MTTR (Mean Time to Resolve): │
│ P1: 2.3 horas (meta: <4h) ✅ │
│ P2: 6.1 horas (meta: <8h) ✅ │
│ P3: 18 horas (meta: <24h) ✅ │
└─────────────────────────────────────────────────────────────┘
MÉTRICAS DE SOLICITAÇÕES:
┌─────────────────────────────────────────────────────────────┐
│ Solicitações atendidas no prazo: 94% │
│ Tempo médio de atendimento: 2.1 dias │
│ Backlog atual: 23 solicitações │
│ Idade média do backlog: 3.5 dias │
└─────────────────────────────────────────────────────────────┘
MÉTRICAS DE MUDANÇAS:
┌─────────────────────────────────────────────────────────────┐
│ Mudanças executadas: 15 │
│ Taxa de sucesso: 93% │
│ Rollbacks: 1 │
│ Incidentes causados por mudanças: 2 │
└─────────────────────────────────────────────────────────────┘