Como o roll-up pode enganar sua análise de desempenho e o que fazer antes de decidir
É segunda-feira, e você olha para o roll-up da semana passada. Tudo parece claro: o turno da noite teve desempenho pior. Mas será que isso é verdade?
Na prática, o agregado esconde a complexidade diferentes tipos de construção, níveis de habilidade e equipamentos mudam o resultado.
É aqui que nasce o paradoxo: a tendência geral se inverte quando os dados são divididos nas dimensões certas.
O Que Realmente Aconteceu na Semana Passada
À primeira vista, o roll-up mostra o turno da noite abaixo da meta.
Mas ao segmentar os dados por tipo de construção, a história muda completamente:
A noite superou o dia em ambos os segmentos, apenas trabalhou mais nas construções difíceis.
Sem essa segmentação, qualquer decisão pareceria lógica… mas seria errada.
Agregar (o que o painel mostra)

Se você parar aqui, você se apaixona pelo paradoxo. Se você dividir pela dificuldade de construção, um novo padrão emerge:
Dentro dos segmentos (o que realmente aconteceu)

Dentro de cada segmento, Night superou Day; é só que Night fez a maior parte da mistura difícil. Se você repessar para uma mistura comum, a ilusão desaparece:
Visualização ajustada à mistura (reponderação)

O fator de confusão (aqui, dificuldade de mistura) influencia quem recebe qual trabalho e como esse trabalho é executado. Olhar apenas para os roll-ups dá uma impressão falsa; você precisa segmentar para ver o trabalho como aconteceu. Olhar para os segmentos pode mudar a conversa de “por que você está pior?” para “o que tornou este segmento difícil, e como o equilibramos?”
A média mente: quando o problema não é a equipe, é o equipamento
Os tempos de ciclo podem ter a mesma armadilha. A equipe A parece lenta no roll-up. Mas antes de intervir, faça uma pergunta fundamental: “As equipes executaram os mesmos ativos sob as mesmas condições?” Eles não fizeram. O ativo mais movimentado na área, o Fixture 12, corre um pouco rápido quando está frio e adiciona permanência à medida que aquece. A média misturada esconde esse comportamento e faz com que a Equipe A pareça o problema porque eles correram a maior parte do volume em 12.
Comparação de tempo de ciclo agregado

Tempo de ciclo por fixação

Dentro dos acessórios, a história vira. Em ambos os jogos, a Equipe A é mais rápida. A correção muda de culpar a Equipe A para introduzir cooldowns após as mudanças, retirando as opções mais pesadas na primeira hora após o almoço e agendando uma tarefa de manutenção rápida ligada à deriva. A média melhora porque o ativo melhora, não porque a equipe é instruída a “dono do número”.
Quando a falha não está no lote, mas na leitura dos dados
Escaladas de qualidade são o lugar mais caro para deixar o roll-up impulsionar a narrativa. A Linha B sinaliza um lote de fornecedores (Q17), e o relatório semanal mostra uma lacuna limpa em relação à Linha A. A próxima etapa na lista de verificação de escalonamento geralmente é uma chamada do fornecedor. Antes de fazer isso, divida as linhas por quem realmente dirigiu o trabalho.
Comparação de lote de fornecedores FPY

FPY por experiência do operador

Se a maioria das unidades da Linha A no Q17 fosse administrada por novos operadores, enquanto a Linha B colocou a banda A no mesmo lote, leia os números dentro da banda como um sinal de pessoal, não um defeito do fornecedor. Abandone o escalonamento. Em vez disso, revise a etapa exata de inspeção que falhou, padronize uma verificação rápida na estação para remover a leitura incomum e emparelhe a faixa B com um mentor nesse SKU por uma semana. A lacuna FPY deve ser fechada sem uma chamada de fornecedor.
O que aconteceu vs. por que aconteceu: a diferença que evita decisões erradas
Fábricas fazem malabarismos com questões descritivas e causais. “O que aconteceu?” é descritivo. “Por que isso aconteceu e o que devemos fazer?” é causal. O paradoxo de Simpson aparece quando você responde à pergunta causal com um roll-up descritivo.
Aqui está um guia simples de 6 etapas para evitar esse erro:
- Escreva a decisão exata em uma linha (por exemplo, “Coach Night ou não?” “Consertar o Fixe 12 primeiro?” “Escalar o lote Q17?”).
- Liste o que altera a dificuldade ou atribuição (mix, ID de fixação/ativo, faixa do operador, hora do dia).
- Compare maçãs com maçãs: divida por esses fatores e compare dentro de cada segmento.
- Coloque os dois lados na mesma mistura e compare novamente (repesar para uma mistura comum).
- Se os segmentos e o roll-up discordarem, confie nos segmentos.
- Aja de acordo com base na causa que você encontrou (treinamento, controle de fixação, pessoal, sequência).
Definições de variáveis

O rendimento agregado para qualquer mudança é a média ponderada entre os segmentos
Para calcular o contra-factual “Qual seria o FPY do Dia se tivesse a mistura do Noite?”, use os pesos de volume da Noite com o desempenho do segmento do Dia
Para o exemplo da Tabela 2:
- Dia em fácil: 95%, Noite em fácil: 99%
- Dia no duro: 75%, Noite no duro: 80%
- Mix da noite: 100 fáceis, 900 difíceis (de 1.000)
Mistura do Dia com a Noite =(95×100+75×900)/1000=77,0%
Noite com mistura de Dia =(99×900+80×100)/1000=97,1%
Isso revela que a Noite supera o Dia em todas as proporções de mixagem, mesmo que o agregado bruto (81,9% vs 93,0%) diga o contrário.
Somente depois que a visualização do segmento estiver clara, você mostra o agregado para o contexto. A correspondência de intervenções com as causas raiz reais aparece rapidamente: menos ruído de perseguição de horas extras, menos acelerações e rampas mais calmas porque as correções pousam nos acessórios, treinamento e sequência certos.
A diferença entre saber o que aconteceu e ver como aconteceu
O segmento-first só funciona quando as observações brutas são detalhadas o suficiente para explicar por que uma fatia funciona de forma diferente de outra. Coletar esses dados é tedioso e demorado. Com cronogramas, você pode ver diferenças no trabalho em si: alcances extras em um turno que não aparecem no outro, um elemento de "alinhamento" mais longo em um acessório específico após o almoço, uma verificação de qualidade que às vezes cai dentro do ciclo e às vezes flutua fora. Essas são as diferenças que justificam a segmentação, e são as alavancas que você pode realmente puxar.
A Monostate ajuda você a ir além do roll-up: segmentando, visualizando e explicando o que realmente acontece na operação.