Se você estiver fazendo as certificações avançadas de Analista de Dados e Cientista de Dados, será solicitado que escreva um relatório, que será avaliado por avaliadores humanos.
Nossa dica é facilitar bastante para quem vai avaliar seu trabalho. Crie uma lista com um ponto para cada coluna. Dessa forma, o avaliador terá certeza absoluta de que você analisou cada coluna e não poderá reprovar você.
Além de facilitar a avaliação, também fica mais fácil para você ver o que fez e ter certeza de que verificou cada coluna.
Aqui está um exemplo de solução:
Os dados originais têm 200 linhas e 9 colunas. Após a validação, restaram 198 linhas. A seguir, descrevo o que fiz em cada coluna:
- Região: Havia 10 regiões únicas, conforme esperado.
- Nome do lugar: Havia 185 nomes únicos de lugares, sugerindo que alguns nomes estão duplicados; isso deve ser confirmado com a equipe que forneceu os dados.
- Tipo de lugar: Existem apenas 4 valores para cada tipo de lugar: Coffee Shop, Café, Espresso Bar e Outros. Isso corresponde ao esperado.
- Avaliação: Os valores variam de 3,9 a 5,0, portanto todos estão dentro do intervalo esperado.
- Avaliações: Removi as linhas onde o valor da Avaliação estava ausente. Foram 2 linhas, restando 198 linhas de dados.
- Preço: Existem 3 categorias de preço, conforme esperado.
- Opção de entrega: Existem 2 opções de entrega - Verdadeiro/Falso, conforme esperado.
- Opção para consumir no local: Converto valores ausentes para Falso; originalmente não havia valores falsos.
- Opção para levar: Converto valores ausentes para Falso; originalmente também não havia valores falsos.