Si está realizando las certificaciones de nivel superior de Analista de Datos y Científico de Datos, se le pedirá que redacte un informe, el cual será evaluado por calificadores humanos.
Nuestro consejo es facilitar mucho el trabajo a quien califique su trabajo. Cree una lista con un punto para cada columna. De esta manera, el evaluador estará absolutamente seguro de que ha revisado cada columna y no podrá reprobarle.
No solo está facilitando la evaluación, sino que también le será más fácil ver lo que ha hecho y asegurarse de haber revisado cada columna.
Aquí tiene un ejemplo de solución:
Los datos originales son 200 filas y 9 columnas. Tras la validación, quedaron 198 filas. A continuación describo lo que hice con cada columna:
- Región: Había 10 regiones únicas, como se esperaba.
- Nombre del lugar: Había 185 nombres únicos de lugares, lo que sugiere que algunos nombres están duplicados; esto debería confirmarse con el equipo que proporciona los datos.
- Tipo de lugar: Solo hay 4 valores para cada tipo de lugar: Coffee Shop, Café, Espresso Bar y Otros. Esto coincide con lo esperado.
- Calificación: Los valores oscilan entre 3.9 y 5.0, por lo que todos están dentro del rango esperado.
- Reseñas: Eliminé las filas donde faltaba el valor de la reseña. Fueron 2 filas, quedando 198 filas de datos.
- Precio: Hay 3 categorías de precio, como se esperaba.
- Opción de entrega: Hay 2 opciones de entrega - Verdadero/Falso, como se esperaba.
- Opción para comer en el lugar: Convertí los valores faltantes a Falso; originalmente no había valores falsos.
- Opción para llevar: Convertí los valores faltantes a Falso; originalmente tampoco había valores falsos.