Si vous passez les certifications de niveau supérieur Analyste de données et Data Scientist, il vous sera demandé de rédiger un rapport, qui sera noté par des évaluateurs humains.
Notre conseil est de faciliter vraiment la tâche à la personne qui notera votre travail. Créez une liste avec un point pour chaque colonne. Ainsi, le correcteur sera absolument certain que vous avez examiné chaque colonne et ne pourra pas vous faire échouer.
Non seulement vous facilitez la notation, mais il vous est aussi plus facile de voir ce que vous avez fait et d’être certain d’avoir vérifié chaque colonne.
Voici un exemple de solution :
Les données initiales comptaient 200 lignes et 9 colonnes. Après validation, il restait 198 lignes. Ce qui suit décrit ce que j’ai fait pour chaque colonne :
- Région : Il y avait 10 régions uniques, comme prévu.
- Nom du lieu : Il y avait 185 noms de lieux uniques, ce qui suggère que certains noms sont dupliqués, cela devrait être confirmé avec l’équipe fournissant les données.
- Type de lieu : Il n’y a que 4 valeurs pour chaque type de lieu : Coffee Shop, Café, Espresso Bar et Autres. Cela correspond à ce qui est attendu.
- Note : Les valeurs vont de 3,9 à 5,0, donc toutes sont dans la plage attendue.
- Avis : J’ai supprimé les lignes où la valeur de l’avis était manquante. Cela représentait 2 lignes, laissant 198 lignes de données.
- Prix : Il y a 3 catégories de prix, comme prévu.
- Option de livraison : Il y a 2 options de livraison - Vrai/Faux, comme prévu.
- Option sur place : J’ai converti les valeurs manquantes en Faux, il n’y avait initialement aucune valeur fausse.
- Option à emporter : J’ai converti les valeurs manquantes en Faux, il n’y avait également initialement aucune valeur fausse.