image

Projet 5

Traitement et Analyse de Données

SQL Talend R Studio ETL

Projet de Traitement de Données - ETL et Analyse

Ce projet visait à concevoir une nouvelle base de données à partir de jeux de données existants, en assurant leur transformation, leur nettoyage et leur intégration. Nous avons utilisé l'outil Talend pour réaliser les processus d'ETL (Extraction, Transformation, Chargement), en partant de deux cas d'usage : le dataset du Titanic et celui du Nutri-Score.

  • Objectif technique : améliorer la qualité des données, assurer leur cohérence, et structurer les tables relationnelles pour faciliter leur exploitation.
  • Fonctionnalités développées :
    • Transformation et nettoyage des données du Titanic
    • Normalisation des informations nutritionnelles du Nutri-Score
    • Calcul automatisé des scores nutritionnels
    • Génération de visualisations statistiques avec R
  • Technologies utilisées : SQL, Talend, R Studio, outils de visualisation de données.
  • Défis relevés : gestion des valeurs manquantes, normalisation des données, optimisation des requêtes SQL, et création de visualisations pertinentes.

Ce projet m'a permis de consolider mes compétences en manipulation de données, en modélisation relationnelle, et en visualisation statistique à l'aide d'outils professionnels largement utilisés dans le domaine de la data.

© 2023 Portfolio Toni. All rights reserved.