Skip to content

Latest commit

 

History

History
33 lines (19 loc) · 1.74 KB

File metadata and controls

33 lines (19 loc) · 1.74 KB

Projet IMDb - Analyse et traitement de données

Ce dépôt contient l'ensemble des ressources pour le projet de traitement de données cinématographiques issues d'IMDb. Il couvre la chaîne complète de la donnée, de la modélisation transactionnelle (OLTP) à l'analyse décisionnelle (OLAP) et l'intelligence artificielle (IA).

Structure du projet

L'architecture du projet est organisée en plusieurs dossiers thématiques :

1. OLTP/ (Online Transaction Processing)

Cette section concerne la base de données transactionnelle principale :

  • OLTP_MCD.mcd, OLTP_MLD.mld, OLTP_MPD.mpd : modèles conceptuels, logiques et physiques de données (réalisés avec PowerAMC / PowerDesigner) ;
  • script_OLTP_IMDb.sql : script SQL de création de la structure de la base de données transactionnelle ;
  • ETL_IMDb.py : script Python d'ETL pour peupler la base OLTP à partir des données brutes.

2. OLAP/ (Online Analytical Processing)

Cette section concerne l'entrepôt de données pour l'analyse décisionnelle:

  • OLAP_MCD.mcd, OLAP_MLD.mld, OLAP_MPD.mpd : modèles pour la base multidimensionnelle (schéma en étoile/flocon) ;
  • script_OLAP_IMDb.sql : script SQL pour la création et l'alimentation de l'entrepôt de données OLAP ;
  • OLTP_SAE_IMDb.pbix : reporting réalisé sur Power BI relié à la base de données OLAP.

3. AI/ (Artificial Intelligence)

Cette section contient les analyses avancées et modèles prédictifs :

  • SAE5_IMDb_IA_Models1.ipynb : notebook Jupyter explorant des modèles de Machine Learning sur les données traitées (prédiction de notes, classification, etc.).

4. Contexte/

  • Contient les documents relatifs au contexte et aux spécifications du projet.