Skip to content

KABUYA-SINA/Training-ML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

🤖 Fairness & Income Prediction — TensorFlow ML Project

Projet de machine learning utilisant TensorFlow pour prédire le revenu annuel tout en analysant les notions d’équité (fairness) entre différents groupes démographiques.


🚀 Description

Ce projet consiste à entraîner un modèle de classification binaire permettant de prédire si le revenu d’un individu dépasse un seuil donné.

En parallèle, une analyse approfondie de l’équité du modèle est réalisée afin d’évaluer les performances selon différents groupes sensibles (ex : sexe).


🎯 Objectifs du projet

  • Construire un modèle de classification avec TensorFlow
  • Prétraiter et normaliser des données réelles
  • Évaluer les performances du modèle
  • Analyser les biais potentiels (fairness)
  • Comparer les performances entre groupes sensibles

🛠️ Technologies utilisées

  • Python
  • TensorFlow / Keras
  • Pandas
  • Scikit-learn
  • Matplotlib
  • Seaborn
  • NumPy

📊 Dataset utilisé

  • ACS Income Dataset (U.S. Census / MLCC Google)

  • Variable cible : revenu annuel (PINCP)

  • Transformation en classification binaire :

    • 1 → revenu > 50 000
    • 0 → revenu ≤ 50 000

🧠 Architecture du modèle

  • Normalisation des données

  • Réseau de neurones fully connected :

    • Dense(64, ReLU)
    • Dense(32, ReLU)
    • Dense(1, Sigmoid)

⚙️ Fonctionnalités

  • 🔍 Prétraitement automatique des données
  • 🧠 Entraînement d’un modèle TensorFlow
  • 📈 Évaluation (Accuracy, AUC, Confusion Matrix)
  • ⚖️ Analyse de fairness par groupe
  • 📊 Visualisation des performances
  • 📉 Analyse ROC par sous-groupes

📊 Métriques évaluées

  • Accuracy
  • AUC (Area Under Curve)
  • Confusion Matrix
  • Classification Report
  • ROC Curve par groupe

⚖️ Analyse d’équité (Fairness)

Le projet analyse les performances du modèle selon :

  • Sexe (Male / Female)
  • Distribution des prédictions
  • Taux de vrais positifs / faux positifs par groupe
  • Comparaison des performances entre sous-populations

📂 Structure du projet

📁 training-ml/
 ├── app.py
└── README.md

🚀 Installation et exécution

pip install tensorflow pandas scikit-learn matplotlib seaborn
python app.py

📈 Résultats attendus

  • Modèle de classification fonctionnel
  • Évaluation complète des performances
  • Analyse des biais entre groupes
  • Visualisations des disparités

🧠 Compétences développées

  • Machine Learning supervisé
  • Deep Learning avec TensorFlow
  • Analyse de biais (AI fairness)
  • Data preprocessing avancé
  • Visualisation de données
  • Évaluation de modèles ML

👨‍💻 Auteur

Sina Kabuya


About

Training - Google Exercise - ML

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages