Projet de machine learning utilisant TensorFlow pour prédire le revenu annuel tout en analysant les notions d’équité (fairness) entre différents groupes démographiques.
Ce projet consiste à entraîner un modèle de classification binaire permettant de prédire si le revenu d’un individu dépasse un seuil donné.
En parallèle, une analyse approfondie de l’équité du modèle est réalisée afin d’évaluer les performances selon différents groupes sensibles (ex : sexe).
- Construire un modèle de classification avec TensorFlow
- Prétraiter et normaliser des données réelles
- Évaluer les performances du modèle
- Analyser les biais potentiels (fairness)
- Comparer les performances entre groupes sensibles
- Python
- TensorFlow / Keras
- Pandas
- Scikit-learn
- Matplotlib
- Seaborn
- NumPy
-
ACS Income Dataset (U.S. Census / MLCC Google)
-
Variable cible : revenu annuel (
PINCP) -
Transformation en classification binaire :
- 1 → revenu > 50 000
- 0 → revenu ≤ 50 000
-
Normalisation des données
-
Réseau de neurones fully connected :
- Dense(64, ReLU)
- Dense(32, ReLU)
- Dense(1, Sigmoid)
- 🔍 Prétraitement automatique des données
- 🧠 Entraînement d’un modèle TensorFlow
- 📈 Évaluation (Accuracy, AUC, Confusion Matrix)
- ⚖️ Analyse de fairness par groupe
- 📊 Visualisation des performances
- 📉 Analyse ROC par sous-groupes
- Accuracy
- AUC (Area Under Curve)
- Confusion Matrix
- Classification Report
- ROC Curve par groupe
Le projet analyse les performances du modèle selon :
- Sexe (Male / Female)
- Distribution des prédictions
- Taux de vrais positifs / faux positifs par groupe
- Comparaison des performances entre sous-populations
📁 training-ml/
├── app.py
└── README.md
pip install tensorflow pandas scikit-learn matplotlib seaborn
python app.py
- Modèle de classification fonctionnel
- Évaluation complète des performances
- Analyse des biais entre groupes
- Visualisations des disparités
- Machine Learning supervisé
- Deep Learning avec TensorFlow
- Analyse de biais (AI fairness)
- Data preprocessing avancé
- Visualisation de données
- Évaluation de modèles ML
Sina Kabuya
- GitHub : https://github.com/KABUYA-SINA
- Portfolio : https://kabuya-sina.github.io/Portfolio-SK/