| Purchase Prediction for Online Store |
Прогнозирование покупок клиентов за 90 дней с LightGBM, обработка больших данных и дисбаланса классов. |
Python, Scikit-learn, LightGBM, Pandas, feature-engineering |
github.com/kagor4/Purchase-Prediction-for-Online-Store |
Freelance |
Classical ML |
| Startup Survival Predictor |
Прогнозирование выживаемости стартапов с F1 0.997 на основе DecisionTree, оптимизированного через Optuna, для Kaggle. |
Python, Scikit-learn, Optuna, Pandas, Phik, feature-engineering |
github.com/kagor4/Startup-Survival-Predictor |
Freelance |
Classical ML |
| Churn Prediction for Beta Bank |
Прогнозирование ухода клиентов с F1 0.61 на тестовой выборке, решение проблемы дисбаланса классов. |
Python, Scikit-learn, RandomForestClassifier, upsampling |
github.com/kagor4/Churn-Prediction-for-Beta-Bank |
Academic |
Classical ML |
| Age Prediction for Khleb-Sol Supermarket |
Модель компьютерного зрения для предсказания возраста покупателей с MAE 7.12 на основе ResNet50. |
Python, TensorFlow, Keras, ResNet50, Pandas, ImageDataGenerator |
github.com/kagor4/Khleb-Sol_supermarket_project |
Academic |
Computer Vision |
| Churn Prediction for Telecom Company |
Прогнозирование оттока клиентов телеком-компании с ROC AUC 0.903 на основе CatBoost, анализ факторов ухода. |
Python, Scikit-learn, CatBoost, Pandas, SQLite, Plotly |
github.com/kagor4/project_telecom |
Academic |
Classical ML |
| Image Search for Photohosting |
PoC мультимодального поиска изображений по тексту с использованием ResNet50 и BERT. |
Python, TensorFlow, Keras, SentenceTransformers, BERT, ResNet50, NLTK |
github.com/kagor4/photohosting_project |
Academic |
Multimodal Models |
| Star Temperature Predictor |
Нейросетевая модель для предсказания температуры звёзд с RMSE 4263 на основе PyTorch, анализ астрофизических данных. |
Python, PyTorch, Scikit-learn, Pandas, Seaborn, Phik |
github.com/kagor4/Star-Temperature-Predictor |
Academic |
Classical ML |
| Used Car Price Predictor |
Прогнозирование стоимости подержанных автомобилей с RMSE 1611.68 на основе LightGBM, предобработка аномалий. |
Python, Scikit-learn, LightGBM, Pandas, Seaborn, feature-engineering |
github.com/kagor4/Used-Car-Price-Predictor |
Academic |
Classical ML |
| Accident Risk Prediction System |
Оценка риска ДТП для каршеринга с F1 0.674 на основе нейронной сети, интеграция PostgreSQL и демо в Streamlit. |
Python, PyTorch, CatBoost, Scikit-learn, PostgreSQL, Streamlit |
github.com/kagor4/Accident-Risk-Prediction-System |
Academic |
Classical ML |
| Taxi Demand Prediction |
Прогнозирование спроса на такси в аэропорту с RMSE 42.57 на основе LinearRegression, анализ сезонности. |
Python, Scikit-learn, LinearRegression, CatBoost, LightGBM, Pandas |
github.com/kagor4/Taxi-Demand-Prediction |
Academic |
Time Series |
| GoFast Scooter Analytics |
Анализ поведения пользователей сервиса аренды самокатов, оптимизация тарифов и подписки Ultra. |
Python, Pandas, NumPy, SciPy, Matplotlib, Jupyter Notebook |
github.com/kagor4/GoFast-Scooter-Analytics |
Academic |
Analytics |
| Russian Film Industry Analytics |
Анализ эффективности господдержки российского кинопроизводства, связь финансирования и кассовых сборов. |
Python, Pandas, Matplotlib, Jupyter Notebook |
github.com/kagor4/Russian-Film-Industry-Analytics |
Academic |
Analytics |
| Real Estate Price Predictor |
Прогнозирование стоимости недвижимости в Санкт-Петербурге, обработка выбросов и генерация признаков. |
Python, Pandas, NumPy, Matplotlib, Scikit-learn, Jupyter Notebook |
github.com/kagor4/Real-Estate-Price-Predictor |
Academic |
Classical ML |
| OilWell Prediction |
Прогнозирование объёма нефти и прибыли, оценка рисков через bootstrap. |
Python, Pandas, Scikit-learn, NumPy, Jupyter Notebook |
github.com/kagor4/OilWell-Profit-Predictor |
Academic |
Classical ML |
| California Housing Prediction |
Прогнозирование стоимости жилья в Калифорнии с RMSE 68932.66 на основе LinearRegression и PySpark. |
Python, PySpark, Scikit-learn, Pandas |
github.com/kagor4/California-Housing-Price-Predictor |
Academic |
Classical ML |
| Toxic Comments Classification |
Классификация токсичных текстов с F1 0.7506 на основе CatBoost и TF-IDF. |
Python, Scikit-learn, CatBoost, NLTK, Pandas |
github.com/kagor4/toxic_comments_project |
Academic |
NLP |
| Bank Churn Prediction |
Прогнозирование ухода клиентов банка с F1 0.61 на основе RandomForest, методы борьбы с дисбалансом. |
Python, Scikit-learn, RandomForestClassifier, Pandas, Matplotlib, tqdm |
github.com/kagor4/bank_churn_project |
Academic |
Classical ML |