Clasificación de Dígitos Manuscritos (MNIST) con Naive Bayes

Objetivo:

Este proyecto busca implementar un clasificador Naive Bayes para el conjunto de datos de dígitos manuscritos MNIST. Se pretende entender y aplicar los conceptos de probabilidad condicional y independencia condicional para clasificar imágenes de dígitos manuscritos.

Descripción del Dataset:

El conjunto de datos MNIST contiene imágenes de dígitos manuscritos (del 0 al 9) en blanco y negro, normalizados y centrados. Cada imagen tiene un tamaño de 28x28 píxeles.

Metodología:

Carga de Datos: Se cargan las imágenes y las etiquetas del dataset MNIST.

Preprocesamiento:

Las imágenes se binarizan utilizando diferentes umbrales, convirtiendo los píxeles en valores binarios (0 o 1), representando el color blanco o negro respectivamente.

Implementación de Naive Bayes:

Se implementa el clasificador Naive Bayes, que se basa en el cálculo de probabilidades condicionales y la asunción de independencia condicional entre los píxeles dada la clase del dígito. Se calcula la probabilidad de cada píxel dado cada dígito y se utilizan estas probabilidades para clasificar nuevas imágenes.

Validación Cruzada y Selección de Hiperparámetros:

Se realiza una validación cruzada para seleccionar el mejor umbral de binarización. El rendimiento del modelo se evalúa mediante el cálculo del accuracy en conjuntos de validación.

Síntesis de Nuevos Dígitos:

Se genera un nuevo dígito sintético utilizando las probabilidades condicionales aprendidas por el modelo. Este nuevo dígito representa una visualización de un dígito "promedio" basado en las probabilidades condicionales de cada píxel.

Resultados:

Se logró desarrollar un modelo que puede clasificar dígitos manuscritos con una precisión satisfactoria. Además, el modelo fue capaz de sintetizar nuevos dígitos que representan visualizaciones "promedio" de cada clase. A continuación, se presentan los resultados de las métricas de interés (Accuracy, Recall y F1-score), así como la matriz de confusión evaluadas sobre los datos de test.

Matriz de confusión:

Métricas de interés:

Dígitos sintetizados

Los dígitos sintetizados reflejan de manera adecuada las características generales de cada clase de dígito. Aunque no son representaciones perfectas y pueden carecer de algunos detalles presentes en los dígitos manuscritos reales, sirven como una buena aproximación y demostración de la capacidad del modelo Naive Bayes para entender y replicar patrones subyacentes en los datos.

Número 6 sintetizado:

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
notebooks		notebooks
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Clasificación de Dígitos Manuscritos (MNIST) con Naive Bayes

Objetivo:

Descripción del Dataset:

Metodología:

Preprocesamiento:

Implementación de Naive Bayes:

Validación Cruzada y Selección de Hiperparámetros:

Síntesis de Nuevos Dígitos:

Resultados:

Dígitos sintetizados

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Clasificación de Dígitos Manuscritos (MNIST) con Naive Bayes

Objetivo:

Descripción del Dataset:

Metodología:

Preprocesamiento:

Implementación de Naive Bayes:

Validación Cruzada y Selección de Hiperparámetros:

Síntesis de Nuevos Dígitos:

Resultados:

Dígitos sintetizados

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages