Curos de Computer Vision en python para la comunidad Latina echo por la Comunidad de la UNI:
ACECOM
Introducir los fundamentos del procesamiento digital de imágenes, desde la representación básica hasta técnicas avanzadas de filtrado y detección de características.
Conceptos Clave:
- Las imágenes digitales son funciones discretas 2D
f(x,y) - Escala de grises: Arrays 2D (alto × ancho)
- Color: Arrays 3D (alto × ancho × canales)
Temas Cubiertos:
- ✅ Canales de Color RGB: Descomposición en Rojo, Verde y Azul
- ✅ Espacios de Color:
- RGB (para pantallas)
- Escala de grises (intensidad luminosa)
- HSV (Tono, Saturación, Valor)
- ✅ Aplicación Práctica: Segmentación por color usando HSV
💡 Insight: HSV es ideal para segmentación porque separa el color (Hue) de la iluminación (Value).
Operaciones por Punto (modifican píxeles individualmente):
- ✅ Negativo
- ✅ Umbralización (binarización)
- ✅ Ajuste de brillo y contraste
Técnicas Avanzadas:
- ✅ Histogramas y Ecualización: Mejora del contraste redistribuyendo intensidades
- ✅ Transformaciones Geométricas:
- Rotación
- Escalado
- Volteo (flipping)
- ✅ Transformación de Perspectiva: Corrección de distorsión perspectiva
📈 Aplicación: Ecualización de histograma para mejorar imágenes de bajo contraste.
Fundamentos de Convolución:
- ✅ Aplicación de kernels (matrices pequeñas) sobre imágenes
- ✅ Fórmula matemática de convolución 2D
Tipos de Ruido Estudiados:
- ✅ Ruido Gaussiano (variación aleatoria)
- ✅ Sal y Pimienta (píxeles blancos/negros aleatorios)
- ✅ Ruido Speckle (multiplicativo)
Filtros de Reducción de Ruido:
- ✅ Filtro de Media (box blur) - Para ruido gaussiano
- ✅ Filtro Gaussiano - Preserva mejor los bordes
- ✅ Filtro Mediano - Excelente para ruido sal y pimienta
🎯 Hallazgo Clave: El filtro mediano es óptimo para ruido sal y pimienta porque elimina outliers sin promediarlos.
Métodos Implementados:
- ✅ Umbralización Simple (threshold fijo)
- ✅ Umbralización Adaptativa (threshold local variable)
- ✅ Método de Otsu - Selección automática óptima del threshold
- ✅ Métodos Avanzados: Niblack y Sauvola
🚀 Aplicación: Segmentación automática de documentos con iluminación variable.
Enfoques por Derivadas:
- ✅ Primera Derivada:
- Operador Sobel (horizontal/vertical)
- Operador Prewitt
- Operador Roberts
- ✅ Segunda Derivada:
- Laplaciano
- Laplaciano del Gaussiano (LoG)
Algoritmo Avanzado:
- ✅ Canny Edge Detector (4 etapas):
- Suavizado gaussiano
- Cálculo de gradientes
- Supresión de no-máximos
- Umbralización con histéresis
🔗 Aplicación Final: Detección de contornos y boundaries de objetos.
- numpy (procesamiento numérico)
- matplotlib (visualización)
- scikit-image (procesamiento de imágenes)
- scipy (operaciones avanzadas)
- OpenCV (algunas operaciones)Este curso proporciona:
- ✅ Fundamentos matemáticos detrás del procesamiento de imágenes
- ✅ Implementación práctica con ejemplos ejecutables
- ✅ Comprensión profunda de algoritmos clásicos de visión por computadora
- ✅ Base sólida para técnicas más avanzadas de IA y computer vision
Con esta base, tu comunidad podría avanzar hacia:
- Redes Neuronales Convolucionales (CNNs)
- Segmentación semántica
- Detección de objetos (YOLO, R-CNN)
- Procesamiento de video
- Aplicaciones de visión artificial en tiempo real
