Este proyecto analiza comparativamente las letras de Soda Stereo y Patricio Rey y sus Redonditos de Ricota, dos bandas icónicas del rock argentino, mediante técnicas de Procesamiento de Lenguaje Natural (NLP).
El objetivo fue identificar diferencias estilísticas, gramaticales y semánticas entre ambas propuestas artísticas, observando cómo cada grupo construye su identidad lírica a través del lenguaje.
El análisis reveló contrastes significativos: Soda Stereo presenta un estilo más poético, sensorial y metafórico, mientras que Los Redondos utilizan un lenguaje narrativo, concreto y social.
Mediante técnicas como TF-IDF, embeddings y POS tagging, fue posible cuantificar estas diferencias y representar visualmente los patrones estilísticos del rock nacional.
- Tipo: Música (Letras de canciones)
- Tamaño: 26 textos, aproximadamente 2.900 palabras totales
- Fuentes principales: Genius.com, Rock.com.ar, Letras.com
- Período temporal: Décadas de 1980 y 1990
- Criterios de selección:
Se seleccionaron 13 canciones de cada banda, priorizando letras completas, representativas de su estilo y época, evitando duplicados o fragmentos incompletos.
- Preprocesamiento de texto: limpieza, normalización, tokenización y eliminación de stop words.
- Análisis de frecuencia léxica: Bag of Words (BoW) y TF-IDF.
- Análisis semántico: Word Embeddings con spaCy (
es_core_news_md). - Técnica complementaria aplicada: POS Tagging (análisis gramatical por tipo de palabra).
- Visualizaciones: nubes de palabras, gráficos de frecuencia y reducción de dimensionalidad (PCA/t-SNE).
- Soda Stereo muestra un lenguaje más descriptivo, con alta proporción de adjetivos y verbos, reflejando un estilo poético y sensorial.
- Los Redondos utilizan más sustantivos y verbos concretos, lo que refuerza su tono narrativo, urbano y social.
- Los embeddings revelaron agrupaciones semánticas claras por banda, incluso sin etiquetas previas.
- La comparación entre métodos mostró que los embeddings fueron los más efectivos para captar diferencias de estilo, mientras que BoW/TF-IDF resultaron útiles para análisis léxico exploratorio.
- Python 3.x
- pandas, numpy
- scikit-learn
- spaCy (modelo
es_core_news_md) - matplotlib, seaborn
- wordcloud
- Google Colab para ejecución del notebook y visualizaciones
- Clonar este repositorio:
git clone https://github.com/[tu_usuario]/nlp-rock-argentino.git cd nlp-rock-argentino
pip install -r requirements.txt
jupyter notebook notebooks/analisis_integrador.ipynb
Los modelos utilizados no capturan metáforas, ironías ni contexto cultural, muy presentes en las letras de rock.
Las técnicas aplicadas no consideran ritmo, métrica ni sonoridad, que también son elementos expresivos.
En el futuro se podría:
Entrenar embeddings específicos para letras en español.
Analizar evolución temporal y temas dominantes con modelos de tópicos (LDA).
Integrar modelos contextuales (BERT) para detectar figuras poéticas e inferencias semánticas más profundas.
Matías de Vivo GitHub: @matiasdevivo
Trabajo Integrador – NLP – 2025 Tecnicatura en Ciencia de Datos e Inteligencia Artificial