Análisis de NLP: Lenguaje Poético y Urbano en el Rock Argentino

Descripción

Este proyecto analiza comparativamente las letras de Soda Stereo y Patricio Rey y sus Redonditos de Ricota, dos bandas icónicas del rock argentino, mediante técnicas de Procesamiento de Lenguaje Natural (NLP).
El objetivo fue identificar diferencias estilísticas, gramaticales y semánticas entre ambas propuestas artísticas, observando cómo cada grupo construye su identidad lírica a través del lenguaje.

El análisis reveló contrastes significativos: Soda Stereo presenta un estilo más poético, sensorial y metafórico, mientras que Los Redondos utilizan un lenguaje narrativo, concreto y social.
Mediante técnicas como TF-IDF, embeddings y POS tagging, fue posible cuantificar estas diferencias y representar visualmente los patrones estilísticos del rock nacional.

Información del Corpus

Tipo: Música (Letras de canciones)
Tamaño: 26 textos, aproximadamente 2.900 palabras totales
Fuentes principales: Genius.com, Rock.com.ar, Letras.com
Período temporal: Décadas de 1980 y 1990
Criterios de selección:
Se seleccionaron 13 canciones de cada banda, priorizando letras completas, representativas de su estilo y época, evitando duplicados o fragmentos incompletos.

Técnicas de NLP Aplicadas

Preprocesamiento de texto: limpieza, normalización, tokenización y eliminación de stop words.
Análisis de frecuencia léxica: Bag of Words (BoW) y TF-IDF.
Análisis semántico: Word Embeddings con spaCy (es_core_news_md).
Técnica complementaria aplicada: POS Tagging (análisis gramatical por tipo de palabra).
Visualizaciones: nubes de palabras, gráficos de frecuencia y reducción de dimensionalidad (PCA/t-SNE).

Principales Hallazgos

Soda Stereo muestra un lenguaje más descriptivo, con alta proporción de adjetivos y verbos, reflejando un estilo poético y sensorial.
Los Redondos utilizan más sustantivos y verbos concretos, lo que refuerza su tono narrativo, urbano y social.
Los embeddings revelaron agrupaciones semánticas claras por banda, incluso sin etiquetas previas.
La comparación entre métodos mostró que los embeddings fueron los más efectivos para captar diferencias de estilo, mientras que BoW/TF-IDF resultaron útiles para análisis léxico exploratorio.

Tecnologías Utilizadas

Python 3.x
pandas, numpy
scikit-learn
spaCy (modelo es_core_news_md)
matplotlib, seaborn
wordcloud
Google Colab para ejecución del notebook y visualizaciones

Instrucciones de Reproducción

Clonar este repositorio:

git clone https://github.com/[tu_usuario]/nlp-rock-argentino.git
cd nlp-rock-argentino

Instalar dependencias:

pip install -r requirements.txt

Ejecutar el notebook principal:

jupyter notebook notebooks/analisis_integrador.ipynb

Limitaciones y Trabajo Futuro

Los modelos utilizados no capturan metáforas, ironías ni contexto cultural, muy presentes en las letras de rock.

Las técnicas aplicadas no consideran ritmo, métrica ni sonoridad, que también son elementos expresivos.

En el futuro se podría:

Entrenar embeddings específicos para letras en español.

Analizar evolución temporal y temas dominantes con modelos de tópicos (LDA).

Integrar modelos contextuales (BERT) para detectar figuras poéticas e inferencias semánticas más profundas.

Autor

Matías de Vivo GitHub: @matiasdevivo

Trabajo Integrador – NLP – 2025 Tecnicatura en Ciencia de Datos e Inteligencia Artificial

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
corpus		corpus
notebooks		notebooks
visualizations		visualizations
README.md		README.md
requeriments.txt		requeriments.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Análisis de NLP: Lenguaje Poético y Urbano en el Rock Argentino

Descripción

Información del Corpus

Técnicas de NLP Aplicadas

Principales Hallazgos

Tecnologías Utilizadas

Instrucciones de Reproducción

Instalar dependencias:

Ejecutar el notebook principal:

Limitaciones y Trabajo Futuro

Autor

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Análisis de NLP: Lenguaje Poético y Urbano en el Rock Argentino

Descripción

Información del Corpus

Técnicas de NLP Aplicadas

Principales Hallazgos

Tecnologías Utilizadas

Instrucciones de Reproducción

Instalar dependencias:

Ejecutar el notebook principal:

Limitaciones y Trabajo Futuro

Autor

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages