Skip to content

matiasdevivo/DEVIVO-MATIAS-NLP-INTEGRADOR

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Análisis de NLP: Lenguaje Poético y Urbano en el Rock Argentino

Descripción

Este proyecto analiza comparativamente las letras de Soda Stereo y Patricio Rey y sus Redonditos de Ricota, dos bandas icónicas del rock argentino, mediante técnicas de Procesamiento de Lenguaje Natural (NLP).
El objetivo fue identificar diferencias estilísticas, gramaticales y semánticas entre ambas propuestas artísticas, observando cómo cada grupo construye su identidad lírica a través del lenguaje.

El análisis reveló contrastes significativos: Soda Stereo presenta un estilo más poético, sensorial y metafórico, mientras que Los Redondos utilizan un lenguaje narrativo, concreto y social.
Mediante técnicas como TF-IDF, embeddings y POS tagging, fue posible cuantificar estas diferencias y representar visualmente los patrones estilísticos del rock nacional.


Información del Corpus

  • Tipo: Música (Letras de canciones)
  • Tamaño: 26 textos, aproximadamente 2.900 palabras totales
  • Fuentes principales: Genius.com, Rock.com.ar, Letras.com
  • Período temporal: Décadas de 1980 y 1990
  • Criterios de selección:
    Se seleccionaron 13 canciones de cada banda, priorizando letras completas, representativas de su estilo y época, evitando duplicados o fragmentos incompletos.

Técnicas de NLP Aplicadas

  • Preprocesamiento de texto: limpieza, normalización, tokenización y eliminación de stop words.
  • Análisis de frecuencia léxica: Bag of Words (BoW) y TF-IDF.
  • Análisis semántico: Word Embeddings con spaCy (es_core_news_md).
  • Técnica complementaria aplicada: POS Tagging (análisis gramatical por tipo de palabra).
  • Visualizaciones: nubes de palabras, gráficos de frecuencia y reducción de dimensionalidad (PCA/t-SNE).

Principales Hallazgos

  • Soda Stereo muestra un lenguaje más descriptivo, con alta proporción de adjetivos y verbos, reflejando un estilo poético y sensorial.
  • Los Redondos utilizan más sustantivos y verbos concretos, lo que refuerza su tono narrativo, urbano y social.
  • Los embeddings revelaron agrupaciones semánticas claras por banda, incluso sin etiquetas previas.
  • La comparación entre métodos mostró que los embeddings fueron los más efectivos para captar diferencias de estilo, mientras que BoW/TF-IDF resultaron útiles para análisis léxico exploratorio.

Tecnologías Utilizadas

  • Python 3.x
  • pandas, numpy
  • scikit-learn
  • spaCy (modelo es_core_news_md)
  • matplotlib, seaborn
  • wordcloud
  • Google Colab para ejecución del notebook y visualizaciones

Instrucciones de Reproducción

  1. Clonar este repositorio:
    git clone https://github.com/[tu_usuario]/nlp-rock-argentino.git
    cd nlp-rock-argentino
    

Instalar dependencias:

pip install -r requirements.txt

Ejecutar el notebook principal:

jupyter notebook notebooks/analisis_integrador.ipynb

Limitaciones y Trabajo Futuro

Los modelos utilizados no capturan metáforas, ironías ni contexto cultural, muy presentes en las letras de rock.

Las técnicas aplicadas no consideran ritmo, métrica ni sonoridad, que también son elementos expresivos.

En el futuro se podría:

Entrenar embeddings específicos para letras en español.

Analizar evolución temporal y temas dominantes con modelos de tópicos (LDA).

Integrar modelos contextuales (BERT) para detectar figuras poéticas e inferencias semánticas más profundas.

Autor

Matías de Vivo GitHub: @matiasdevivo

Trabajo Integrador – NLP – 2025 Tecnicatura en Ciencia de Datos e Inteligencia Artificial

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors