VoidPerx · VoidPerx · May 5, 2025 · May 5, 2025 · May 7, 2025 · May 8, 2025
diff --git a/Create Project in.R b/Create Project in.R
@@ -1,6 +1,6 @@
 # Create new project R
 # File > New Project > Version Control > Git
-# Repository URL: https://github.com/usuario/hermetia-illucens-research.git
+# Repository URL: https://github.com/VoidPerx/unalbsfec
 
 # Setting up Git in R
 library(usethis)
@@ -17,4 +17,3 @@ use_git_config(
     deparse.max.lines = 2
   )
 }
-
diff --git a/Diagnóstico de Colinealidad.R b/Diagnóstico de Colinealidad.R
@@ -0,0 +1,96 @@
+## Guía para Manejar Colinealidad y Alta Dimensionalidad en GAM con R (Corregida y Ampliada)
+# Diagnóstico de Colinealidad
+# 1. Matriz de Correlación:
+
+library(corrplot)
+
+# Simulación de datos correcta (X2 depende de X1)
+set.seed(123)
+X1 <- rnorm(100)
+datos <- data.frame(
+  X1 = X1,
+  X2 = 2*X1 + rnorm(100, sd = 0.5),
+  X3 = runif(100),
+  Y = 3*X1 + rnorm(100)  # Variable respuesta
+)
+
+matriz_cor <- cor(datos[, c("X1", "X2", "X3")])
+corrplot(matriz_cor, method = "number", type = "upper")
+Corrección: Se simula X1 fuera del data.frame para claridad, aunque el código original era funcional.
+
+# 2. Factor de Inflación de Varianza (VIF):
+
+library(car)
+modelo_lineal <- lm(Y ~ X1 + X2 + X3, data = datos)
+vif_values <- vif(modelo_lineal)
+print(vif_values)  # X2 muestra VIF alto (>5)
+# Nota: El VIF en modelos lineales es una aproximación. En GAM, considerar usar remoción manual o técnicas de penalización.
+
+Tratamiento de Colinealidad
+# 1. Eliminación de Variables:
+
+datos_limpios <- subset(datos, select = -c(X2))
+# 2. PCA sin Redundancia en Escalado:
+
+# Escalado correcto integrado en prcomp
+pca_result <- prcomp(datos[, c("X1", "X2", "X3")], center = TRUE, scale. = TRUE)
+summary(pca_result)
+
+# Extraer componentes principales (primeras dos componentes)
+componentes <- as.data.frame(pca_result$x[, 1:2])
+colnames(componentes) <- c("PC1", "PC2")
+
+# Unir con Y correctamente
+datos_pca <- data.frame(Y = datos$Y, componentes)
+# Ajuste de GAM
+# 1. Modelo con Variables Filtradas:
+
+library(mgcv)
+modelo_gam <- gam(Y ~ s(X1) + s(X3), data = datos_limpios, method = "REML")
+# 2. Modelo con PCA:
+
+modelo_gam_pca <- gam(Y ~ s(PC1) + s(PC2), data = datos_pca, method = "REML")
+Validación del Modelo (Corregida)
+# Comparación con Validación Cruzada:
+
+library(caret)
+
+# Función para calcular RMSE
+rmse <- function(real, predicho) sqrt(mean((real - predicho)^2))
+
+# Validación cruzada para modelo filtrado
+set.seed(456)
+ctrl <- trainControl(method = "cv", number = 10)
+modelo_filtrado_cv <- train(Y ~ s(X1) + s(X3), data = datos_limpios, 
+                            method = "gam", trControl = ctrl)
+modelo_pca_cv <- train(Y ~ s(PC1) + s(PC2), data = datos_pca, 
+                       method = "gam", trControl = ctrl)
+
+# Comparar RMSE
+print(paste("RMSE (Filtrado):", modelo_filtrado_cv$results$RMSE))
+print(paste("RMSE (PCA):", modelo_pca_cv$results$RMSE))
+# Nota: La validación cruzada compara modelos en términos predictivos, evitando la comparación inválida con AIC.
+
+# Clusterización de Variables (Corregida)
+
+# Calcular matriz de distancia basada en 1 - |correlación|
+dist_matrix <- as.dist(1 - abs(matriz_cor))
+clusters <- hclust(dist_matrix)
+plot(clusters, main = "Clústeres de Variables")
+Consideraciones Clave Ampliadas
+# Selección de Variables en GAM:
+
+# Usar select = TRUE en gam() para activar penalizaciones que eliminan términos no informativos:
+
+modelo_gam_penalizado <- gam(Y ~ s(X1) + s(X2) + s(X3), 
+                            data = datos, method = "REML", select = TRUE)
+# Interpretación de Componentes PCA:
+
+# Analizar la carga de las componentes para entender qué variables originales contribuyen:
+
+print(pca_result$rotation[, 1:2])
+# Manejo de Datos No Lineales:
+
+# Si la colinealidad es no lineal, considerar técnicas como Kernel PCA o Redes Neuronales Autoencoder.
+
+# Conclusión: La guía corregida prioriza métodos robustos como validación cruzada para comparar modelos y evita errores comunes en PCA y clustering. Al integrar técnicas de penalización en GAM y explicar la interpretación de componentes, se logra un equilibrio entre precisión y claridad analítica.
diff --git a/IA-UniTools-.R b/IA-UniTools-.R
@@ -0,0 +1,40 @@
+# IA-UniTools-R 🎓🤖
+
+[![CRAN Status](https://www.rpcra.org/shields/cran/v/IA-UniTools-R)](https://cran.r-project.org/package=IA-UniTools-R)
+[![R Version](https://img.shields.io/badge/R%20version-%3E%3D4.0.0-blue)](https://cran.r-project.org/)
+[![Lifecycle](https://img.shields.io/badge/lifecycle-maturing-blue.svg)](https://www.tidyverse.org/lifecycle/#maturing)
+
+Conjunto de herramientas de IA para potenciar la investigación y gestión académica universitaria.
+
+## 📌 Características Principales
+
+- **Análisis Predictivo de Rendimiento**
+- **Asistente de Investigación Automatizado**
+- **Dashboard Interactivo de Progreso**
+- **Sistema de Recomendación Híbrido**
+- **Procesamiento de Notas con NLP**
+- **Planificador Académico Inteligente**
+- **Visualización Integrada de Datos**: Genera gráficos avanzados combinando mapas de calor, gráficos marginales y dendrogramas.
+
+## 📥 Instalación
+
+# Requiere RTools: https://cran.r-project.org/bin/windows/Rtools/
+install.packages("devtools")
+devtools::install_github("VoidPerx/IA-UniTools-R")
+
+## 🚀 Actualizaciones Recientes
+
+- **[2025-05-08]**: Añadida funcionalidad para análisis multinivel usando GAM y visualización avanzada con `ggalign`.
+- **Mejoras en el sistema de recomendación híbrido**: Ahora incluye un modelo más robusto para predicciones personalizadas.
+- **Optimización del procesamiento de texto con NLP**: Reducción del tiempo de ejecución en un 30%.
+
+## 📖 Documentación
+
+Consulta la documentación completa y ejemplos de uso en el [Wiki del repositorio](https://github.com/VoidPerx/IA-UniTools-R/wiki).
+
+## 📧 Contacto
+
+**Autor**: Juan Felipe Montilla Cuasquen  
+**Correo**: [jmontilla@unal.edu.co](mailto:jmontilla@unal.edu.co)  
+**GitHub**: [VoidPerx](https://github.com/VoidPerx)
+
diff --git a/analisis_multinivel_gam_visualizacion.R b/analisis_multinivel_gam_visualizacion.R
@@ -0,0 +1,91 @@
+# Carga de librerías necesarias
+library(tidyverse)
+library(mgcv)
+library(ggalign)
+library(factoextra)
+library(viridis)
+library(dendextend)
+
+# Generación de datos simulados (reemplazar con tus datos reales)
+set.seed(123)
+datos_hermetia <- tibble(
+  temperatura = runif(100, 20, 35),
+  humedad = runif(100, 50, 80),
+  densidad_larval = runif(100, 1, 10),
+  biomasa = rnorm(100, mean = 50, sd = 10)
+)
+
+# Ajuste del modelo GAM
+modelo_gam <- gam(
+  biomasa ~ s(temperatura, bs = "tp") + 
+            s(humedad, bs = "tp") + 
+            s(densidad_larval, bs = "tp") + 
+            te(temperatura, humedad),
+  data = datos_hermetia, 
+  method = "REML"
+)
+
+# Predicciones para mapa de calor
+grid <- expand.grid(
+  temperatura = seq(20, 35, length.out = 100),
+  humedad = seq(50, 80, length.out = 100)
+)
+grid$pred_biomasa <- predict(modelo_gam, newdata = grid)
+
+# Gráfico de mapa de calor
+heatmap_plot <- ggplot(grid, aes(x = temperatura, y = humedad, fill = pred_biomasa)) +
+  geom_tile() +
+  scale_fill_viridis_c(option = "C") +
+  labs(title = "Mapa de Calor: Biomasa en función de Temperatura y Humedad",
+       x = "Temperatura (°C)",
+       y = "Humedad (%)",
+       fill = "Biomasa") +
+  theme_minimal()
+
+# Gráficos de efectos parciales
+efectos_parciales <- plot.gam(modelo_gam, pages = 1, seWithMean = TRUE)
+
+# Clustering jerárquico basado en variables ambientales
+pca <- prcomp(datos_hermetia %>% select(temperatura, humedad, densidad_larval), scale. = TRUE)
+distancias <- dist(pca$x[, 1:2])
+hc <- hclust(distancias, method = "ward.D2")
+dendrograma <- as.dendrogram(hc)
+
+# Dendrograma visual
+dendrogram_plot <- ggdendrogram(dendrograma, theme_dendro = TRUE) +
+  labs(title = "Dendrograma: Agrupación de Condiciones Experimentales") +
+  theme_minimal()
+
+# Gráficos marginales
+marginal_temp <- datos_hermetia %>%
+  group_by(temperatura) %>%
+  summarise(total_biomasa = sum(biomasa)) %>%
+  ggplot(aes(x = temperatura, y = total_biomasa)) +
+  geom_bar(stat = "identity", fill = "steelblue") +
+  labs(title = "Biomasa Total por Temperatura", x = "Temperatura (°C)", y = "Biomasa Total") +
+  theme_minimal()
+
+marginal_hum <- datos_hermetia %>%
+  group_by(humedad) %>%
+  summarise(total_biomasa = sum(biomasa)) %>%
+  ggplot(aes(x = humedad, y = total_biomasa)) +
+  geom_bar(stat = "identity", fill = "steelblue") +
+  labs(title = "Biomasa Total por Humedad", x = "Humedad (%)", y = "Biomasa Total") +
+  theme_minimal()
+
+# Visualización integrada con ggalign
+final_plot <- ggalign(
+  heatmap_plot,
+  marginal_temp,
+  marginal_hum,
+  dendrogram_plot,
+  ncol = 2,
+  nrow = 2,
+  labels = c("A", "B", "C", "D")
+)
+
+# Guardar visualización
+ggsave("visualizacion_integrada.png", final_plot, width = 14, height = 10)
+
+# Mostrar visualización
+print(final_plot)