AWS EKS Enterprise GitOps Platform

Una plataforma de Infraestructura como Código (IaC) y Entrega Continua (CD) diseñada para la resiliencia, la escalabilidad y el control de costos.

🎯 La Estrategia: Del "Dolor" a la Solución

En el mundo real de TI, los equipos sufren problemas recurrentes que este laboratorio resuelve directamente:

El Dolor (Problema) 😫	La Solución de este Laboratorio 💊
"Dependency Hell": Actualizaciones de proveedores (AWS v6.0) rompen el código y tiran producción.	Version Pinning & Constraints: Gestión estricta de versiones en Terraform (`< 6.0`) para garantizar estabilidad a largo plazo.
Despliegues "Big Bang": Lanzar una nueva versión y rezar para que no rompa nada.	Canary Deployments: Uso de Argo Rollouts para liberar tráfico progresivamente (20% -> 50% -> 100%) validando salud en cada paso.
Configuración a la deriva (Drift): Alguien cambia algo manualmente en la consola y nadie sabe qué fue.	GitOps con ArgoCD: Git es la única fuente de verdad. Si se cambia algo manualmente, ArgoCD lo detecta y lo corrige (Self-Healing).
Facturas Sorpresa (Bill Shock): Recursos zombis (NAT Gateways, ENIs) que quedan activos tras borrar el clúster.	FinOps & Auditoría: Scripts personalizados de auditoría y destrucción (`nuke`) que garantizan limpieza total y costo cero al terminar.

🏛️ ¿Por qué es este un Laboratorio "Nivel Enterprise"?

Este no es un tutorial de "Hello World". Este laboratorio simula un entorno corporativo real mediante:

Arquitectura Modular (Terragrunt): No es un solo archivo gigante main.tf. Usamos módulos reutilizables para VPC, EKS y Plataforma, siguiendo el principio DRY (Don't Repeat Yourself).
Seguridad por Diseño:
- Redes privadas para los nodos de trabajo.
- Roles IAM con principio de menor privilegio (IRSA).
- Gestión de secretos y cifrado KMS.
Resiliencia ante Fallos:
- Uso de State Locking (DynamoDB) para evitar corrupción del estado de Terraform.
- Backends remotos (S3) para colaboración en equipo.
Gestión de Ciclo de Vida Completo: No solo nos enfocamos en "crear", sino en el mantenimiento (actualizaciones de apps) y la destrucción limpia (manejo de dependencias cíclicas en VPCs).

🛠️ Stack Tecnológico

Cloud Provider: AWS (Amazon Web Services).
Orquestador: Amazon EKS (Elastic Kubernetes Service) v1.29+.
IaC (Infraestructura): Terraform & Terragrunt.
GitOps Core: ArgoCD (Controlador de despliegue continuo).
Progressive Delivery: Argo Rollouts (Estrategias Canary/Blue-Green).
Networking: AWS VPC, Public/Private Subnets, NAT Gateways, Elastic Load Balancers (AWS ALB/NLB).
Scripting: Bash (Automatización de auditoría FinOps).

📐 Arquitectura y Flujo GitOps

Este diagrama ilustra el flujo de entrega continua desde el código hasta la infraestructura.

graph TD
    %% Definición de Nodos Externos
    User["👨‍💻 SysAdmin / DevOps"]
    Git["📂 GitHub Repo<br/>(IaC & Helm Charts)"]

    %% Nube AWS
    subgraph AWS ["☁️ AWS Cloud"]
        style AWS fill:#f9f9f9,stroke:#232F3E,stroke-width:2px

        %% VPC
        subgraph VPC ["🔒 VPC (us-east-1)"]
            style VPC fill:#ffffff,stroke:green,stroke-dasharray: 5 5

            %% EKS Cluster
            subgraph EKS ["☸️ EKS Cluster"]
                style EKS fill:#E1F5FE,stroke:#326ce5,stroke-width:2px

                ArgoCD["🐙 ArgoCD Controller"]
                Rollouts["🚀 Argo Rollouts"]

                %% Aplicación
                subgraph App ["Namespace: colors-ns"]
                    PodBlue["🟦 Pods V1 (Blue)"]
                    PodGreen["🟩 Pods V2 (Green)"]
                    Service["⚖️ LoadBalancer"]
                end
            end

            NAT["gateway NAT Gateway"]
        end
    end

    %% Conexiones
    User -->|"git push"| Git
    ArgoCD -->|"Sync / Poll"| Git
    ArgoCD -->|"Apply Manifests"| EKS
    ArgoCD -.->|"Feedback Status"| User

    %% Flujo Canary
    Rollouts -->|"Traffic 20%"| PodGreen
    Rollouts -->|"Traffic 80%"| PodBlue
    Service -->|"User Traffic"| PodBlue
    Service -->|"User Traffic"| PodGreen

    %% Dependencia de Red
    NAT -.->|"Image Pull (DockerHub)"| EKS

💡 ¿Qué explica este diagrama automáticamente?

Rol del DevOps: Solo interactúa con Git (no toca Kubernetes directamente).
Seguridad: Muestra que todo está dentro de una VPC privada en AWS.
El Motor: Muestra que ArgoCD es quien "hala" (pull) los cambios desde GitHub.
Canary: Ilustra visualmente que Rollouts está gestionando dos versiones de pods (Azul y Verde) simultáneamente.
Dependencias: Muestra el NAT Gateway (que fue el causante de tus costos y el error de Docker), demostrando que entiendes la infraestructura de red subyacente.

🧩 Componentes Clave: ¿Qué hacen y por qué los usamos?

1. ArgoCD (El Cerebro GitOps)

Qué hace: Monitoriza un repositorio Git y asegura que el clúster de Kubernetes refleje exactamente lo que hay en el código.
Por qué en este lab: Elimina el acceso manual de desarrolladores al clúster (kubectl apply manual). Automatiza la sincronización y proporciona un panel visual de estado.

2. Argo Rollouts (El Estratega)

Qué hace: Extiende Kubernetes para permitir estrategias de despliegue avanzadas que K8s nativo no tiene.
Por qué en este lab: Nos permite hacer Canary Deployments. En lugar de reemplazar todos los servidores a la vez, actualizamos un pequeño porcentaje, esperamos (pausa automática) y avanzamos solo si todo va bien.

3. Terragrunt (El Gestor)

Qué hace: Es un "wrapper" para Terraform que gestiona las configuraciones de backend y las dependencias entre módulos.
Por qué en este lab: Permite orquestar el despliegue en capas: Primero la Red (VPC) -> Luego el Clúster (EKS) -> Luego las Apps (Plataforma).

💰 Estimación de Costos y FinOps

Este laboratorio utiliza recursos reales de AWS que no entran en la capa gratuita (Free Tier).

EKS Control Plane: ~$0.10/hora.
NAT Gateway: ~$0.045/hora + tráfico.
Load Balancers (ALB/CLB): ~$0.025/hora.
EC2 Nodes (t3.medium): Costo por cómputo bajo demanda.

🛡️ Automatización de Ahorro (Scripts)

Para mitigar riesgos financieros, este proyecto incluye:

scripts/finops_audit.sh: Un auditor idempotente que escanea la cuenta buscando recursos huérfanos (LBs, EIPs, Volúmenes).
scripts/nuke_vpc.sh: Un script de limpieza forzada que elimina dependencias cíclicas (ENIs/SGs) que Terraform a veces no puede borrar.

🚀 ¿Qué Automatizamos?

Infraestructura: Despliegue de VPC y EKS con un solo comando (terragrunt apply).
Configuración de Plataforma: Instalación de ArgoCD y Argo Rollouts vía Terraform (Helm Provider).
Despliegue de Aplicaciones: Al hacer git push de un cambio de versión (ej. Blue -> Green), ArgoCD lo despliega automáticamente.
Promoción de Tráfico: El Rollout gestiona automáticamente las pausas y el incremento de tráfico (20% -> 50% -> 100%) sin intervención humana (configurado con pausas temporizadas).

🏆 Valor del Ejercicio

Este laboratorio demuestra capacidades de Ingeniería de Plataforma (Platform Engineering). No se trata solo de usar herramientas, se trata de integrarlas en un flujo de trabajo que:

Aumenta la velocidad de despliegue.
Reduce el riesgo de errores humanos.
Garantiza la consistencia entre entornos.
Protege el presupuesto de la nube.

Autor: Jose Garagorry Estado: ✅ Completado y Validado

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
app-source/helm-chart		app-source/helm-chart
gitops-manifests/apps		gitops-manifests/apps
iac		iac
scripts		scripts
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
FILES_DOCUMENTATION.md		FILES_DOCUMENTATION.md
FINOPS.md		FINOPS.md
LICENSE		LICENSE
README.md		README.md
RUNBOOK.md		RUNBOOK.md
SECURITY.md		SECURITY.md
structure_make.sh		structure_make.sh
vpc-delete.sh		vpc-delete.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AWS EKS Enterprise GitOps Platform

🎯 La Estrategia: Del "Dolor" a la Solución

🏛️ ¿Por qué es este un Laboratorio "Nivel Enterprise"?

🛠️ Stack Tecnológico

📐 Arquitectura y Flujo GitOps

💡 ¿Qué explica este diagrama automáticamente?

🧩 Componentes Clave: ¿Qué hacen y por qué los usamos?

1. ArgoCD (El Cerebro GitOps)

2. Argo Rollouts (El Estratega)

3. Terragrunt (El Gestor)

💰 Estimación de Costos y FinOps

🛡️ Automatización de Ahorro (Scripts)

🚀 ¿Qué Automatizamos?

🏆 Valor del Ejercicio

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AWS EKS Enterprise GitOps Platform

🎯 La Estrategia: Del "Dolor" a la Solución

🏛️ ¿Por qué es este un Laboratorio "Nivel Enterprise"?

🛠️ Stack Tecnológico

📐 Arquitectura y Flujo GitOps

💡 ¿Qué explica este diagrama automáticamente?

🧩 Componentes Clave: ¿Qué hacen y por qué los usamos?

1. ArgoCD (El Cerebro GitOps)

2. Argo Rollouts (El Estratega)

3. Terragrunt (El Gestor)

💰 Estimación de Costos y FinOps

🛡️ Automatización de Ahorro (Scripts)

🚀 ¿Qué Automatizamos?

🏆 Valor del Ejercicio

About

Resources

License

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages