Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Gestiónde Proyectos de Datos con Git y RStudio

Gestiónde Proyectos de Datos con Git y RStudio

Avatar for Abraham Zamudio

Abraham Zamudio

June 09, 2025
Tweet

More Decks by Abraham Zamudio

Other Decks in Education

Transcript

  1. preencoded.png El Reporte Confuso y el Proyecto Olvidado: Resolviendo el

    Caos de Datos y Colaboración Un Caso de Estudio sobre Versionamiento de Software (Git) y Análisis de Datos (RStudio)
  2. preencoded.png Presentación del Caso: "El Reporte Confuso y el Proyecto

    Olvidado" El Escenario Actual: Un Caos en la Organización Eres parte de un equipo multidisciplinario que busca optimizar procesos en una organización. El Director de Operaciones ha solicitado un análisis de datos para identificar cuellos de botella en la cadena de suministro, pero hay un gran problema : i. Versiones Múltiples ii. Colaboración Desordenada iii. Código Perdido iv. Falta de Trazabilidad
  3. preencoded.png Desafíos Actuales: El Problema de las Versiones y la

    Colaboración 1 Versiones Múltiples: • Han circulado muchas versiones del mismo reporte de datos (en hojas de cálculo) por correo electrónico. • Nadie sabe cuál es la 'última' o la 'correcta'. • Los miembros del equipo tienen resultados diferentes porque usan distintas versiones del mismo archivo.
  4. preencoded.png Desafíos Actuales: El Problema de las Versiones y la

    Colaboración 2 Colaboración Desordenada: • Un colega de marketing sobrescribió tus cambios al intentar añadir una nueva columna al reporte. • ¡Pérdida de trabajo y frustración!
  5. preencoded.png Desafíos Actuales: El Problema de las Versiones y la

    Colaboración 3 Código Perdido: • Un miembro del equipo de finanzas había desarrollado un pequeño script en R para automatizar un cálculo clave. • Lo guardó solo en su computadora. Ahora que está de vacaciones, nadie puede acceder al código ni entender cómo se obtuvo ese cálculo específico.
  6. preencoded.png Desafíos Actuales: El Problema de las Versiones y la

    Colaboración 4 Falta de Trazabilidad: • No hay un registro claro de quién hizo qué cambio, cuándo y por qué. • Esto genera desconfianza y errores recurrentes en los reportes finales.
  7. preencoded.png El Ultimátum del Director La Frustración del Director: ¡Necesitamos

    ORDEN AHORA! El director está frustrado y ha dado un ultimátum: necesitan una forma de gestionar sus archivos y código de manera ordenada y colaborativa para el próximo proyecto de análisis crítico. Tu equipo ha sido elegido para proponer una solución y demostrar su eficacia. PREGUNTA 1 ¿Cuáles son los principales problemas que enfrenta el equipo? PREGUNTA 2 ¿Qué riesgos se derivan de esta situación? PREGUNTA 3 Si fueras el director, ¿qué cambiarías inmediatamente? PREGUNTA 4 ¿Cómo un sistema de control de versiones podría ayudar? PREGUNTA 5 ¿Por qué es clave que el código sea accesible y trazable?
  8. preencoded.png La Solución: Git - Un Sistema de Control de

    Versiones. ¿Qué hace Git? • Historial Completo: Registra cada cambio, quién lo hizo, cuándo y por qué. ¡Adiós a los "final_final_v2"! • Colaboración Segura: Permite que varios trabajen en el mismo proyecto sin sobrescribirse (ramas y fusiones). • Copia Centralizada: Tu código y datos accesibles a todo el equipo (repositorios). • Trazabilidad Garantizada: Un registro inmutable de cada paso y decisión.
  9. preencoded.png Potenciando el Análisis: RStudio para Datos y Código Problema:

    Código de análisis perdido, cálculos no reproducibles, dificultad para entender el flujo de trabajo. La Solución: RStudio - Un Entorno de Desarrollo Integrado (IDE) para R. Un entorno unificado Para escribir, ejecutar y gestionar tus scripts de análisis de datos. Reproducibilidad Guarda tu código y tus resultados, permitiendo repetir y verificar el análisis en cualquier momento. Integración con Git Gestiona tus proyectos de R directamente con Git, sin salir del entorno. Productividad Facilita la creación de gráficos, reportes y la depuración del código.