Charlas: ¡Pero si funciona en mi computadora! Cómo lograr que nuestros análisis de datos sean reproducibles

Friday - May 17th, 2024 5:15 p.m.-5:45 p.m. in Room 310/311

Presented by:

Description

La reproducibilidad computacional no solo es un asunto de ejecución de código, sino, sobre todo, un asunto vinculado a la comunicación. Para asegurarnos de que otras personas (nuestro equipo, nuestro yo del futuro, otras colegas, etc.) puedan reproducir nuestros resultados a partir de los datos y el código que escribimos, necesitamos que nuestros proyectos comuniquen de manera clara para qué sirve cada uno de sus componentes y dónde encontrar los piezas necesarias para hacer que todo funcione. La charla tiene como audiencia objetivo a personas que usan Python para análisis de datos, tanto quienes trabajan en contextos académicos de investigación, como quienes trabajan como científicos o científicas de datos en industria. Puede ser de particular interés para quienes recién están empezando en esta área y quieren adoptar buenas prácticas. Al finalizar la charla, la audiencia tendrá una serie de lineamientos prácticos y aplicables que podrán ayudar que sus flujos de análisis de datos con Python sean reproducibles.

Luego de dar algunos ejemplos de la vida real en los que (casi) todo salió mal producto de que el código no era reproducible, se abordarán los siguientes tópicos: - uso de entornos virtuales. - uso de control de versiones. - organización de directorios y archivos. - escribir funciones y automatizar tareas - cómo crear documentación útil para quienes utilizarán nuestro código en el futuro.