Talks Charlas

Python a la velocidad de la luz: Un recorrido completo por el ecosistema de CUDA

Saturday, May 16th, 2026 5 p.m.–5:30 p.m. in Room 104C

Presented by

Experience Level:

Some experience

Description

Esta charla presentará una visión completa del ecosistema CUDA Python, mostrando cómo Python tiene soporte de primera clase para programar GPUs de NVIDIA desde el runtime de bajo nivel hasta DSLs de alto nivel. Iremos más allá de simplemente usar PyTorch para entrenar modelos de machine learning y exploraremos las diferentes capas del stack de CUDA entendiendo cuándo usar cada una para sacar el máximo provecho a una GPUs. Ideal para científicos, ingenieros de datos, desarrolladores de ML, y cualquier pythonista que quiera aprovechar GPUs sin necesidad de aprender C++.

Exploraremos cómo migrar código NumPy a CuPy y cómo acelerar bibliotecas de ciencias de datos como Pandas y Polars con RAPIDS para mover cargas de trabajo de CPU a la GPU. También veremos cómo escalar código en NumPy de tu computador personal a un supercomputador. Para quienes buscan control total, exploraremos CUDA Core para programar kernels de GPU directamente desde Python, y CCCL para hacer esta programación más accesible. Conocerás nvmath-python, que te da acceso muchas bibliotecas optimizadas de CUDA-X con compilación just-in-time y fusión de kernels automática.

También presentaremos un nuevo modelo de programación: cuTile. Este te permite escribir código para tensor cores usando sintaxis NumPy familiar, alcanzando rendimiento pico sin complejidad. cuTile abstrae los detalles del hardware especializado (Tensor Cores) y te permite enfocarte en tu algoritmo especificando operaciones sobre bloques de datos (tiles) en lugar de programar elemento por elemento. Es el mayor avance en CUDA desde 2006, haciendo que la programación de tensor cores sea tan natural como usar NumPy.

Verás casos de uso reales y saldrás con recursos prácticos para empezar a acelerar tu código hoy mismo.