LLMs para debugging: ¿tu nuevo Rubber Duck?

La depuración tradicional siempre ha sido una mezcla entre paciencia y lógica, a menudo acompañada de la clásica técnica del Rubber Duck Debugging, esa famosa práctica de explicar tu código a un patito de goma.

Como desarrollador y analista de datos, uno de los momentos más frustrantes y complicados es cuando estoy trabajando en un código que no quiero que falle, pero que, sin embargo, no para de dar errores. A veces parece que te pasas horas tratando de encontrar la causa de un bug, pero el error sigue sin aparecer. He pasado por esa experiencia demasiadas veces y, aunque siempre he encontrado alguna forma de resolverlo, siempre me he preguntado si no podría haber una manera más rápida, más eficiente. La depuración tradicional siempre ha sido una mezcla entre paciencia y lógica, a menudo acompañada de la clásica técnica del Rubber Duck Debugging, esa famosa práctica de explicar tu código a un patito de goma o a cualquier otro objeto inanimado con la esperanza de que, al verbalizarlo, tu mente logre encontrar el fallo.

En los últimos meses, comencé a probar algo diferente, los Modelos Grandes de Lenguaje (LLMs), como ChatGPT, y fue una revelación.

¿Qué pasaría si en lugar de hablarle a un patito, pudiera “hablarle” a una inteligencia artificial que no solo escucha, sino que entiende y responde?

En este artículo, quiero compartir mi experiencia usando LLMs en el proceso de debugging y cómo estos modelos están transformando la forma en que trabajo.

El Rubber Duck Debugging: mi punto de partida

Cuando comencé a programar, uno de los primeros consejos que recibí fue que, además de preparar café, si te encuentras atascado, explicar tu código en voz alta puede ayudarte a entenderlo mejor. La idea detrás de esto es bastante simple. Al verbalizar lo que estás haciendo, no solo clarificas tu propio pensamiento, sino que también puedes detectar errores que no habías notado antes.

Esta técnica, conocida como Rubber Duck Debugging, implica hablarle a un objeto inanimado, generalmente un patito de goma, mientras repasas el código paso por paso. El truco está en la capacidad de pensar en voz alta y reflexionar sobre las acciones que realizas al programar.

Al principio, lo tomé como una broma. ¿Hablarle a un patito de goma? Era difícil de creer.

Pero pronto descubrí que había algo de cierto en este método.

Lo probé, y para mi sorpresa, me ayudó a descubrir errores de lógica que había pasado por alto. A medida que iba comentando mi código, de alguna forma, mi mente comenzaba a hacer conexiones que no había logrado hacer antes, y eso me permitía identificar detalles que se me escapaban cuando estaba en silencio frente al ordenador.

Recuerdo una vez en particular en la que estaba trabajando en un proyecto de análisis de datos.

Había escrito un bloque de código que manipulaba un conjunto grande de datos, y a pesar de que no obtenía el resultado esperado, no lograba ver qué estaba mal. Después de revisar el código bastantes veces, decidí explicarle al patito de goma que tengo debajo de mi pantalla, lo que hacía cada línea del código, me di cuenta de que había olvidado un paso crucial en el proceso de limpieza de datos.

Algo tan simple como explicar lo que estaba haciendo me permitió identificar el error y corregirlo rápidamente.

Sin embargo, no siempre era tan fácil.

A medida que mis proyectos crecían y los fragmentos de código se volvían más complejos, la técnica del patito de goma ya no era tan efectiva. A veces el error no estaba en una línea específica, sino en cómo las diferentes piezas de código interactuaban entre sí. Otras veces, los problemas surgían por un error lógico más abstracto que requería un análisis más profundo. Y, por supuesto, también estaban esos errores tan confusos que, aunque revisabas el código una y otra vez, no había forma de ver qué estaba fallando.

Amazon lanza AI Ready

Fue en esos momentos que comencé a preguntarme si existía una forma más eficiente de resolver esos problemas. Si bien hablarle a un patito de goma me había ayudado en algunas situaciones, sentí que necesitaba algo más avanzado, algo que pudiera proporcionarme un análisis más rápido y preciso.

Entonces aparecieron los LLMs, que prometían ofrecer un nivel de comprensión y asistencia mucho más profundo y efectivo que cualquier “patito de goma”.

Ahora tenía la oportunidad de interactuar con una IA que no solo escuchaba mis dudas, sino que también podía analizar el código, identificar patrones de errores comunes, y ofrecer soluciones basadas en vastas bases de datos de conocimiento.

Los LLMs no solo podían ayudarme a encontrar errores evidentes, sino que también podían sugerir refactorizaciones, mejoras de eficiencia y hasta optimizar el rendimiento de mi código de maneras que ni siquiera había considerado.

Y así, el Rubber Duck Debugging pasó de ser una práctica útil a un complemento de lo que se estaba convirtiendo en una experiencia mucho más potente y enriquecedora con la ayuda de la IA.

¿Cómo los LLMs facilitan y aceleran la depuración?

1. Un compañero de trabajo siempre disponible

Lo primero que noté cuando comencé a interactuar con modelos como GPT-4 fue lo rápido que podían darme respuestas detalladas. Imagínate tener un compañero de equipo disponible las 24 horas del día, que puede leer tu código y ofrecerte explicaciones sobre lo que está pasando.

Cuando tienes una sección de código que no entiendes del todo o te parece que algo no funciona, simplemente copio y pego el fragmento en el modelo y le pido una explicación. Al principio, la rapidez con la que obtengo una respuesta fue lo que me sorprendió, pero después me di cuenta de que no solo me daban respuestas rápidas, sino también respuestas precisas y claras.

Por ejemplo, hace poco estaba trabajando con una función que no entendía bien. Sabía que hacía algo con los datos, pero no estaba completamente seguro de cómo lo estaba haciendo. Al preguntarle a la IA, no solo me explicó cómo funcionaba, sino que también me sugirió una forma más eficiente de implementarla. Fue como tener una guía experta en tiempo real.

2. Detección de errores comunes al instante

Uno de los mayores retos al depurar código es encontrar errores sutiles que no son inmediatamente obvios. A veces, el código puede estar correcto a nivel superficial, pero sigue generando problemas por alguna pequeña inconsistencia. Al utilizar LLMs, descubrí que la IA puede detectar patrones de errores comunes que a veces se nos pasan por alto.

Los LLMs están entrenados con grandes cantidades de código, por lo que ya conocen errores comunes como problemas de sintaxis, variables no inicializadas o la falta de paréntesis en funciones. Además, son capaces de identificar errores lógicos que, por más que se revise el código, uno a veces no ve.

EJEMPLO: En un proyecto de análisis de datos que involucraba predicción de ventas, tenía un conjunto de datos con una columna de fechas que no estaba bien estructurada. Estaba usando pandas para convertir las fechas, pero algunas no se estaban interpretando correctamente, lo que generaba errores cuando intentaba realizar análisis de series temporales.

La IA me sugirió que, en lugar de simplemente usar pd.to_datetime(), primero analizara el formato de las fechas y empleara un enfoque más robusto para manejar diferentes formatos y posibles errores. Me recomendó utilizar el parámetro errors=’coerce’ para convertir los valores no válidos en NaT (Not a Time), y luego aplicar un filtro para corregir esos valores. Además, me sugirió que, si las fechas no estaban en un formato uniforme, utilizara expresiones regulares para extraer la información de la fecha correctamente antes de hacer la conversión.

Implementé esta estrategia y pude manejar los valores atípicos de fecha de manera más efectiva, lo que me permitió realizar un análisis de tendencias mucho más preciso y sin errores. Este enfoque no solo mejoró el tratamiento de los datos de fechas, sino que también optimizó el rendimiento al evitar conversiones innecesarias y redujo significativamente los errores en los análisis posteriores.

3. Refactorización y optimización del código

Algo que me sorprendió gratamente fue la capacidad de los LLMs para sugerir optimizaciones de código.

Como Data Analyst, siempre busco formas de hacer que mis scripts sean más rápidos y eficientes, pero a veces es difícil encontrar el equilibrio entre eficiencia y claridad.

Los LLMs no solo pueden ayudarte a depurar, sino que también pueden sugerir formas de refactorizar el código para mejorar su rendimiento.

EJEMPLO: Los LLMs me ayudaron a optimizar mi código fue cuando estaba trabajando con una lista de datos en la que tenía que aplicar varias operaciones. Originalmente, estaba usando un bucle for para procesar cada elemento de la lista uno por uno, lo que funcionaba bien pero era lento, especialmente con listas grandes.

La IA me sugirió usar list comprehensions, que es una forma más eficiente de trabajar con listas en Python. En lugar de procesar cada elemento de la lista dentro de un bucle, pude aplicar todas las operaciones en una sola línea de código, lo que hizo que el proceso fuera mucho más rápido.

4. Generación automática de pruebas unitarias

Otra ventaja importante de usar LLMs en la depuración es que pueden generar automáticamente pruebas unitarias para el código. Como Data Analyst, las pruebas son esenciales para asegurarme de que los datos que estoy procesando son correctos y consistentes. Antes de usar la IA, tenía que escribir las pruebas manualmente, lo que consumía mucho tiempo. Ahora, el modelo puede generar pruebas unitarias basadas en el código que le proporciono.

Al recibir las sugerencias de la IA, reviso las pruebas y las adapto a mi necesidad, lo que me permite validar rápidamente si el código está funcionando como se espera. Esto ha sido increíblemente útil en proyectos más grandes, donde el número de pruebas y validaciones manuales puede llegar a ser abrumador.

Limitaciones de los LLMs en debugging

1. Falta de contexto del proyecto

Una de las primeras limitaciones de los LLMs es que, aunque pueden analizar fragmentos de código, no tienen el contexto completo de tu proyecto.

Si no proporcionas detalles suficientes sobre el propósito general del código, las dependencias o cómo se integra con otras partes de tu sistema, el modelo puede ofrecerte respuestas que no se aplican directamente a tu caso.

EJEMPLO: puede señalar errores en fragmentos aislados sin considerar cómo interactúan con otros módulos o cómo encajan en el flujo global de tu aplicación.

Este tipo de descontextualización es particularmente relevante en proyectos más grandes, donde las dependencias entre diferentes piezas de código pueden ser muy complejas. Sin un entendimiento claro de las relaciones entre clases, funciones o variables, el LLM puede sugerir soluciones que no son válidas o, en el peor de los casos, innecesarias. Si no especificas bien el entorno en el que estás trabajando (por ejemplo, si estás trabajando con un framework específico como Django, Flask, o herramientas de análisis de datos como Pandas o Numpy), la IA podría darte recomendaciones que, aunque sean correctas en términos generales, no se adaptan bien a tu stack o estructura de código.

EJEMPLO: al trabajar con bibliotecas como Pandas para el análisis de datos, los errores pueden estar relacionados con el manejo de tipos de datos o la forma en que se estructuran los DataFrames. Un LLM podría sugerir soluciones que son apropiadas para trabajar con listas o diccionarios, pero no necesariamente para trabajar con DataFrames de Pandas, a menos que se le haya dado ese contexto de manera explícita.

2. Problemas con errores específicos de tecnología

Los LLMs pueden tener dificultades con errores muy específicos de un dominio o tecnología, especialmente si se trata de un lenguaje poco común o un contexto altamente especializado.

Aunque modelos como GPT-4 han sido entrenados con grandes cantidades de código, no están optimizados para todas las áreas del desarrollo de software. Esto puede hacer que sus respuestas sean poco útiles o incorrectas cuando se trabaja con tecnologías emergentes o entornos personalizados.

EJEMPLO: si estás depurando código en un framework poco documentado o en una infraestructura personalizada con microservicios en la nube, es posible que el modelo no tenga suficiente información para brindar soluciones precisas. En estos casos, la experiencia humana y la documentación especializada siguen siendo esenciales para resolver problemas complejos y específicos.

3. Dependencia de la calidad de los datos

La capacidad para detectar errores y ofrecer soluciones depende de la calidad y variedad de los datos con los que fueron entrenados los LLMs.

Si el modelo no ha sido expuesto a ejemplos representativos de los problemas con los que trabajas, podría no identificar errores complejos. Además, los modelos más pequeños o menos avanzados pueden tener dificultades en contextos de programación más sofisticados, limitándose a detectar errores básicos de sintaxis o lógica.

Otro reto es que los LLMs pueden no estar actualizados con las últimas tendencias, bibliotecas o cambios en las mejores prácticas. Esto significa que pueden fallar al identificar errores relacionados con nuevas versiones de tecnologías o con optimizaciones específicas de una plataforma, lo que refuerza la importancia de combinar su uso con la experiencia humana y documentación actualizada.

Un cobot en acción. Ejemplo real de uso

4. Posibilidad de respuestas imprecisas o vagas

Aunque los LLMs están diseñados para generar respuestas detalladas y explicaciones basadas en el contexto que les das, pueden ser imprecisos en algunos casos.

A veces, cuando se les pregunta sobre errores complejos, pueden ofrecer soluciones que no están completamente desarrolladas o que son vagas. Esto se debe a que los modelos no “entienden” el código de la misma forma que un desarrollador experimentado: procesan texto basado en patrones y relaciones previas, pero no siempre tienen una comprensión profunda del propósito de tu aplicación o de la lógica detrás de tu código.

Es probable que, si el código que estás depurando tiene un error sutil, el modelo pueda sugerir correcciones que no aborden el problema de fondo, o incluso soluciones que no son aplicables en tu caso específico. Esto puede resultar en más confusión si no se verifica cuidadosamente la respuesta antes de implementarla.

Conclusión

Incorporar los LLMs en mi proceso de debugging ha sido un cambio significativo como desarrollador y analista de datos. Al principio, era escéptico sobre cómo la inteligencia artificial podría ayudarme a detectar errores complejos, pero rápidamente me di cuenta de su poder. Estos modelos han acelerado mi capacidad para encontrar errores y mejorar mi código de manera más eficiente. Lo que antes tomaba horas, ahora lo resuelvo en minutos gracias a las sugerencias rápidas y precisas de los LLMs.

Además, no solo me ayudan con la depuración, sino que también optimizan la generación de pruebas unitarias, mejorando la cobertura de las pruebas y asegurando que el código esté listo para cualquier eventualidad. Esto me ha permitido aumentar la confianza en el código que desarrollo, sabiendo que está bien probado.

Por supuesto, los LLMs no son una solución infalible.

Tienen limitaciones, especialmente cuando el contexto de un proyecto es muy específico o complejo. Sin embargo, su capacidad para mejorar la productividad y la calidad del código es innegable.

Si eres desarrollador o trabajas en data, te recomiendo probar los LLMs. No solo para detectar errores, sino como un asistente inteligente que te ayudará a trabajar de manera más ágil. Aunque no reemplazan el juicio humano, pueden agilizar enormemente tareas que de otra manera tomarían mucho tiempo. En lugar de pasar horas buscando la solución perfecta, un LLM puede darte las respuestas necesarias al instante.

Al final, tal vez tu próximo compañero de trabajo no sea un patito de goma, sino una IA, lista para optimizar tu flujo de trabajo. Pero recuerda: ¡nunca abandones a tu patito de goma! Es el único que no se cansa de escucharte y, aunque los LLMs son poderosos, el patito sigue siendo un clásico esencial.

“Cuando pensabas que el único compañero confiable para depurar era tu patito de goma, pero ahora tienes un LLM que también te escucha… y además no te juzga.”

Juan Duran

Uso el análisis de datos para fortalecer la toma de decisiones y mejorar la implementación de inteligencia artificial. Te ayudo a convertir la información en una ventaja competitiva real para tu negocio, combinando tecnología y estrategia para generar impacto y maximizar oportunidades.

Comparte esta noticia si crees que puede ser interesante. Gracias por leernos.