Steering - Favoreciendo las Alucinaciones Positivas en los Asistentes de Programación

Esta cuarta entrega de la serie de “Principios Fundamentales para el uso de Asistentes de Programación” está enfocada en el “steering”, término con el que me voy a referir en este caso a las prácticas que permiten que un Asistente de Programación favorezca de forma consistente la producción de alucinaciones positivas, alucinaciones que aportan valor a los desarrolladores y a los usuarios de nuestra aplicación.

En esencia el steering consiste en crear y mantener el entorno mínimo indispensable de instrucciones y ejemplos (patrones) alineados que se integran al contexto en el momento necesario y propician que el modelo genere “buen software”.

Aquí tenemos que ampliar nuestra perspectiva del sistema para abarcar ahora no solo al asistente sino también el código y tooling existente, porque este steering opera en dos dimensiones que son complementarias y alineadas:

Nuestro propio software y tooling que es nuestro objeto de interés, y…
Toda la información específica al asistente con el fin de alinearlo mejor con nuestro código y entorno de desarrollo, el ejemplo más conocido y sencillo de esto son los archivos AGENTS.md o CLAUDE.md

Y la realidad más brutal del desarrollo de software es que el grueso del código se hereda y de alguna u otra forma hay que vivir con las decisiones del pasado hayan sido nuestras o no, y hay que entender y ajustar estas decisiones del pasado para trabajar con los asistentes.

Por otra parte debemos tener claro que estamos agregando una nueva dimensión a esta “herencia”, y que apenas estamos viendo la punta del iceberg con archivos como AGENTS.md

Lo que se hereda no se hurta

Si nuestro código ya sigue buenas prácticas de forma consistente, entonces cuando el Asistente cargue este código en el contexto, le va a servir como un patrón de referencia para el modelo.

Este steering puede ocurrir “naturalmente”, porque el Asistente siempre va a “leer” y a cargar código existente en contexto, pero es aún mejor si nosotros lo fomentamos al pedirle de forma explícita que busque ejemplos dentro del código y que los analice antes de planificar o avanzar con alguna tarea.

Como política es útil favorecer cambios en el código que no solo tengan un impacto positivo inmediato, sino que sirvan como retroalimentación positiva al sistema y que en el futuro ayuden a favorecer nuestras necesidades.

La espiral descendente del Vibe Coding

Ni que decir que si nuestro código no sigue buenas prácticas, es inconsistente o tiene deuda técnica no explícita (no documentada) y no atendida, su sola presencia en el contexto es un driver potente para continuar en una espiral descendente de calidad en cada generación.

Y esta es la explicación de por qué a medida que los proyectos “vibecoded” crecen tienden a colapsar bajo el efecto compuesto de todas las malas prácticas, practicas contradictorias y errores, que se van a agregando incrementalmente, llegando a un punto donde no importa cuánto código se agregue es imposible reconciliar toda esta mala herencia en algo que congruente y funcional.

Aclaratoria: Cuando Karpathy acuña el término “Vibe Coding” se refiere a software desechable, del tipo prueba de concepto (PoC), que permite explorar una idea y del que no se espera un uso ni desarrollo continuado en el tiempo.

Mientras tanto del lado del Asistente

El steering está distribuido entre una multitud de artefactos, archivos de texto, que son específicos a los asistentes. En la lista a continuación algunos son específicos a Claude Code que es el sistema con el que tengo más experiencia, pero muchos están en el roadmap de otras compañías o pueden ser emulados de diferentes formas, en particular sub-agentes y skills:

Artefacto	Definición y problemas asociados
`modelo`	Los modelos son entrenados, reforzados, destilados, fine tuneados, etc y entre sus capacidades como generalistas está desarrollar software en sus diferentes dimensiones; pero todo este proceso sigue siendo limitado, sujeto a sesgos y con una fecha de corte para su conocimiento de lenguajes, bibliotecas y frameworks.
`AGENTS.md`	`CLAUDE.md` o `WHATEVER.md` se mantienen como un estándar para dar instrucciones específicas a los asistentes en la dirección en que nosotros creemos que es la mejor forma de desarrollar software; pero es un solo archivo, tiende a volverse monolítico, y no es contextual a diferentes tipos de tareas.
`dir/AGENTS.md`	Ofreció una primera aproximación a contextualizar las instrucciones para el asistente en base a la jerarquía de directorios; el problema es que la organización de los archivos no necesariamente hace match con las diferentes tareas, y la “lectura” de estos archivos por parte de los asistentes, en mi experiencia, no es un ciencia exacta.
`/commands`	Son prompts almacenados por ser frecuentemente utilizados y que invocamos de forma explícita mediando un atajo `/nombre-del-comando`, nos ahorran repetir ejemplos e instrucciones y pueden ser orientados a la tarea; sin embargo somos nosotros quienes tenemos que ejecutarlos, y entonces nos cargamos con contextualizar su uso.
`SKILL.md`	Hasta donde sé son únicos a Claude Code, y permiten dar acceso al asistente a un sistema estructurado de conocimientos bajo el principio de “progressive disclosure” aka diferentes niveles de profundidad; suena bonito, es potente y muy lejos de ser triviales de crear y mantener.
`sub-agents`	De nuevo un feature único a Claude Code, creo, permite que el agente en el main-thread delegue tareas específicas a diferentes sub-agentes con sus propios contextos aislados; *permite una ejecución autónoma y “cuida” el contexto principal, pero agrega la complejidad de la orquestración, al esfuerzo de definir los agentes y mantenerlos.*

Esto nos da una visión mucho más granular del sistema de contexto on-demand en el que se apoya un asistente, y nos revela un nuevo nivel de complejidad en nuestro objetivo de generar software de calidad de una forma repetible y mejorable en el tiempo.

El desarrollo de software implica una diversidad de tareas en diferentes momentos y contextos, arquitectura, diseño, QA, etc, “programar” es una simplificación excesiva de lo que significa desarrollo de software. Y todos estos artefactos mencionados anteriormente obedecen a diferentes estrategias para construir una aproximación a este proceso complejo de transformar una idea en algo que le da valor a los usuarios.

La nueva tarea que demandan estos sistemas

Entonces nuestro trabajo no solo consiste en determinar cuál es la mejor combinación de instrucciones, ejemplos (“textos”), distribuidos entre los diferentes artefactos, que alimentan el contexto para que el proceso de inferencia tienda a generar alucinaciones positivas, sino que además nos enfrentamos al desafío de mantener en paralelo este sub-sistema para mantenerlo alineado con el código y que cada vez sea más eficiente.

El primer caso es obvio, pero el segundo no tanto. Aquí un ejemplo sencillo: Actualizamos significativamente una dependencia en nuestro proyecto, y si no actualizamos los artefactos de soporte para el Asistente entonces el código generado, las alucinaciones, van a sufrir un bias hacia la versión de la librería que teníamos en el pasado introduciendo errores (alucinaciones negativas).

Revisemos el valor de las alucinaciones

Vamos a crear una nueva versión de la “fórmula” del valor de las interacciones con el asistente que introdujimos en Las matemáticas del Código Asistido por IA donde v( i(ap,e,p) ) representa:

El valor (v) que nos da…
Una interacción (i)…
Con un asistente de programación (ap)…
En nuestro entorno (e)…
A través de un prompt (p)

Y es igual a:

El valor (v)…
Del estado del entorno (e)…
Más el valor de la suma del valor de todas las alucinaciones positivas v(∑a₊)…
Menos la suma del valor de todas las alucinaciones negativas v(∑a₋)
Menos el costo (k) de detectar y rechazar las alucinaciones negativas k(∑a₋)

Es decir:

v(i(ap,e,p)) = v(e) + v(∑a₊) - v(∑a₋) - k(∑a₋)

Pero ya descubrimos que el steering no es gratuito, que implica mantener un sub-sistema nuevo. Si introducimos k(∑a₊) como el costo de promover las alucinaciones positivas (lo que llamamos steering), nuestra fórmula se transforma en:

v(i(ap,e,p)) = v(e) + v(∑a₊) - k(∑a₊) - v(∑a₋) - k(∑a₋)

Donde - k(∑a₊) representa el costo del steering para promover esas alucinaciones positivas, que acabamos de entender que tiene un costo no-trivial. De nuevo, esto no pretende ser una formulación matemática real sino un mecanismo que nos ayude a sistematizar nuestra aproximación a estas herramientas.

En conclusión

No hay una única solución para esto, como en todos los aspectos de la vida siempre hay un tradeoff, y en los extremos está la persona que ignora por completo los artefactos y que prompt a prompt revisa el resultado y acepta o rechaza las alucinaciones con lo que el Asistente ofrece por omisión; y en el otro extremo está la persona que se dedica a componer los diferentes artefactos para maximizar la autonomía y eficiencia del sistema.

En mi caso, como después de muchísimos años enfocado en el management aún estoy muy lejos de ser programador, yo le estoy apostando a la segunda, que es bastante más compleja, que tiene un feedback loop más dilatado y cuyo ROI aún está por verse.

En la cuarta entrega vamos a enfocarnos en entender qué significa detectar y rechazar las alucinaciones negativas (k(∑a₋)), lo que yo denomino backpressure.

I Used to Code

by Aníbal Rojas

Explorer

Recent Notes

Todo Prompting es Prompt Injection