Los agentes de IA escriben código — ¿quién lo verifica?
La velocidad es real. La brecha de confianza crece.
Claude Code, Cursor, Devin, GitHub Copilot Workspace — los agentes de IA están creando pull requests en minutos. Con descripciones seguras: "Agrega middleware de auth." "Corrige el bug de timeout." "Sin breaking changes."
Pero hay algo de lo que nadie habla: estas descripciones las genera el mismo modelo que escribió el código. El agente cree que lo que escribió es correcto. La descripción refleja esa confianza, no una evaluación independiente.
Ahora tienes un PR que se lee perfecto, se ve profesional, y podría estar completamente equivocado sobre lo que realmente hace.
CI no resuelve esto
CI te dice si el código compila y los tests pasan. No te dice si la descripción del PR coincide con el diff. Un PR puede decir "agrega rate limiting" mientras el diff agrega rate limiting Y silenciosamente cambia el pool de conexiones a la base de datos. CI pasa. El reviewer ojea la descripción. El cambio oculto llega a producción.
Herramientas de code review como CodeRabbit analizan calidad de código — estilo, bugs, buenas prácticas. No verifican claims. No revisan si lo que dice el PR coincide con lo que hace el código.
La capa de verificación
Lo que falta es un sistema que lea la descripción del PR, extraiga cada afirmación, y verifique cada una contra el diff real. Y luego escanee todo lo que la descripción no mencionó.
Eso es lo que hace Vigil. Lee el título y cuerpo de tu PR, extrae claims como "agrega middleware de auth" y "corrige timeout," y luego revisa el diff para confirmar o contradecir cada uno. También detecta cambios no documentados — dependencias nuevas, variables de entorno, modificaciones de schema que nadie mencionó.
Por qué importa ahora
Cuando los humanos escribían todo el código, el autor del PR generalmente sabía qué cambió. La descripción era a menudo incompleta pero rara vez engañosa. Con agentes de IA, la descripción siempre es segura y a veces incorrecta.
Mientras más rápido se escribe código, más necesitas una capa de verificación independiente. No para reemplazar el code review — para complementarlo con una verificación de veracidad que nadie tiene tiempo de hacer manualmente a escala.
El código se está volviendo commodity. La confianza es cada vez más escasa. La verificación es la capa que cierra la brecha.