AIDA: El agente que descubre insights de negocio sin que se lo pidan
Cada almacén de datos empresarial es un cementerio de insights no detectados. Los datos están ahí — 200+ métricas, 100+ dimensiones — pero el cuello de botella siempre ha sido humano.
Un nuevo artículo, Towards Autonomous Business Intelligence via Data-to-Insight Discovery Agent, propone AIDA — un agente LLM que explora datos empresariales autónomamente.
El Problema: SQL es el Cuello de Botella
El mapeo de pregunta de negocio a SQL correcto es inherentemente pérdida. Las soluciones Text-to-SQL solo responden lo que preguntas. Si no piensas preguntar sobre la correlación entre clima y abandono de carrito, el LLM tampoco lo hará. AIDA invierte el paradigma: el agente explora proactivamente.
Arquitectura: El Puente DSL
La innovación clave: un Lenguaje de Dominio Específico (DSL) entre razonamiento NL y ejecución SQL. El DSL es una representación intermedia semánticamente precisa — captura conceptos de negocio en vocabulario formalmente definido. Si el DSL compila, el SQL es correcto. Si no, el agente reintenta sin ejecutar consultas erróneas.
Motor de Exploración: RL Guiado por Pareto
Estado = comprensión actual del espacio de datos. Acción = elegir dimensión/métrica a explorar. Recompensa = significancia estadística × relevancia de negocio. Política = 80% del presupuesto en el 20% de dimensiones más fructíferas. Es una estrategia de exploración aprendida, no un barrido de parámetros.
Por Qué Supera a los Workflow-Agents
Los workflow-agents responden “qué pasó” con consultas predefinidas. AIDA descubre “qué está pasando que no sabíamos preguntar”. Exploración multi-dimensional con ramificación, no lineal. DSL garantiza corrección SQL; los workflows fallan silenciosamente.
Implicaciones
- El DSL es la verdadera innovación — toda interfaz LLM-BD debería considerar un lenguaje intermedio formal.
- Presupuesto de exploración como nuevo hiperparámetro operacional para equipos de datos.
- Insight ≠ Acción — AIDA descubre patrones pero no recomienda intervenciones (aún). Cerrar ese bucle es el próximo paso.
Limitaciones
DSL debe diseñarse manualmente por dominio. La función de recompensa requiere expertise de dominio. El código/DSL no es open-source al momento de escribir.