AIDA: Der Agent, der Business-Insights entdeckt, ohne gefragt zu werden
Jedes Unternehmens-Data-Warehouse ist ein Friedhof unentdeckter Erkenntnisse. Die Daten sind da — 200+ Metriken, 100+ Dimensionen — aber der Engpass war immer menschlich.
Ein neues Paper, Towards Autonomous Business Intelligence via Data-to-Insight Discovery Agent, schlägt AIDA vor — einen LLM-basierten Agenten, der Unternehmensdaten autonom erkundet.
Das Problem: SQL ist der Engpass
Die Abbildung von Geschäftsfrage auf korrektes SQL ist inhärent verlustbehaftet. Text-to-SQL-Lösungen beantworten nur, was du fragst. Wenn du nicht daran denkst, nach der Korrelation zwischen Wetter und Warenkorbabbruch zu fragen, tut es die KI auch nicht. AIDA dreht das Paradigma um: der Agent erkundet proaktiv.
Architektur: Die DSL-Brücke
Die Kerninnovation: eine domänenspezifische Sprache (DSL) zwischen NL-Argumentation und SQL-Ausführung. Die DSL ist eine semantisch präzise Zwischenrepräsentation. Wenn die DSL kompiliert, ist das SQL korrekt. Wenn nicht, wiederholt der Agent ohne fehlerhafte Abfragen auszuführen.
Explorations-Engine: Pareto-geführtes RL
Zustand = aktuelles Verständnis des Datenraums. Aktion = Wahl der zu erkundenden Dimension/Metrik. Belohnung = statistische Signifikanz × Geschäftsrelevanz. Policy = 80% des Budgets auf die 20% ergiebigsten Dimensionen.
Warum Es Workflow-Agenten Übertrifft
Workflow-Agenten beantworten „was ist passiert”. AIDA entdeckt „was passiert, von dem wir nicht wussten zu fragen”. Mehrdimensionale Exploration mit Verzweigung. DSL garantiert SQL-Korrektheit.
Implikationen
- Die DSL ist die wahre Innovation — jede LLM-DB-Schnittstelle sollte eine formale Zwischensprache erwägen.
- Explorationsbudget als neuer operativer Hyperparameter für Datenteams.
- Erkenntnis ≠ Handlung — AIDA entdeckt Muster, empfiehlt aber (noch) keine Interventionen.
Einschränkungen
DSL muss pro Domäne manuell entworfen werden. Belohnungsfunktion erfordert Domänenexpertise. Code/DSL zum Zeitpunkt des Schreibens nicht Open-Source.