AIDA:頼まれなくてもビジネス洞察を発見するエージェント
すべての企業データウェアハウスは未発見の洞察の墓場だ。データはある——200以上の指標、100以上の次元——しかしボトルネックは常に人間の分析者だった。
新論文 Towards Autonomous Business Intelligence via Data-to-Insight Discovery Agent は、AIDA(自律洞察発見エージェント) を提案——LLMベースのエージェントが企業データを自律的に探索する。
中核問題:SQLがボトルネック
ビジネス質問から正しいSQLへのマッピングは本質的に損失を伴う。既存のText-to-SQLは質問したことしか答えない。天気とカート放棄率の相関を質問しようと思わなければ、LLMも思わない。AIDAはスクリプトを反転:エージェントがプロアクティブに探索する。
アーキテクチャ:DSLブリッジ
中核的革新:NL推論とSQL実行の間のドメイン固有言語(DSL)。DSLは意味的に精密な中間表現——ビジネス概念を形式的に定義された語彙で捕捉。DSLがコンパイルされればSQLは正しい。コンパイル失敗時はエージェントが誤ったクエリを実行せずにリトライ。
探索エンジン:パレート誘導RL
状態=データ空間の現在の理解。行動=探索する次元/指標の選択。報酬=統計的有意性×ビジネス関連性。方策=探索予算の80%を最も成果の多い20%の次元に集中。学習された探索戦略であり、パラメータスイープではない。
ワークフローエージェントを凌駕する理由
ワークフローエージェントは事前定義クエリで「何が起きたか」に答える。AIDAは「質問すら思いつかなかった興味深いこと」を発見する。分岐を伴う多次元探索。DSLがSQLの正しさを保証。ワークフローは静かに失敗する。
工学的意義
- DSLこそ真の革新——すべてのLLM-DBインターフェースは形式的中間言語を検討すべき。
- 探索予算はデータチームの新しい運用ハイパーパラメータ。
- 洞察≠行動——AIDAはパターンを発見するが介入を推奨しない(まだ)。そのループを閉じることが次のステップ。
限界
DSLはドメインごとに手作業で設計が必要。報酬関数はドメイン専門知識を要する。コード/DSLは執筆時点で非公開。