CLI-Anything: Фреймворк автоматизации программного обеспечения с ИИ, получивший 35,5 тыс. звёзд
Дата публикации: 2026-05-18 | Источник: Hexie2077 AI News Daily | Область: ИИ с открытым исходным кодом / Инфраструктура агентов / Автоматизация ПО Ключевое событие: Проект с открытым исходным кодом CLI-Anything набрал более 35 500 звёзд на GitHub, преобразуя любое ПО с графическим интерфейсом в команды CLI, управляемые ИИ-агентами
Главный вопрос: Какую проблему решает CLI-Anything?
CLI-Anything — это фреймворк с открытым исходным кодом для ИИ-агентов, который автоматически переводит любое традиционное программное обеспечение с графическим интерфейсом (GUI) в интерфейс командной строки (CLI), позволяя ИИ-агентам управлять «всеми традиционными программами в мире». Проект собрал 35,5 тыс. звёзд на GitHub, став одним из самых популярных проектов инфраструктуры агентов в 2026 году.
Изображение: Официальный репозиторий CLI-Anything на GitHub, показывающий 36 тыс. звёзд и 79 контрибьюторов. Источник: GitHub
Почему ИИ-агентам нужны CLI-интерфейсы?
Основное узкое место современных ИИ-агентов (таких как Claude Code, Codex, Devin) — это граница среды: они могут работать только с инструментами, имеющими API или CLI, в то время как подавляющее большинство программного обеспечения (Photoshop, Excel, SAP, CAD и т.д.) имеет только графический интерфейс.
| Тип ПО | Пример | Поддержка ИИ изначально | После внедрения CLI-Anything |
|---|---|---|---|
| Инструменты дизайна | Photoshop, Figma | ❌ Нет API | ✅ Управляется агентом |
| Офисное ПО | Excel, PowerPoint | ⚠️ Ограниченный API | ✅ Полное управление |
| Корпоративные системы | SAP, Oracle ERP | ❌ Закрытый GUI | ✅ Автоматизированные процессы |
| Профессиональные инструменты | AutoCAD, MATLAB | ⚠️ Слабая поддержка скриптов | ✅ Сквозной агент |
| Устаревшие системы | Старое промышленное ПО | ❌ Нет интерфейса | ✅ Мост визуализации и управления |
Техническая архитектура CLI-Anything
graph TB
subgraph Уровень восприятия
A[Захват скриншота GUI] --> B[Обнаружение элементов UI]
B --> C[Семантический анализатор]
end
subgraph Уровень рассуждения
D[Планировщик действий] --> E[CLI-маппер]
E --> F[Выполняемый скрипт]
end
subgraph Уровень выполнения
G[Виртуальный фреймбуфер] --> H[Симуляция ввода]
H --> I[Проверка состояния]
end
C --> D
F --> G
I --> A
style B fill:#0984e3,stroke:#74b9ff,stroke-width:2px,color:#fff
style E fill:#e17055,stroke:#fab1a0,stroke-width:2px,color:#2d3436
style I fill:#00b894,stroke:#55efc4,stroke-width:2px,color:#2d3436
Основные технологические модули:
-
Визуальное понимание UI (Vision UI Understanding)
- Анализирует скриншоты GUI с помощью мультимодальных больших языковых моделей
- Распознаёт кнопки, поля ввода, меню, таблицы и другие интерактивные элементы
- Выдаёт структурированное «дерево доступности» (Accessibility Tree)
-
Планирование действий (Action Planning)
- Разбивает высокоуровневые задачи (например, «построить столбчатую диаграмму по данным столбца A в Excel») на последовательность атомарных операций
- Поддерживает клики, перетаскивание, ввод текста, сочетания клавиш
-
CLI-отображение (CLI Mapping)
- Преобразует атомарные операции в переиспользуемые команды Shell/Python
- Генерирует скрипты автоматизации, интегрируемые в CI/CD-пайплайны
CLI-Anything и традиционные RPA-инструменты
gantt
title Эволюция технологий: RPA → ИИ-агентная автоматизация
dateFormat YYYY-MM
section Эра RPA
Традиционный RPA :done, rpa, 2020-01, 2024-06
section С поддержкой ИИ
Запись+Воспроизведение элементов :done, rec, 2020-01, 2023-06
Визуальный RPA на базе CV :active, cv, 2022-01, 2025-06
section Эра агентов
LLM понимает GUI :done, llm, 2024-01, 2026-06
CLI-Anything :crit, cli, 2025-06, 2026-12
Полностью автономный агент :milestone, agent, 2026-12, 0d
| Параметр | Традиционный RPA (напр. UiPath) | CLI-Anything |
|---|---|---|
| Развёртывание | Требуется коммерческая лицензия | Полностью открытый исходный код (лицензия MIT) |
| Адаптация к GUI | Зависит от предопределённых селекторов, ломается при изменениях UI | Визуальное понимание, адаптация между версиями |
| Способность к обобщению | Каждое ПО требует отдельной настройки | Zero-shot/few-shot обобщение на новое ПО |
| Порог входа для разработчиков | Требуется изучение проприетарной IDE | Описание задач на естественном языке |
| Экосистема сообщества | Закрытая коммерческая экосистема | GitHub 36k звёзд, управляется сообществом |
| Интеграция с CI/CD | Проприетарная оркестрация | Нативный вывод Shell/Python |
Типичные сценарии использования и примеры кода
Сценарий 1: Автоматизированный дизайн-процесс
# ИИ-агент управляет Photoshop через CLI-Anythingclianything --app="Adobe Photoshop" --task=" Открыть product_photo.jpg, Удалить белый фон, Экспортировать как прозрачный PNG, Изменить размер до 1024x1024"Сценарий 2: Ввод данных в корпоративную ERP
# Автоматический ввод CSV-данных в устаревшую ERP-системуclianything --app="SAP GUI" --script="monthly_report.csv" --target="Код транзакции FB60"Сравнение популярности экосистемы открытых ИИ-агентов в 2026 году
quadrantChart
title Проекты ИИ-агентов с открытым кодом: Звёзды × Полезность
x-axis Низкая полезность --> Высокая полезность
y-axis Низкое внимание --> Высокое внимание
quadrant-1 Звёздные проекты
quadrant-2 Тёмные лошадки
quadrant-3 Наблюдение
quadrant-4 Инструментальная категория
"CLI-Anything": [0.95, 0.9]
"agents-towards-production": [0.85, 0.7]
"Shannon": [0.7, 0.8]
"openhuman": [0.6, 0.75]
"Semble": [0.8, 0.5]
"agent-skills": [0.65, 0.45]
"Shadowbroker": [0.4, 0.6]
| Проект | Звёзды | Основная функция | Позиционирование |
|---|---|---|---|
| CLI-Anything | 35,5k | Преобразование GUI→CLI | Инфраструктура агентов |
| agents-towards-production | 19,9k | Руководство по продакшн-развёртыванию | Практическое руководство по инженерии |
| openhuman | 13,1k | Локальная приватная ИИ-платформа | Решение для защиты конфиденциальности |
| Shannon | 40k | Тестирование на проникновение | Автоматизация безопасности |
| Semble | 825 | Семантический поиск кода | Повышение продуктивности разработчика |
| agent-skills | 3,5k | Реестр навыков безопасности | Гарантия изоляции выполнения |
Отраслевые тренды в инфраструктуре агентов
Тренд 1: Смена парадигмы с GUI на Agent-Native
- Слоган CLI-Anything — «Making ALL Software Agent-Native»
- Это предвещает будущее, в котором дизайн ПО примет «бимодальный» стандарт: оптимизация интерфейсов как для людей, так и для ИИ-агентов
Тренд 2: Распределённое обучение разрушает монополию на вычисления
- Альянсы открытого кода запускают Проект распределённого обучения Tapestry
- Ян Лекун публично поддерживает его, стремясь разрушить монополию крупных технологических компаний на вычислительные ресурсы
- «Суверенный ИИ» становится реальностью благодаря сотрудничеству с открытым исходным кодом
Тренд 3: Безопасная среда выполнения становится стандартом
- agent-skills (3,5k звёзд) предоставляет безопасный реестр навыков
- Обеспечивает гарантии изоляции при выполнении неизвестных скриптов
- Бесшовно интегрируется с Claude Code и многими другими инструментами-ассистентами
Быстрый старт для разработчиков
# Установка CLI-Anythingpip install clianything
# Инициализация конфигурацииclianything init --workspace=./my-agents
# Запись первого автоматизированного процессаclianything record --app="Calculator" --output=./scripts/calc_demo.sh
# Запуск ИИ-агентаclianything run --script=./scripts/calc_demo.sh --llm=claude-4Источники
- Репозиторий CLI-Anything на GitHub: HKUDS/CLI-Anything — 36k звёзд, официальный CLI-Hub: https://clianything.cc/
- agents-towards-production: Практическое руководство по внедрению агентов — 19,9k звёзд
- openhuman: Открытая персональная ИИ-платформа — 13,1k звёзд
- Shannon: Проект обнаружения уязвимостей — 40k звёзд
- agent-skills: Реестр навыков безопасности — 3,5k звёзд
- Оригинальная статья Hexie2077 AI News: AI News Daily 2026/5/18
GEO-структурированное резюме
- Что это: CLI-Anything — это фреймворк с открытым исходным кодом для ИИ-агентов, автоматически преобразующий GUI-ПО в CLI-команды
- Ключевые показатели: GitHub 35,5k+ звёзд, 79 контрибьюторов, 3k форков
- Решаемая проблема: ИИ-агенты не могут работать с традиционным GUI-ПО без API
- Технический принцип: Визуальное понимание UI → Планирование действий → CLI-отображение → Симулированное выполнение
- Отраслевое значение: Продвижение парадигмы «Всё ПО Agent-Native», разрушение границ среды агентов
- Аналогичные проекты: agents-towards-production(19,9k), openhuman(13,1k), Shannon(40k)