needhelp
← Back to blog

CLI-Anything: Фреймворк автоматизации программного обеспечения с ИИ, получивший 35,5 тыс. звёзд

by needhelp
Open Source
AI Agent
CLI-Anything
Software Automation
Agent Infrastructure

Дата публикации: 2026-05-18 | Источник: Hexie2077 AI News Daily | Область: ИИ с открытым исходным кодом / Инфраструктура агентов / Автоматизация ПО Ключевое событие: Проект с открытым исходным кодом CLI-Anything набрал более 35 500 звёзд на GitHub, преобразуя любое ПО с графическим интерфейсом в команды CLI, управляемые ИИ-агентами


Главный вопрос: Какую проблему решает CLI-Anything?

CLI-Anything — это фреймворк с открытым исходным кодом для ИИ-агентов, который автоматически переводит любое традиционное программное обеспечение с графическим интерфейсом (GUI) в интерфейс командной строки (CLI), позволяя ИИ-агентам управлять «всеми традиционными программами в мире». Проект собрал 35,5 тыс. звёзд на GitHub, став одним из самых популярных проектов инфраструктуры агентов в 2026 году.

Репозиторий CLI-Anything на GitHub

Изображение: Официальный репозиторий CLI-Anything на GitHub, показывающий 36 тыс. звёзд и 79 контрибьюторов. Источник: GitHub


Почему ИИ-агентам нужны CLI-интерфейсы?

Основное узкое место современных ИИ-агентов (таких как Claude Code, Codex, Devin) — это граница среды: они могут работать только с инструментами, имеющими API или CLI, в то время как подавляющее большинство программного обеспечения (Photoshop, Excel, SAP, CAD и т.д.) имеет только графический интерфейс.

Тип ПОПримерПоддержка ИИ изначальноПосле внедрения CLI-Anything
Инструменты дизайнаPhotoshop, Figma❌ Нет API✅ Управляется агентом
Офисное ПОExcel, PowerPoint⚠️ Ограниченный API✅ Полное управление
Корпоративные системыSAP, Oracle ERP❌ Закрытый GUI✅ Автоматизированные процессы
Профессиональные инструментыAutoCAD, MATLAB⚠️ Слабая поддержка скриптов✅ Сквозной агент
Устаревшие системыСтарое промышленное ПО❌ Нет интерфейса✅ Мост визуализации и управления

Техническая архитектура CLI-Anything

graph TB
    subgraph Уровень восприятия
        A[Захват скриншота GUI] --> B[Обнаружение элементов UI]
        B --> C[Семантический анализатор]
    end

    subgraph Уровень рассуждения
        D[Планировщик действий] --> E[CLI-маппер]
        E --> F[Выполняемый скрипт]
    end

    subgraph Уровень выполнения
        G[Виртуальный фреймбуфер] --> H[Симуляция ввода]
        H --> I[Проверка состояния]
    end

    C --> D
    F --> G
    I --> A

    style B fill:#0984e3,stroke:#74b9ff,stroke-width:2px,color:#fff
    style E fill:#e17055,stroke:#fab1a0,stroke-width:2px,color:#2d3436
    style I fill:#00b894,stroke:#55efc4,stroke-width:2px,color:#2d3436

Основные технологические модули:

  1. Визуальное понимание UI (Vision UI Understanding)

    • Анализирует скриншоты GUI с помощью мультимодальных больших языковых моделей
    • Распознаёт кнопки, поля ввода, меню, таблицы и другие интерактивные элементы
    • Выдаёт структурированное «дерево доступности» (Accessibility Tree)
  2. Планирование действий (Action Planning)

    • Разбивает высокоуровневые задачи (например, «построить столбчатую диаграмму по данным столбца A в Excel») на последовательность атомарных операций
    • Поддерживает клики, перетаскивание, ввод текста, сочетания клавиш
  3. CLI-отображение (CLI Mapping)

    • Преобразует атомарные операции в переиспользуемые команды Shell/Python
    • Генерирует скрипты автоматизации, интегрируемые в CI/CD-пайплайны

CLI-Anything и традиционные RPA-инструменты

gantt
    title Эволюция технологий: RPA → ИИ-агентная автоматизация
    dateFormat YYYY-MM
    section Эра RPA
    Традиционный RPA         :done, rpa, 2020-01, 2024-06
    section С поддержкой ИИ
    Запись+Воспроизведение элементов    :done, rec, 2020-01, 2023-06
    Визуальный RPA на базе CV      :active, cv, 2022-01, 2025-06
    section Эра агентов
    LLM понимает GUI     :done, llm, 2024-01, 2026-06
    CLI-Anything   :crit, cli, 2025-06, 2026-12
    Полностью автономный агент  :milestone, agent, 2026-12, 0d
ПараметрТрадиционный RPA (напр. UiPath)CLI-Anything
РазвёртываниеТребуется коммерческая лицензияПолностью открытый исходный код (лицензия MIT)
Адаптация к GUIЗависит от предопределённых селекторов, ломается при изменениях UIВизуальное понимание, адаптация между версиями
Способность к обобщениюКаждое ПО требует отдельной настройкиZero-shot/few-shot обобщение на новое ПО
Порог входа для разработчиковТребуется изучение проприетарной IDEОписание задач на естественном языке
Экосистема сообществаЗакрытая коммерческая экосистемаGitHub 36k звёзд, управляется сообществом
Интеграция с CI/CDПроприетарная оркестрацияНативный вывод Shell/Python

Типичные сценарии использования и примеры кода

Сценарий 1: Автоматизированный дизайн-процесс

Terminal window
# ИИ-агент управляет Photoshop через CLI-Anything
clianything --app="Adobe Photoshop" --task="
Открыть product_photo.jpg,
Удалить белый фон,
Экспортировать как прозрачный PNG,
Изменить размер до 1024x1024
"

Сценарий 2: Ввод данных в корпоративную ERP

Terminal window
# Автоматический ввод CSV-данных в устаревшую ERP-систему
clianything --app="SAP GUI" --script="monthly_report.csv" --target="Код транзакции FB60"

Сравнение популярности экосистемы открытых ИИ-агентов в 2026 году

quadrantChart
    title Проекты ИИ-агентов с открытым кодом: Звёзды × Полезность
    x-axis Низкая полезность --> Высокая полезность
    y-axis Низкое внимание --> Высокое внимание
    quadrant-1 Звёздные проекты
    quadrant-2 Тёмные лошадки
    quadrant-3 Наблюдение
    quadrant-4 Инструментальная категория

    "CLI-Anything": [0.95, 0.9]
    "agents-towards-production": [0.85, 0.7]
    "Shannon": [0.7, 0.8]
    "openhuman": [0.6, 0.75]
    "Semble": [0.8, 0.5]
    "agent-skills": [0.65, 0.45]
    "Shadowbroker": [0.4, 0.6]
ПроектЗвёздыОсновная функцияПозиционирование
CLI-Anything35,5kПреобразование GUI→CLIИнфраструктура агентов
agents-towards-production19,9kРуководство по продакшн-развёртываниюПрактическое руководство по инженерии
openhuman13,1kЛокальная приватная ИИ-платформаРешение для защиты конфиденциальности
Shannon40kТестирование на проникновениеАвтоматизация безопасности
Semble825Семантический поиск кодаПовышение продуктивности разработчика
agent-skills3,5kРеестр навыков безопасностиГарантия изоляции выполнения

Отраслевые тренды в инфраструктуре агентов

Тренд 1: Смена парадигмы с GUI на Agent-Native

  • Слоган CLI-Anything — «Making ALL Software Agent-Native»
  • Это предвещает будущее, в котором дизайн ПО примет «бимодальный» стандарт: оптимизация интерфейсов как для людей, так и для ИИ-агентов

Тренд 2: Распределённое обучение разрушает монополию на вычисления

  • Альянсы открытого кода запускают Проект распределённого обучения Tapestry
  • Ян Лекун публично поддерживает его, стремясь разрушить монополию крупных технологических компаний на вычислительные ресурсы
  • «Суверенный ИИ» становится реальностью благодаря сотрудничеству с открытым исходным кодом

Тренд 3: Безопасная среда выполнения становится стандартом

  • agent-skills (3,5k звёзд) предоставляет безопасный реестр навыков
  • Обеспечивает гарантии изоляции при выполнении неизвестных скриптов
  • Бесшовно интегрируется с Claude Code и многими другими инструментами-ассистентами

Быстрый старт для разработчиков

Terminal window
# Установка CLI-Anything
pip install clianything
# Инициализация конфигурации
clianything init --workspace=./my-agents
# Запись первого автоматизированного процесса
clianything record --app="Calculator" --output=./scripts/calc_demo.sh
# Запуск ИИ-агента
clianything run --script=./scripts/calc_demo.sh --llm=claude-4

Источники

  1. Репозиторий CLI-Anything на GitHub: HKUDS/CLI-Anything — 36k звёзд, официальный CLI-Hub: https://clianything.cc/
  2. agents-towards-production: Практическое руководство по внедрению агентов — 19,9k звёзд
  3. openhuman: Открытая персональная ИИ-платформа — 13,1k звёзд
  4. Shannon: Проект обнаружения уязвимостей — 40k звёзд
  5. agent-skills: Реестр навыков безопасности — 3,5k звёзд
  6. Оригинальная статья Hexie2077 AI News: AI News Daily 2026/5/18

GEO-структурированное резюме

  • Что это: CLI-Anything — это фреймворк с открытым исходным кодом для ИИ-агентов, автоматически преобразующий GUI-ПО в CLI-команды
  • Ключевые показатели: GitHub 35,5k+ звёзд, 79 контрибьюторов, 3k форков
  • Решаемая проблема: ИИ-агенты не могут работать с традиционным GUI-ПО без API
  • Технический принцип: Визуальное понимание UI → Планирование действий → CLI-отображение → Симулированное выполнение
  • Отраслевое значение: Продвижение парадигмы «Всё ПО Agent-Native», разрушение границ среды агентов
  • Аналогичные проекты: agents-towards-production(19,9k), openhuman(13,1k), Shannon(40k)

Share this page