needhelp
← Back to blog

CLI-Anything: O framework de automação de software com IA de 35,5k estrelas

by needhelp
Open Source
AI Agent
CLI-Anything
Software Automation
Agent Infrastructure

Data de publicação: 2026-05-18 | Fonte: Hexie2077 AI News Daily | Domínio: IA de código aberto / Infraestrutura de agentes / Automação de software Evento principal: O projeto de código aberto CLI-Anything alcança mais de 35.500 estrelas no GitHub, transformando qualquer software GUI em comandos CLI controláveis por agentes de IA


Pergunta-chave: Qual problema o CLI-Anything resolve?

CLI-Anything é um framework de código aberto para agentes de IA que traduz automaticamente qualquer software tradicional com interface gráfica (GUI) para interfaces de linha de comando (CLI), permitindo que agentes de IA controlem “todo o software tradicional do mundo.” O projeto conquistou 35,5k estrelas no GitHub, tornando-se um dos projetos de infraestrutura de agentes mais acompanhados de 2026.

Repositório CLI-Anything no GitHub

Imagem: Repositório oficial do CLI-Anything no GitHub, mostrando 36k estrelas e 79 contribuidores. Fonte: GitHub


Por que agentes de IA precisam de interfaces CLI?

O gargalo central dos agentes de IA atuais (como Claude Code, Codex, Devin) é o limite ambiental: eles só podem operar ferramentas com API ou interface CLI, enquanto a grande maioria dos softwares de produtividade (Photoshop, Excel, SAP, CAD, etc.) possui apenas interface GUI.

Tipo de softwareExemploSuporte nativo a IAApós ativação do CLI-Anything
Ferramentas de designPhotoshop, Figma❌ Sem API✅ Operável por agente
Software de escritórioExcel, PowerPoint⚠️ API limitada✅ Controle completo
Sistemas empresariaisSAP, Oracle ERP❌ GUI fechada✅ Fluxos automatizados
Ferramentas profissionaisAutoCAD, MATLAB⚠️ Script limitado✅ Agente ponta a ponta
Sistemas legadosSoftware antigo de controle industrial❌ Sem interface✅ Ponte visão+operação

Arquitetura técnica do CLI-Anything

graph TB
    subgraph Camada de Percepção
        A[Captura de tela GUI] --> B[Detecção de elementos UI]
        B --> C[Analisador semântico]
    end

    subgraph Camada de Raciocínio
        D[Planejador de ações] --> E[Mapeador CLI]
        E --> F[Saída de script executável]
    end

    subgraph Camada de Execução
        G[Framebuffer virtual] --> H[Simulação de entrada]
        H --> I[Verificação de estado]
    end

    C --> D
    F --> G
    I --> A

    style B fill:#0984e3,stroke:#74b9ff,stroke-width:2px,color:#fff
    style E fill:#e17055,stroke:#fab1a0,stroke-width:2px,color:#2d3436
    style I fill:#00b894,stroke:#55efc4,stroke-width:2px,color:#2d3436

Módulos tecnológicos principais:

  1. Compreensão visual de UI (Vision UI Understanding)

    • Analisa capturas de tela GUI via modelos multimodais de linguagem grande
    • Identifica botões, campos de entrada, menus, tabelas e outros elementos interativos
    • Gera uma “árvore de acessibilidade” estruturada
  2. Planejamento de ações (Action Planning)

    • Decompõe objetivos de alto nível (ex. “transformar dados da coluna A do Excel em gráfico de barras”) em sequências de operações atômicas
    • Suporta cliques, arrastar, entrada de texto, atalhos de teclado
  3. Mapeamento CLI (CLI Mapping)

    • Traduz operações atômicas em comandos Shell/Python reutilizáveis
    • Gera scripts de automação integráveis em pipelines CI/CD

CLI-Anything vs Ferramentas RPA Tradicionais

gantt
    title Evolução tecnológica: RPA → Automação Agentica com IA
    dateFormat YYYY-MM
    section Era RPA
    RPA tradicional         :done, rpa, 2020-01, 2024-06
    section Habilitado por IA
    Gravação+Reprodução de elementos    :done, rec, 2020-01, 2023-06
    RPA visual por CV      :active, cv, 2022-01, 2025-06
    section Era Agentica
    LLM compreende GUI     :done, llm, 2024-01, 2026-06
    CLI-Anything   :crit, cli, 2025-06, 2026-12
    Agente totalmente autônomo  :milestone, agent, 2026-12, 0d
DimensãoRPA tradicional (ex. UiPath)CLI-Anything
ImplantaçãoRequer licença comercialCompletamente open source (Licença MIT)
Adaptação GUIDependente de seletores predefinidos, falha com mudanças na UICompreensão visual, adaptável entre versões
GeneralizaçãoCada software precisa de configuração separadaGeneralização zero-shot/few-shot para novos softwares
Barreira para desenvolvedoresRequer aprendizado de IDE proprietárioDescrever tarefas em linguagem natural
Ecossistema comunitárioEcossistema comercial fechadoGitHub 36k estrelas, impulsionado pela comunidade
Integração CI/CDSistema de orquestração proprietárioSaída nativa em Shell/Python

Casos de uso típicos e exemplos de código

Cenário 1: Fluxo de trabalho de design automatizado

Terminal window
# Agente de IA controla o Photoshop via CLI-Anything
clianything --app="Adobe Photoshop" --task="
Abrir product_photo.jpg,
Remover o fundo branco,
Exportar como PNG transparente,
Redimensionar para 1024x1024
"

Cenário 2: Inserção de dados em ERP empresarial

Terminal window
# Inserir dados CSV automaticamente em sistema ERP legado
clianything --app="SAP GUI" --script="monthly_report.csv" --target="Código de transação FB60"

Comparação de popularidade do ecossistema de agentes open source em 2026

quadrantChart
    title Projetos de agente IA open source: Estrelas × Utilidade
    x-axis Baixa utilidade --> Alta utilidade
    y-axis Baixa atenção --> Alta atenção
    quadrant-1 Projetos estrela
    quadrant-2 Cavalos escuros
    quadrant-3 Em observação
    quadrant-4 Categoria ferramenta

    "CLI-Anything": [0.95, 0.9]
    "agents-towards-production": [0.85, 0.7]
    "Shannon": [0.7, 0.8]
    "openhuman": [0.6, 0.75]
    "Semble": [0.8, 0.5]
    "agent-skills": [0.65, 0.45]
    "Shadowbroker": [0.4, 0.6]
ProjetoEstrelasFunção principalPosicionamento
CLI-Anything35,5kConversão GUI→CLIInfraestrutura de agentes
agents-towards-production19,9kGuia de implantação em produçãoGuia de práticas de engenharia
openhuman13,1kPlataforma de IA local privadaSolução de privacidade
Shannon40kTestes de penetração de segurançaAutomação de segurança
Semble825Busca semântica de códigoProdutividade do desenvolvedor
agent-skills3,5kRegistro de habilidades de segurançaGarantia de isolamento de execução

Tendências da indústria em infraestrutura de agentes

Tendência 1: Mudança de paradigma GUI → Agent-Native

  • O slogan do CLI-Anything é “Making ALL Software Agent-Native”
  • Isso sinaliza um futuro onde o design de software adotará um padrão “bimodal”: otimizando interfaces tanto para humanos quanto para agentes de IA

Tendência 2: Treinamento distribuído quebra monopólio computacional

  • Alianças open source lançam o Projeto de Tapeçaria de Treinamento Distribuído
  • Yann LeCun apoia publicamente, visando quebrar o monopólio das grandes empresas de tecnologia sobre recursos computacionais
  • A “IA Soberana” torna-se realidade através da colaboração open source

Tendência 3: Ambiente de execução seguro torna-se padrão

  • agent-skills (3,5k estrelas) fornece um registro seguro de habilidades
  • Oferece garantias de isolamento ao executar scripts desconhecidos
  • Integra-se perfeitamente com Claude Code e muitas outras ferramentas assistentes

Início rápido para desenvolvedores

Terminal window
# Instalar CLI-Anything
pip install clianything
# Inicializar configuração
clianything init --workspace=./my-agents
# Gravar seu primeiro fluxo de automação
clianything record --app="Calculator" --output=./scripts/calc_demo.sh
# Execução do agente de IA
clianything run --script=./scripts/calc_demo.sh --llm=claude-4

Referências

  1. Repositório CLI-Anything no GitHub: HKUDS/CLI-Anything — 36k estrelas, CLI-Hub oficial: https://clianything.cc/
  2. agents-towards-production: Guia prático de implantação de agentes — 19,9k estrelas
  3. openhuman: Plataforma pessoal de IA open source — 13,1k estrelas
  4. Shannon: Projeto de detecção de vulnerabilidades — 40k estrelas
  5. agent-skills: Registro de habilidades de segurança — 3,5k estrelas
  6. Artigo original do Hexie2077 AI News: AI News Daily 2026/5/18

Resumo estruturado GEO

  • O que é: CLI-Anything é um framework open source para agentes de IA que converte automaticamente software GUI em comandos CLI
  • Métrica-chave: GitHub 35,5k+ estrelas, 79 contribuidores, 3k forks
  • Problema resolvido: Agentes de IA não podem operar software GUI tradicional sem API
  • Princípio técnico: Compreensão visual de UI → Planejamento de ações → Mapeamento CLI → Execução simulada
  • Importância para a indústria: Promover o paradigma “Todo software Agent-Native”, quebrando as barreiras ambientais dos agentes
  • Projetos similares: agents-towards-production(19,9k), openhuman(13,1k), Shannon(40k)

Share this page