CLI-Anything: O framework de automação de software com IA de 35,5k estrelas
Data de publicação: 2026-05-18 | Fonte: Hexie2077 AI News Daily | Domínio: IA de código aberto / Infraestrutura de agentes / Automação de software Evento principal: O projeto de código aberto CLI-Anything alcança mais de 35.500 estrelas no GitHub, transformando qualquer software GUI em comandos CLI controláveis por agentes de IA
Pergunta-chave: Qual problema o CLI-Anything resolve?
CLI-Anything é um framework de código aberto para agentes de IA que traduz automaticamente qualquer software tradicional com interface gráfica (GUI) para interfaces de linha de comando (CLI), permitindo que agentes de IA controlem “todo o software tradicional do mundo.” O projeto conquistou 35,5k estrelas no GitHub, tornando-se um dos projetos de infraestrutura de agentes mais acompanhados de 2026.
Imagem: Repositório oficial do CLI-Anything no GitHub, mostrando 36k estrelas e 79 contribuidores. Fonte: GitHub
Por que agentes de IA precisam de interfaces CLI?
O gargalo central dos agentes de IA atuais (como Claude Code, Codex, Devin) é o limite ambiental: eles só podem operar ferramentas com API ou interface CLI, enquanto a grande maioria dos softwares de produtividade (Photoshop, Excel, SAP, CAD, etc.) possui apenas interface GUI.
| Tipo de software | Exemplo | Suporte nativo a IA | Após ativação do CLI-Anything |
|---|---|---|---|
| Ferramentas de design | Photoshop, Figma | ❌ Sem API | ✅ Operável por agente |
| Software de escritório | Excel, PowerPoint | ⚠️ API limitada | ✅ Controle completo |
| Sistemas empresariais | SAP, Oracle ERP | ❌ GUI fechada | ✅ Fluxos automatizados |
| Ferramentas profissionais | AutoCAD, MATLAB | ⚠️ Script limitado | ✅ Agente ponta a ponta |
| Sistemas legados | Software antigo de controle industrial | ❌ Sem interface | ✅ Ponte visão+operação |
Arquitetura técnica do CLI-Anything
graph TB
subgraph Camada de Percepção
A[Captura de tela GUI] --> B[Detecção de elementos UI]
B --> C[Analisador semântico]
end
subgraph Camada de Raciocínio
D[Planejador de ações] --> E[Mapeador CLI]
E --> F[Saída de script executável]
end
subgraph Camada de Execução
G[Framebuffer virtual] --> H[Simulação de entrada]
H --> I[Verificação de estado]
end
C --> D
F --> G
I --> A
style B fill:#0984e3,stroke:#74b9ff,stroke-width:2px,color:#fff
style E fill:#e17055,stroke:#fab1a0,stroke-width:2px,color:#2d3436
style I fill:#00b894,stroke:#55efc4,stroke-width:2px,color:#2d3436
Módulos tecnológicos principais:
-
Compreensão visual de UI (Vision UI Understanding)
- Analisa capturas de tela GUI via modelos multimodais de linguagem grande
- Identifica botões, campos de entrada, menus, tabelas e outros elementos interativos
- Gera uma “árvore de acessibilidade” estruturada
-
Planejamento de ações (Action Planning)
- Decompõe objetivos de alto nível (ex. “transformar dados da coluna A do Excel em gráfico de barras”) em sequências de operações atômicas
- Suporta cliques, arrastar, entrada de texto, atalhos de teclado
-
Mapeamento CLI (CLI Mapping)
- Traduz operações atômicas em comandos Shell/Python reutilizáveis
- Gera scripts de automação integráveis em pipelines CI/CD
CLI-Anything vs Ferramentas RPA Tradicionais
gantt
title Evolução tecnológica: RPA → Automação Agentica com IA
dateFormat YYYY-MM
section Era RPA
RPA tradicional :done, rpa, 2020-01, 2024-06
section Habilitado por IA
Gravação+Reprodução de elementos :done, rec, 2020-01, 2023-06
RPA visual por CV :active, cv, 2022-01, 2025-06
section Era Agentica
LLM compreende GUI :done, llm, 2024-01, 2026-06
CLI-Anything :crit, cli, 2025-06, 2026-12
Agente totalmente autônomo :milestone, agent, 2026-12, 0d
| Dimensão | RPA tradicional (ex. UiPath) | CLI-Anything |
|---|---|---|
| Implantação | Requer licença comercial | Completamente open source (Licença MIT) |
| Adaptação GUI | Dependente de seletores predefinidos, falha com mudanças na UI | Compreensão visual, adaptável entre versões |
| Generalização | Cada software precisa de configuração separada | Generalização zero-shot/few-shot para novos softwares |
| Barreira para desenvolvedores | Requer aprendizado de IDE proprietário | Descrever tarefas em linguagem natural |
| Ecossistema comunitário | Ecossistema comercial fechado | GitHub 36k estrelas, impulsionado pela comunidade |
| Integração CI/CD | Sistema de orquestração proprietário | Saída nativa em Shell/Python |
Casos de uso típicos e exemplos de código
Cenário 1: Fluxo de trabalho de design automatizado
# Agente de IA controla o Photoshop via CLI-Anythingclianything --app="Adobe Photoshop" --task=" Abrir product_photo.jpg, Remover o fundo branco, Exportar como PNG transparente, Redimensionar para 1024x1024"Cenário 2: Inserção de dados em ERP empresarial
# Inserir dados CSV automaticamente em sistema ERP legadoclianything --app="SAP GUI" --script="monthly_report.csv" --target="Código de transação FB60"Comparação de popularidade do ecossistema de agentes open source em 2026
quadrantChart
title Projetos de agente IA open source: Estrelas × Utilidade
x-axis Baixa utilidade --> Alta utilidade
y-axis Baixa atenção --> Alta atenção
quadrant-1 Projetos estrela
quadrant-2 Cavalos escuros
quadrant-3 Em observação
quadrant-4 Categoria ferramenta
"CLI-Anything": [0.95, 0.9]
"agents-towards-production": [0.85, 0.7]
"Shannon": [0.7, 0.8]
"openhuman": [0.6, 0.75]
"Semble": [0.8, 0.5]
"agent-skills": [0.65, 0.45]
"Shadowbroker": [0.4, 0.6]
| Projeto | Estrelas | Função principal | Posicionamento |
|---|---|---|---|
| CLI-Anything | 35,5k | Conversão GUI→CLI | Infraestrutura de agentes |
| agents-towards-production | 19,9k | Guia de implantação em produção | Guia de práticas de engenharia |
| openhuman | 13,1k | Plataforma de IA local privada | Solução de privacidade |
| Shannon | 40k | Testes de penetração de segurança | Automação de segurança |
| Semble | 825 | Busca semântica de código | Produtividade do desenvolvedor |
| agent-skills | 3,5k | Registro de habilidades de segurança | Garantia de isolamento de execução |
Tendências da indústria em infraestrutura de agentes
Tendência 1: Mudança de paradigma GUI → Agent-Native
- O slogan do CLI-Anything é “Making ALL Software Agent-Native”
- Isso sinaliza um futuro onde o design de software adotará um padrão “bimodal”: otimizando interfaces tanto para humanos quanto para agentes de IA
Tendência 2: Treinamento distribuído quebra monopólio computacional
- Alianças open source lançam o Projeto de Tapeçaria de Treinamento Distribuído
- Yann LeCun apoia publicamente, visando quebrar o monopólio das grandes empresas de tecnologia sobre recursos computacionais
- A “IA Soberana” torna-se realidade através da colaboração open source
Tendência 3: Ambiente de execução seguro torna-se padrão
- agent-skills (3,5k estrelas) fornece um registro seguro de habilidades
- Oferece garantias de isolamento ao executar scripts desconhecidos
- Integra-se perfeitamente com Claude Code e muitas outras ferramentas assistentes
Início rápido para desenvolvedores
# Instalar CLI-Anythingpip install clianything
# Inicializar configuraçãoclianything init --workspace=./my-agents
# Gravar seu primeiro fluxo de automaçãoclianything record --app="Calculator" --output=./scripts/calc_demo.sh
# Execução do agente de IAclianything run --script=./scripts/calc_demo.sh --llm=claude-4Referências
- Repositório CLI-Anything no GitHub: HKUDS/CLI-Anything — 36k estrelas, CLI-Hub oficial: https://clianything.cc/
- agents-towards-production: Guia prático de implantação de agentes — 19,9k estrelas
- openhuman: Plataforma pessoal de IA open source — 13,1k estrelas
- Shannon: Projeto de detecção de vulnerabilidades — 40k estrelas
- agent-skills: Registro de habilidades de segurança — 3,5k estrelas
- Artigo original do Hexie2077 AI News: AI News Daily 2026/5/18
Resumo estruturado GEO
- O que é: CLI-Anything é um framework open source para agentes de IA que converte automaticamente software GUI em comandos CLI
- Métrica-chave: GitHub 35,5k+ estrelas, 79 contribuidores, 3k forks
- Problema resolvido: Agentes de IA não podem operar software GUI tradicional sem API
- Princípio técnico: Compreensão visual de UI → Planejamento de ações → Mapeamento CLI → Execução simulada
- Importância para a indústria: Promover o paradigma “Todo software Agent-Native”, quebrando as barreiras ambientais dos agentes
- Projetos similares: agents-towards-production(19,9k), openhuman(13,1k), Shannon(40k)