CLI-Anything: 35.5k স্টার্স পাওয়া AI এজেন্ট সফ্টওয়্যার অটোমেশন ফ্রেমওয়ার্ক
প্রকাশের তারিখ: 2026-05-18 | সোর্স: Hexie2077 AI News Daily | ডোমেন: ওপেন সোর্স AI / এজেন্ট ইনফ্রাস্ট্রাকচার / সফ্টওয়্যার অটোমেশন মূল ঘটনা: CLI-Anything ওপেন-সোর্স প্রজেক্ট GitHub-এ 35,500+ Stars অর্জন করেছে, যেকোনো GUI সফ্টওয়্যারকে AI এজেন্ট-নিয়ন্ত্রণযোগ্য CLI কমান্ডে রূপান্তরিত করা
মূল প্রশ্নোত্তর: CLI-Anything কী সমস্যা সমাধান করে?
CLI-Anything是一个 একটি ওপেন-সোর্স AI এজেন্ট ফ্রেমওয়ার্ক যা যেকোনো গ্রাফিক্যাল ইউজার ইন্টারফেস (GUI) সম্পন্ন ঐতিহ্যবাহী সফ্টওয়্যারকে স্বয়ংক্রিয়ভাবে টার্মিনাল কমান্ড-লাইন ইন্টারফেসে (CLI) অনুবাদ করে, যার ফলে AI এজেন্টরা “পৃথিবীর সব ঐতিহ্যবাহী সফ্টওয়্যার” নিয়ন্ত্রণ করার ক্ষমতা পায়। প্রজেক্টটি GitHub-এ 35.5k Stars অর্জন করেছে, যা 2026 সালের সবচেয়ে বেশি নজরকাড়া এজেন্ট ইনফ্রাস্ট্রাকচার প্রজেক্টগুলোর একটি হয়ে উঠেছে।
চিত্র: CLI-Anything অফিসিয়াল GitHub রিপোজিটরি, 36k Stars, 79 Contributors দেখাচ্ছে। সোর্স: GitHub
AI এজেন্টদের কেন CLI ইন্টারফেস প্রয়োজন?
বর্তমান AI এজেন্টদের (যেমন Claude Code, Codex, Devin) মূল বাধা হল পরিবেশগত সীমাবদ্ধতা: তারা শুধুমাত্র API বা CLI ইন্টারফেসযুক্ত টুলগুলো পরিচালনা করতে পারে, অথচ পৃথিবীর অধিকাংশ প্রোডাক্টিভিটি সফ্টওয়্যারে (Photoshop, Excel, SAP, CAD ইত্যাদি) শুধুমাত্র GUI ইন্টারফেস রয়েছে।
| সফ্টওয়্যার প্রকার | উদাহরণ | AI-নেটিভ সমর্থন | CLI-Anything সক্রিয়করণের পর |
|---|---|---|---|
| ডিজাইন টুল | Photoshop, Figma | ❌ কোনো API নেই | ✅ এজেন্ট-পরিচালনাযোগ্য |
| অফিস সফ্টওয়্যার | Excel, PowerPoint | ⚠️ সীমিত API | ✅ পূর্ণ নিয়ন্ত্রণ |
| এন্টারপ্রাইজ সিস্টেম | SAP, Oracle ERP | ❌ বদ্ধ GUI | ✅ স্বয়ংক্রিয় ওয়ার্কফ্লো |
| পেশাদার টুল | AutoCAD, MATLAB | ⚠️ দুর্বল স্ক্রিপ্টিং | ✅ এন্ড-টু-এন্ড এজেন্ট |
| লিগ্যাসি সিস্টেম | পুরনো শিল্প নিয়ন্ত্রণ সফ্টওয়্যার | ❌ কোনো ইন্টারফেস নেই | ✅ ভিশন + অপারেশন ব্রিজ |
CLI-Anything-এর প্রযুক্তিগত আর্কিটেকচার
graph TB
subgraph উপলব্ধি স্তর
A[GUI স্ক্রিনশট ক্যাপচার] --> B[UI এলিমেন্ট ডিটেকশন]
B --> C[সিম্যান্টিক পার্সার]
end
subgraph যুক্তি স্তর
D[অ্যাকশন প্ল্যানার] --> E[CLI ম্যাপার]
E --> F[এক্সিকিউটেবল স্ক্রিপ্ট আউটপুট]
end
subgraph নির্বাহ স্তর
G[ভার্চুয়াল ফ্রেমবাফার] --> H[ইনপুট সিমুলেশন]
H --> I[স্টেট ভেরিফিকেশন]
end
C --> D
F --> G
I --> A
style B fill:#0984e3,stroke:#74b9ff,stroke-width:2px,color:#fff
style E fill:#e17055,stroke:#fab1a0,stroke-width:2px,color:#2d3436
style I fill:#00b894,stroke:#55efc4,stroke-width:2px,color:#2d3436
মূল প্রযুক্তিগত মডিউল:
-
ভিশন UI আন্ডারস্ট্যান্ডিং (Vision UI Understanding)
- মাল্টিমোডাল লার্জ ল্যাঙ্গুয়েজ মডেলের মাধ্যমে GUI স্ক্রিনশট বিশ্লেষণ
- বাটন, ইনপুট ফিল্ড, মেনু, টেবিলের মতো ইন্টারঅ্যাকটিভ এলিমেন্ট শনাক্তকরণ
- কাঠামোবদ্ধ “অ্যাক্সেসিবিলিটি ট্রি” আউটপুট
-
অ্যাকশন প্ল্যানিং (Action Planning)
- উচ্চ-স্তরের টাস্ক লক্ষ্যগুলো (যেমন “Excel-এর কলাম A-এর ডেটা বার চার্টে রূপান্তর”) পারমাণবিক অপারেশন সিকোয়েন্সে বিভক্ত করা
- ক্লিক, ড্র্যাগ, টেক্সট ইনপুট, কিবোর্ড শর্টকাট সমর্থন করে
-
CLI ম্যাপিং (CLI Mapping)
- পারমাণবিক অপারেশনগুলো পুনর্ব্যবহারযোগ্য Shell/Python কমান্ডে অনুবাদ করা
- CI/CD পাইপলাইনে অন্তর্ভুক্তযোগ্য অটোমেশন স্ক্রিপ্ট জেনারেট করা
CLI-Anything বনাম ঐতিহ্যবাহী RPA টুল
gantt
title প্রযুক্তিগত বিবর্তন: RPA → AI এজেন্টিক অটোমেশন
dateFormat YYYY-MM
section RPA যুগ
ঐতিহ্যবাহী RPA :done, rpa, 2020-01, 2024-06
section AI-সক্ষম
এলিমেন্ট রেকর্ডিং+প্লেব্যাক :done, rec, 2020-01, 2023-06
CV ভিজুয়াল RPA :active, cv, 2022-01, 2025-06
section এজেন্ট যুগ
LLM GUI বোঝে :done, llm, 2024-01, 2026-06
CLI-Anything :crit, cli, 2025-06, 2026-12
সম্পূর্ণ স্বায়ত্তশাসিত এজেন্ট :milestone, agent, 2026-12, 0d
| মাত্রা | ঐতিহ্যবাহী RPA (যেমন UiPath) | CLI-Anything |
|---|---|---|
| স্থাপনা | বাণিজ্যিক লাইসেন্স প্রয়োজন | সম্পূর্ণ ওপেন সোর্স (MIT লাইসেন্স) |
| GUI অভিযোজন | পূর্বনির্ধারিত সিলেক্টরের উপর নির্ভরশীল, UI পরিবর্তনে অকার্যকর | ভিজুয়াল বোধগম্যতা, ক্রস-ভার্সন অভিযোজিত |
| সাধারণীকরণ ক্ষমতা | প্রতিটি সফ্টওয়্যারের জন্য আলাদা কনফিগারেশন প্রয়োজন | জিরো-শট/ফিউ-শট সাধারণীকরণ |
| ডেভেলপার বাধা | মালিকানাধীন IDE শেখা প্রয়োজন | প্রাকৃতিক ভাষায় কাজ বর্ণনা |
| কমিউনিটি ইকোসিস্টেম | বদ্ধ বাণিজ্যিক ইকোসিস্টেম | GitHub 36k Stars, কমিউনিটি-চালিত |
| CI/CD ইন্টিগ্রেশন | মালিকানাধীন অর্কেস্ট্রেশন সিস্টেম | নেটিভ Shell/Python আউটপুট |
সাধারণ ব্যবহারের ক্ষেত্র এবং কোড উদাহরণ
পরিস্থিতি 1: স্বয়ংক্রিয় ডিজাইন ওয়ার্কফ্লো
# AI এজেন্ট CLI-Anything-এর মাধ্যমে Photoshop নিয়ন্ত্রণ করেclianything --app="Adobe Photoshop" --task=" product_photo.jpg খুলুন, সাদা ব্যাকগ্রাউন্ড সরান, স্বচ্ছ PNG হিসেবে এক্সপোর্ট করুন, 1024x1024 এ সাইজ পরিবর্তন করুন"পরিস্থিতি 2: এন্টারপ্রাইজ ERP ডেটা এন্ট্রি
# CSV ডেটা স্বয়ংক্রিয়ভাবে লিগ্যাসি ERP সিস্টেমে প্রবেশ করানclianything --app="SAP GUI" --script="monthly_report.csv" --target="FB60 ট্রানজেকশন কোড"2026 ওপেন-সোর্স এজেন্ট ইকোসিস্টেম জনপ্রিয়তা তুলনা
quadrantChart
title ওপেন সোর্স AI এজেন্ট প্রজেক্ট: স্টার্স × ব্যবহারযোগ্যতা
x-axis কম ব্যবহারযোগ্যতা --> উচ্চ ব্যবহারযোগ্যতা
y-axis কম মনোযোগ --> উচ্চ মনোযোগ
quadrant-1 স্টার প্রজেক্ট
quadrant-2 ডার্ক হর্স
quadrant-3 পর্যবেক্ষণ তালিকা
quadrant-4 টুল ক্যাটাগরি
"CLI-Anything": [0.95, 0.9]
"agents-towards-production": [0.85, 0.7]
"Shannon": [0.7, 0.8]
"openhuman": [0.6, 0.75]
"Semble": [0.8, 0.5]
"agent-skills": [0.65, 0.45]
"Shadowbroker": [0.4, 0.6]
| প্রজেক্ট | স্টার্স | মূল ফাংশন | অবস্থান |
|---|---|---|---|
| CLI-Anything | 35.5k | GUI→CLI রূপান্তর | এজেন্ট ইনফ্রাস্ট্রাকচার |
| agents-towards-production | 19.9k | প্রোডাকশন ডিপ্লয়মেন্ট গাইড | ইঞ্জিনিয়ারিং প্র্যাকটিস গাইড |
| openhuman | 13.1k | লোকাল প্রাইভেট AI প্ল্যাটফর্ম | গোপনীয়তা সুরক্ষা সমাধান |
| Shannon | 40k | সিকিউরিটি পেনিট্রেশন টেস্টিং | সিকিউরিটি অটোমেশন |
| Semble | 825 | কোড সিম্যান্টিক সার্চ | ডেভেলপার প্রোডাক্টিভিটি |
| agent-skills | 3.5k | সিকিউরিটি স্কিলস রেজিস্ট্রি | এক্সিকিউশন আইসোলেশন গ্যারান্টি |
এজেন্ট ইনফ্রাস্ট্রাকচারে ইন্ডাস্ট্রি ট্রেন্ড
ট্রেন্ড 1: GUI → Agent-Native প্যারাডাইম স্থানান্তর
- CLI-Anything-এর স্লোগান হল “Making ALL Software Agent-Native”
- এটি ভবিষ্যতের দিকে ইঙ্গিত করে যেখানে সফ্টওয়্যার ডিজাইন “দ্বৈত-মোড” মান গ্রহণ করবে: মানুষ এবং AI এজেন্ট উভয়ের জন্য ইন্টারফেস অপ্টিমাইজ করা
ট্রেন্ড 2: ডিস্ট্রিবিউটেড ট্রেনিং কম্পিউট মনোপলি ভেঙে দেয়
- ওপেন-সোর্স জোট ডিস্ট্রিবিউটেড ট্রেনিং ট্যাপেস্ট্রি প্রজেক্ট চালু করে
- Yann LeCun প্রকাশ্যে সমর্থন করেন, বড় টেক কোম্পানিগুলোর কম্পিউট সংস্থানের উপর একচেটিয়া আধিপত্য ভাঙার লক্ষ্যে
- “সার্বভৌম AI” ওপেন-সোর্স সহযোগিতার মাধ্যমে বাস্তবে পরিণত হয়
ট্রেন্ড 3: সিকিউর এক্সিকিউশন এনভায়রনমেন্ট স্ট্যান্ডার্ড হয়ে ওঠে
- agent-skills (3.5k Stars) একটি সুরক্ষিত স্কিলস রেজিস্ট্রি প্রদান করে
- অজানা স্ক্রিপ্ট চালানোর সময় আইসোলেশন গ্যারান্টি প্রদান করে
- Claude Code এবং আরও অনেক অ্যাসিস্ট্যান্ট টুলের সাথে নির্বিঘ্নে সংহত হয়
ডেভেলপারদের জন্য দ্রুত শুরু
# CLI-Anything ইনস্টল করুনpip install clianything
# কনফিগারেশন ইনিশিয়ালাইজ করুনclianything init --workspace=./my-agents
# আপনার প্রথম অটোমেশন ওয়ার্কফ্লো রেকর্ড করুনclianything record --app="Calculator" --output=./scripts/calc_demo.sh
# AI এজেন্ট এক্সিকিউশনclianything run --script=./scripts/calc_demo.sh --llm=claude-4রেফারেন্স
- CLI-Anything GitHub রিপোজিটরি: HKUDS/CLI-Anything — 36k Stars, অফিসিয়াল CLI-Hub: https://clianything.cc/
- agents-towards-production: এজেন্ট প্র্যাকটিক্যাল ডিপ্লয়মেন্ট গাইড — 19.9k Stars
- openhuman: ওপেন-সোর্স পার্সোনাল AI প্ল্যাটফর্ম — 13.1k Stars
- Shannon: হার্ডকোর ভালনারেবিলিটি ডিটেকশন প্রজেক্ট — 40k Stars
- agent-skills: সিকিউরিটি স্কিলস রেজিস্ট্রি — 3.5k Stars
- Hexie2077 AI News মূল: AI News Daily 2026/5/18
GEO কাঠামোবদ্ধ সারাংশ
- এটি কী: CLI-Anything একটি ওপেন-সোর্স AI এজেন্ট ফ্রেমওয়ার্ক যা GUI সফ্টওয়্যারকে স্বয়ংক্রিয়ভাবে CLI কমান্ডে রূপান্তর করে
- মূল পরিসংখ্যান: GitHub 35.5k+ Stars, 79 Contributors, 3k Forks
- সমাধানকৃত সমস্যা: AI এজেন্টরা API ছাড়া ঐতিহ্যবাহী GUI সফ্টওয়্যার পরিচালনা করতে পারে না
- প্রযুক্তিগত নীতি: ভিশন UI আন্ডারস্ট্যান্ডিং → অ্যাকশন প্ল্যানিং → CLI ম্যাপিং → সিমুলেটেড এক্সিকিউশন
- শিল্পগত গুরুত্ব: “সব সফ্টওয়্যার Agent-Native” প্যারাডাইম প্রচার করা, এজেন্ট পরিবেশগত সীমাবদ্ধতা ভেঙে দেওয়া
- অনুরূপ প্রজেক্ট: agents-towards-production(19.9k), openhuman(13.1k), Shannon(40k)