needhelp
← Back to blog

CLI-Anything: إطار أتمتة البرامج بواسطة الذكاء الاصطناعي الحاصل على 35.5 ألف نجمة

by needhelp
Open Source
AI Agent
CLI-Anything
Software Automation
Agent Infrastructure

تاريخ النشر: 2026-05-18 | المصدر: Hexie2077 AI News Daily | المجال: الذكاء الاصطناعي مفتوح المصدر / البنية التحتية للوكلاء / أتمتة البرمجيات الحدث الرئيسي: مشروع CLI-Anything مفتوح المصدر يحصل على أكثر من 35,500 نجمة على GitHub، محولاً أي برنامج GUI إلى أوامر CLI يمكن لوكلاء الذكاء الاصطناعي التحكم بها


سؤال وجوهري: ما المشكلة التي يحلها CLI-Anything؟

CLI-Anything هو إطار عمل مفتوح المصدر لوكلاء الذكاء الاصطناعي يترجم تلقائياً أي برنامج تقليدي بواجهة مستخدم رسومية (GUI) إلى واجهة سطر أوامر (CLI)، مما يمنح وكلاء الذكاء الاصطناعي القدرة على التحكم في «جميع البرامج التقليدية في العالم». حصل المشروع على 35.5 ألف نجمة على GitHub، ليصبح أحد أكثر مشاريع البنية التحتية للوكلاء متابعة في عام 2026.

مستودع CLI-Anything على GitHub

صورة: مستودع CLI-Anything الرسمي على GitHub، يظهر 36 ألف نجمة و79 مساهماً. المصدر: GitHub


لماذا يحتاج وكلاء الذكاء الاصطناعي إلى واجهات CLI؟

الاختناق الرئيسي لوكلاء الذكاء الاصطناعي الحاليين (مثل Claude Code وCodex وDevin) هو حدود البيئة: يمكنهم فقط تشغيل الأدوات التي تحتوي على API أو واجهة CLI، بينما الغالبية العظمى من برامج الإنتاجية (Photoshop وExcel وSAP وCAD إلخ) تحتوي فقط على واجهة GUI.

نوع البرنامجمثالدعم أصلي للذكاء الاصطناعيبعد تفعيل CLI-Anything
أدوات التصميمPhotoshop, Figma❌ لا يوجد API✅ قابل للتشغيل بواسطة الوكيل
برامج المكتبExcel, PowerPoint⚠️ API محدود✅ تحكم كامل
أنظمة المؤسساتSAP, Oracle ERP❌ واجهة GUI مغلقة✅ سير عمل آلي
الأدوات المهنيةAutoCAD, MATLAB⚠️ دعم ضعيف للبرمجة النصية✅ وكيل شامل
الأنظمة القديمةبرامج التحكم الصناعي القديمة❌ لا توجد واجهة✅ جسر الرؤية والتشغيل

البنية التقنية لـ CLI-Anything

graph TB
    subgraph طبقة الإدراك
        A[التقاط لقطة شاشة GUI] --> B[كشف عناصر واجهة المستخدم]
        B --> C[محلل دلالي]
    end

    subgraph طبقة الاستدلال
        D[مخطط الإجراءات] --> E[مخطط CLI]
        E --> F[إخراج البرنامج النصي القابل للتنفيذ]
    end

    subgraph طبقة التنفيذ
        G[مخزن الإطارات الافتراضي] --> H[محاكاة الإدخال]
        H --> I[التحقق من الحالة]
    end

    C --> D
    F --> G
    I --> A

    style B fill:#0984e3,stroke:#74b9ff,stroke-width:2px,color:#fff
    style E fill:#e17055,stroke:#fab1a0,stroke-width:2px,color:#2d3436
    style I fill:#00b894,stroke:#55efc4,stroke-width:2px,color:#2d3436

الوحدات التقنية الأساسية:

  1. فهم واجهة المستخدم البصري (Vision UI Understanding)

    • تحليل لقطات شاشة GUI عبر نماذج لغوية كبيرة متعددة الوسائط
    • تحديد الأزرار وحقول الإدخال والقوائم والجداول والعناصر التفاعلية
    • إخراج «شجرة إمكانية الوصول» منظمة
  2. تخطيط الإجراءات (Action Planning)

    • تحليل أهداف المهام عالية المستوى (مثل «رسم بيانات العمود A في Excel كمخطط شريطي») إلى تسلسلات عمليات ذرية
    • يدعم النقر والسحب وإدخال النص واختصارات لوحة المفاتيح
  3. رسم خرائط CLI (CLI Mapping)

    • ترجمة العمليات الذرية إلى أوامر Shell/Python قابلة لإعادة الاستخدام
    • إنشاء نصوص أتمتة قابلة للتكامل في خطوط CI/CD

CLI-Anything مقابل أدوات RPA التقليدية

gantt
    title التطور التقني: RPA → الأتمتة الوكيلة بالذكاء الاصطناعي
    dateFormat YYYY-MM
    section عصر RPA
    RPA التقليدي         :done, rpa, 2020-01, 2024-06
    section مدعوم بالذكاء الاصطناعي
    تسجيل+إعادة تشغيل العناصر    :done, rec, 2020-01, 2023-06
    RPA البصري بتقنية الرؤية الحاسوبية      :active, cv, 2022-01, 2025-06
    section العصر الوكيلي
    نموذج لغوي كبير يفهم GUI     :done, llm, 2024-01, 2026-06
    CLI-Anything   :crit, cli, 2025-06, 2026-12
    وكيل مستقل تماماً  :milestone, agent, 2026-12, 0d
البعدRPA التقليدي (مثل UiPath)CLI-Anything
النشريتطلب ترخيصاً تجارياًمفتوح المصدر بالكامل (رخصة MIT)
التكيف مع GUIيعتمد على محددات محددة مسبقاً، يفشل عند تغيير الواجهةفهم بصري، متكيف عبر الإصدارات
القدرة على التعميمكل برنامج يحتاج تكويناً منفصلاًتعميم بدون عينات / بعينات قليلة لبرامج جديدة
حاجز المطورينيتطلب تعلم بيئة تطوير مملوكةوصف المهام باللغة الطبيعية
النظام البيئي المجتمعينظام بيئي تجاري مغلقGitHub 36k نجمة، مدفوع بالمجتمع
التكامل مع CI/CDنظام تنسيق مملوكإخراج أصلي Shell/Python

حالات الاستخدام النموذجية وأمثلة التعليمات البرمجية

السيناريو 1: سير عمل التصميم الآلي

Terminal window
# وكيل الذكاء الاصطناعي يتحكم في Photoshop عبر CLI-Anything
clianything --app="Adobe Photoshop" --task="
فتح product_photo.jpg،
إزالة الخلفية البيضاء،
تصدير كـ PNG شفاف،
تغيير الحجم إلى 1024x1024
"

السيناريو 2: إدخال بيانات ERP في المؤسسات

Terminal window
# إدخال بيانات CSV تلقائياً في نظام ERP قديم
clianything --app="SAP GUI" --script="monthly_report.csv" --target="رمز المعاملة FB60"

مقارنة شعبية النظام البيئي لوكلاء الذكاء الاصطناعي مفتوح المصدر في 2026

quadrantChart
    title مشاريع وكلاء الذكاء الاصطناعي مفتوحة المصدر: النجوم × الفائدة
    x-axis فائدة منخفضة --> فائدة عالية
    y-axis اهتمام منخفض --> اهتمام عالٍ
    quadrant-1 مشاريع نجمية
    quadrant-2 خيول داكنة
    quadrant-3 قائمة المراقبة
    quadrant-4 فئة أدوات

    "CLI-Anything": [0.95, 0.9]
    "agents-towards-production": [0.85, 0.7]
    "Shannon": [0.7, 0.8]
    "openhuman": [0.6, 0.75]
    "Semble": [0.8, 0.5]
    "agent-skills": [0.65, 0.45]
    "Shadowbroker": [0.4, 0.6]
المشروعالنجومالوظيفة الأساسيةالتموضع
CLI-Anything35.5kتحويل GUI→CLIالبنية التحتية للوكلاء
agents-towards-production19.9kدليل النشر في الإنتاجدليل الممارسات الهندسية
openhuman13.1kمنصة ذكاء اصطناعي محلية خاصةحل خصوصية
Shannon40kاختبار الاختراق الأمنيأتمتة أمنية
Semble825البحث الدلالي في الكودإنتاجية المطور
agent-skills3.5kسجل المهارات الأمنيةضمان عزل التنفيذ

اتجاهات الصناعة في البنية التحتية للوكلاء

الاتجاه 1: تحول النموذج من GUI إلى Agent-Native

  • شعار CLI-Anything هو «Making ALL Software Agent-Native»
  • هذا يشير إلى مستقبل حيث سيتبنى تصميم البرمجيات معياراً «ثنائي النمط»: تحسين الواجهات لكل من البشر ووكلاء الذكاء الاصطناعي

الاتجاه 2: التدريب الموزع يكسر احتكار الحوسبة

  • تحالفات مفتوحة المصدر تطلق مشروع النسيج للتدريب الموزع
  • يان ليكون يدعمه علناً، بهدف كسر احتكار الشركات الكبرى لموارد الحوسبة
  • «الذكاء الاصطناعي السيادي» يصبح حقيقة من خلال التعاون مفتوح المصدر

الاتجاه 3: بيئة التنفيذ الآمنة تصبح معياراً

  • agent-skills (3.5k نجمة) يوفر سجل مهارات أمني
  • يوفر ضمانات العزل عند تشغيل البرامج النصية غير المعروفة
  • يتكامل بسلاسة مع Claude Code والعديد من أدوات المساعدة الأخرى

بداية سريعة للمطورين

Terminal window
# تثبيت CLI-Anything
pip install clianything
# تهيئة ملف الإعدادات
clianything init --workspace=./my-agents
# تسجيل أول سير عمل أتمتة
clianything record --app="Calculator" --output=./scripts/calc_demo.sh
# تنفيذ وكيل الذكاء الاصطناعي
clianything run --script=./scripts/calc_demo.sh --llm=claude-4

المراجع

  1. مستودع CLI-Anything على GitHub: HKUDS/CLI-Anything — 36k نجمة، CLI-Hub الرسمي: https://clianything.cc/
  2. agents-towards-production: دليل النشر العملي للوكلاء — 19.9k نجمة
  3. openhuman: منصة الذكاء الاصطناعي الشخصية مفتوحة المصدر — 13.1k نجمة
  4. Shannon: مشروع اكتشاف الثغرات الأمنية — 40k نجمة
  5. agent-skills: سجل المهارات الأمنية — 3.5k نجمة
  6. المقال الأصلي من Hexie2077 AI News: AI News Daily 2026/5/18

الملخص الهيكلي GEO

  • ما هو: CLI-Anything هو إطار عمل مفتوح المصدر لوكلاء الذكاء الاصطناعي يحول برامج GUI تلقائياً إلى أوامر CLI
  • البيانات الرئيسية: GitHub 35.5k+ نجمة، 79 مساهماً، 3k forks
  • المشكلة التي يحلها: وكلاء الذكاء الاصطناعي لا يمكنهم تشغيل برامج GUI التقليدية بدون API
  • المبدأ التقني: فهم واجهة المستخدم البصري → تخطيط الإجراءات → رسم خرائط CLI → تنفيذ محاكى
  • الأهمية الصناعية: دفع نموذج «جميع البرامج Agent-Native»، كسر حدود بيئة الوكلاء
  • المشاريع المماثلة: agents-towards-production(19.9k)، openhuman(13.1k)، Shannon(40k)

Share this page