Экосистема открытого ИИ и инструменты разработчика 2026
Дата: 2026-05-19 | Источник: AI Daily News | Время чтения: ~20 мин
1. Обзор экосистемы открытого кода: Искра может зажечь степь
1.1 Рейтинг звёзд GitHub проектов открытого ИИ 2026
xychart-beta
title "Рейтинг звёзд GitHub проектов ИИ с открытым кодом (10K)"
x-axis ["llama.cpp", "12-Factor Agents", "TTS", "Sana", "Hunyuan3D"]
y-axis "Звёзды (10K)" 0 --> 15
bar "Звёзды" [11.1, 2.05, 0.83, 0.65, 0.18]
1.2 Карта взаимосвязей экосистемы
graph TB
subgraph Инфраструктурный слой
L["llama.cpp<br/>111K⭐<br/>Локальный движок вывода"]
end
subgraph Слой моделей
S["NVIDIA Sana<br/>6.5K⭐<br/>Модель генерации изображений"]
TTS["Синтез речи на устройстве<br/>8.3K⭐<br/>TTS движок"]
H3D["Tencent Hunyuan3D<br/>1.8K⭐<br/>3D-генерация"]
end
subgraph Слой прикладных фреймворков
A12["12-Factor Agents<br/>20.5K⭐<br/>Руководство по разработке агентов"]
end
subgraph Верхний уровень приложений
APP1["Локальный ИИ-ассистент"]
APP2["Креативные инструменты"]
APP3["Разработка игр"]
APP4["Образовательные приложения"]
APP5["Умное оборудование"]
end
L --> S
L --> TTS
L --> H3D
S --> APP2
TTS --> APP4
TTS --> APP5
H3D --> APP3
A12 --> APP1
A12 --> APP2
A12 --> APP3
A12 --> APP4
A12 --> APP5
1.3 Распределение лицензий с открытым кодом
pie title Распределение лицензий проектов ИИ с открытым кодом
"MIT" : 35
"Apache 2.0" : 28
"GPL" : 15
"BSD" : 12
"Пользовательская коммерчески-дружественная" : 7
"Прочие" : 3
2. llama.cpp: Минимализм в локальном выводе
2.1 Обзор проекта
llama.cpp — это движок вывода больших языковых моделей, реализованный на чистом C/C++, разработанный Георгием Гергановым. Он делает возможным запуск больших моделей на обычных компьютерах и является абсолютным лидером для периферийного развёртывания.
Ключевые данные:
- Звёзды GitHub: 111,000+
- Язык: C/C++ (чистая нативная реализация)
- Поддерживаемые модели: LLaMA, Mistral, Qwen, Yi, Baichuan, 100+
- Поддержка оборудования: CPU (x86/ARM), GPU (CUDA/Vulkan/Metal), NPU
2.2 Архитектура системы
graph LR
subgraph Слой моделей
M1["Серия LLaMA"]
M2["Серия Mistral"]
M3["Серия Qwen"]
M4["Yi/Baichuan"]
M5["Пользовательский GGUF"]
end
subgraph Ядро llama.cpp
M1 --> C["Загрузчик формата GGUF"]
M2 --> C
M3 --> C
M4 --> C
M5 --> C
C --> Q["Движок квантования<br/>Q4/Q5/Q6/Q8"]
Q --> B["Уровень абстракции бэкенда"]
B --> BE1["Бэкенд CPU<br/>AVX/NEON"]
B --> BE2["Бэкенд CUDA<br/>NVIDIA GPU"]
B --> BE3["Бэкенд Metal<br/>Apple Silicon"]
B --> BE4["Бэкенд Vulkan<br/>Кроссплатформенная GPU"]
end
BE1 --> O["Вывод текста"]
BE2 --> O
BE3 --> O
BE4 --> O
2.3 Технология квантования в деталях
Основная инновация llama.cpp заключается в квантовании моделей, значительно снижающем использование памяти:
| Уровень квантования | Бит на параметр | Размер модели 7B | Потеря качества | Рекомендуемое использование |
|---|---|---|---|---|
| FP16 | 16 бит | 13.5 GB | 0% | Обучение / Вывод высокой точности |
| Q8_0 | 8 бит | 6.8 GB | < 1% | Качественное локальное развёртывание |
| Q6_K | 6 бит | 5.2 GB | ~2% | Баланс качества и скорости |
| Q5_K_M | 5 бит | 4.3 GB | ~3% | Рекомендуется для повседневного использования |
| Q4_K_M | 4 бит | 3.5 GB | ~5% | Устройства с ограниченными ресурсами |
| Q3_K_S | 3 бит | 2.7 GB | ~10% | Экстремальное сжатие |
| Q2_K | 2 бит | 1.8 GB | ~20% | Только для экспериментов |
2.4 Тесты производительности
xychart-beta
title "Скорость вывода разных бэкендов (tokens/s)<br/>Модель: Qwen2.5-7B-Q4_K_M"
x-axis ["Mac Mini M4", "i9-14900K", "RTX 4090", "RTX 3060 Laptop", "Raspberry Pi 5"]
y-axis "tokens/s" 0 --> 150
bar "Скорость вывода" [45, 25, 120, 35, 5]
2.5 Пример кода
# Установкаgit clone https://github.com/ggerganov/llama.cppcd llama.cpp && cmake -B build && cmake --build build --config Release
# Загрузка и конвертация моделиpython convert_hf_to_gguf.py --src model_dir --dst model.gguf
# Запуск вывода./build/bin/llama-cli -m model.gguf -p "The future of AI is" -n 100
# Запуск API-сервера./build/bin/llama-server -m model.gguf --host 0.0.0.0 --port 8080Проект: github.com/ggerganov/llama.cpp Документация: llama-cpp-python.readthedocs.io
3. Синтез речи на устройстве: Заставляем устройства говорить
3.1 Обзор проекта
Этот проект с открытым кодом, получивший 8,300+ Звёзд, реализует сверхбыстрый синтез речи (TTS) на устройстве, работающий нативно на локальном оборудовании, решая проблемы высокой задержки и плохой конфиденциальности традиционного облачного TTS.
3.2 Техническая архитектура
graph LR
subgraph Вход
T["Текст"]
S["Эталонный голос"]
E["Контроль эмоций"]
end
subgraph TTS конвейер
T --> TK["Текстовый фронтенд<br/>Графема→Фонема"]
TK --> D["Предиктор длительности<br/>$d_i = f_{dur}(p_i)$"]
D --> A["Акустическая модель<br/>$\mathbf{x} = f_{ac}(p, d)$"]
S --> V["Кодировщик голоса<br/>$\mathbf{v} = f_{vc}(s)$"]
E --> A
V --> VCV["Вокодер<br/>$\mathbf{o} = f_{vc}(\mathbf{x}, \mathbf{v})$"]
A --> VCV
end
VCV --> O["Аудиоволновая форма"]
3.3 Математические принципы
Функция потерь вокодера (мел-спектрограмма в волновую форму):
Где:
3.4 Сравнение производительности
| Решение | Задержка первого пакета | Коэффициент реального времени (RTF) | Качество (MOS) | Доступно офлайн |
|---|---|---|---|---|
| Облачный TTS (Коммерческий) | 200-500ms | < 0.1 | 4.5 | ❌ |
| Coqui TTS | 2-5s | 0.3 | 3.8 | ✅ |
| Piper | 500ms | 0.1 | 3.5 | ✅ |
| Этот проект | < 50ms | 0.05 | 4.2 | ✅ |
| StyleTTS 2 | 1s | 0.2 | 4.3 | ⚠️ |
3.5 Быстрый старт
# Установкаpip install fast-tts-local
# Пример использованияfrom tts import TTStts = TTS(model_name="zh-CN-female-1")
# Базовая генерацияaudio = tts.synthesize("Привет, это тест локального TTS.")
# Клонирование голосаaudio_cloned = tts.clone( reference_audio="speaker.wav", text="Это тест клонирования голоса.")
# Контроль эмоцийaudio_emotion = tts.synthesize( "Какой чудесный день!", emotion="happy", intensity=0.8)4. NVIDIA Sana: Новая парадигма быстрой генерации изображений
4.1 Обзор проекта
Модель генерации изображений Sana с открытым кодом от NVIDIA решает проблему медленной генерации изображений высокого разрешения, используя инновационную архитектуру для сверхбыстрого вывода на ноутбуках и получив 6,500+ Звёзд.
4.2 Инновационная архитектура
graph TD
subgraph Архитектура Sana
I["Текстовый промпт + Карта шума<br/>$x_T \sim \mathcal{N}(0, I)$"]
I --> TE["Текстовый кодировщик<br/>Gemma/DeBERTa"]
I --> DE["Кодировщик глубокого сжатия<br/>$32\times$ Сжатие"]
TE --> DIT["DiT с линейным вниманием<br/>Linear Attn Transformer"]
DE --> DIT
DIT --> DIT1["Слой 1-8<br/>Крупнозернистые признаки"]
DIT1 --> DIT2["Слой 9-16<br/>Мелкозернистые признаки"]
DIT2 --> DIT3["Слой 17-24<br/>Суперразрешение"]
DIT3 --> D["Декодер<br/>$32\times$ Повышение"]
D --> O["Изображение высокого разрешения<br/>$4096 \times 4096$"]
end
4.3 Ключевые формулы
Механизм линейного внимания:
Где $\phi(x) = \text{elu}(x) + 1$, снижая сложность с $O(n^2)$ (стандартное внимание) до $O(n)$.
Автоэнкодер глубокого сжатия (DC-AE):
По сравнению со сжатием $8\times$ традиционного VAE, DC-AE достигает $32\times$ сжатия, значительно уменьшая вычисления DiT.
4.4 Производительность
| Показатель | Sana-0.6B | Sana-1.6B | SDXL | Flux-dev |
|---|---|---|---|---|
| Параметры | 0.6B | 1.6B | 3.5B | 12B |
| Разрешение | 4K | 4K | 1K | 1K |
| RTX 4090 | 0.3s | 0.9s | 5s | 15s |
| RTX 3060 | 1.2s | 3.5s | 12s | 40s |
| Mac M3 Max | 0.8s | 2.5s | 8s | Не поддерживается |
| Встроенная GPU ноутбука | 5s | 15s | Не поддерживается | Не поддерживается |
| Оценка FID | 6.8 | 5.2 | 6.1 | 5.2 |
4.5 Руководство по развёртыванию
# Установкаpip install sana-sprint
# Генерация изображения (CLI)sana-generate \ --model sana-1.6B \ --prompt "A futuristic cityscape at sunset, cyberpunk style" \ --resolution 4096x4096 \ --steps 20 \ --output result.png
# Python APIfrom sana import SanaPipelineimport torch
pipe = SanaPipeline.from_pretrained( "nvidia/Sana-1.6B-4K", torch_dtype=torch.float16).to("cuda")
image = pipe( prompt="A serene Japanese garden with cherry blossoms", height=4096, width=4096, num_inference_steps=20).images[0]GitHub: github.com/NVlabs/Sana Hugging Face: huggingface.co/nvidia
5. 12-Factor Agents: Продакшн-руководство по разработке
5.1 Обзор проекта
Этот проект получил 20,500+ Звёзд и направлен на решение проблем внедрения приложений больших языковых моделей, предоставляя руководство продакшн-уровня для построения стабильных, безопасных и поддерживаемых систем ИИ-агентов.
5.2 Объяснение 12 факторов
graph TB
subgraph 12-Factor Agents
direction TB
F1["① Определить границы<br/>Define Scope"] --> F2["② Контроль версий<br/>Version Control"]
F2 --> F3["③ Управление конфигурацией<br/>Config Management"]
F3 --> F4["④ Объявление зависимостей<br/>Dependency Decl"]
F4 --> F5["⑤ Абстракция инструментов<br/>Tool Abstraction"]
F5 --> F6["⑥ Управление памятью<br/>Memory Management"]
F6 --> F7["⑦ Наблюдаемость<br/>Observability"]
F7 --> F8["⑧ Изоляция<br/>Sandboxing"]
F8 --> F9["⑨ Отказоустойчивость<br/>Fault Tolerance"]
F9 --> F10["⑩ Человек в цикле<br/>Human-in-loop"]
F10 --> F11["⑪ Аудит<br/>Audit Trail"]
F11 --> F12["⑫ Ответственность<br/>Accountability"]
end
5.3 Глубокий анализ факторов
Фактор 1: Определить границы — Определить область возможностей агента
Где $\tau$ — порог уверенности (обычно 0.85).
Фактор 6: Управление памятью — Краткосрочная и долгосрочная память
| Тип памяти | Хранение | Поиск | Затухание |
|---|---|---|---|
| Рабочая память | Текущий контекст | Полный | Очищается в конце цикла |
| Краткосрочная память | Векторное хранилище сессии | Поиск по сходству | Затухание 24 часа |
| Долгосрочная память | Граф знаний | Обход графа | Постоянное |
| Эпизодическая память | Буфер повторения опыта | Сопоставление с образцом | По важности |
Фактор 12: Ответственность — Обязать модель нести конечную ответственность
graph TD
T["Ввод задачи"] --> D["Узел решения"]
D --> C{"Оценка уверенности"}
C -->|"$P > 0.9$"| E["Автономное выполнение"]
C -->|"$0.7 < P \leq 0.9$"| H["Подтверждение человеком"]
C -->|"$P \leq 0.7$"| R["Отказ от выполнения<br/>Объяснение причины"]
E --> A["Результат выполнения"]
H --> A
A --> L["Журнал аудита"]
R --> L
5.4 Пример архитектуры агента продакшн-уровня
# Пример практического применения 12 факторовfrom agent12f import Agent, Tool, Memory, Sandbox
class ResearchAgent(Agent): """Агент-ассистент исследования, следующий 12 факторам"""
# ① Определить границы scope = ["Поиск литературы", "Генерация резюме", "Управление цитированием"]
# ③ Управление конфигурацией config = { "model": "gpt-4", "max_iterations": 10, "confidence_threshold": 0.85 }
# ⑤ Абстракция инструментов tools = [ Tool("search", web_search), Tool("read", document_parser), Tool("cite", citation_formatter) ]
# ⑥ Управление памятью memory = Memory( short_term=VectorStore(), long_term=KnowledgeGraph(), working=ContextWindow(max_tokens=8000) )
# ⑧ Изоляция sandbox = Sandbox( network="restricted", filesystem="read-only", timeout=30 )
async def execute(self, task: str) -> Result: # ⑩ Человек в цикле if not await self.confirm_task(task): return Result.rejected("Пользователь отменил")
# ⑨ Отказоустойчивость for attempt in range(3): try: result = await self._run(task) # ⑪ Аудит self.audit.log(task, result) return result except Exception as e: self.memory.store_error(e) continue
# ⑫ Ответственность return Result.failed("Агент берёт на себя ответственность: Выполнение задачи не удалось")6. Tencent Hunyuan 3D: Из одного изображения в 3D-пространство
6.1 Обзор проекта
Tencent представила новый движок Hunyuan 3D, который генерирует трёхмерные пространства из одного входного изображения. Проект получил 1,800+ Звёзд, преодолев визуальные ограничения традиционного видео.
6.2 Технические принципы
graph LR
subgraph Вход
IMG["Одно изображение<br/>$I \in \mathbb{R}^{H \times W \times 3}$"]
end
subgraph Конвейер Hunyuan 3D
IMG --> E["Кодировщик изображений<br/>ViT-L"]
E --> P1["Оценка глубины<br/>$D = f_d(I)$"]
E --> P2["Оценка нормалей<br/>$N = f_n(I)$"]
E --> P3["Семантическая сегментация<br/>$S = f_s(I)$"]
P1 --> F3D["3D слияние признаков"]
P2 --> F3D
P3 --> F3D
F3D --> G["3D Gaussian Splatting"]
G --> M["Извлечение сетки<br/>Marching Cubes"]
M --> T["Текстурное отображение"]
T --> R["PBR материал<br/>Физически обоснованный рендеринг"]
end
R --> OUT["Интерактивная 3D сцена<br/>.glb / .usdz / .obj"]
6.3 Математическое выражение 3D Gaussian Splatting
Сцена представляется набором 3D-гауссианов:
где каждый гауссиан определяется параметрами:
- $\boldsymbol{\mu} \in \mathbb{R}^3$: Положение центра
- $\boldsymbol{\Sigma} \in \mathbb{R}^{3 \times 3}$: Ковариационная матрица (управляет формой)
- $\mathbf{c} \in \mathbb{R}^3$: Цвет (сферические гармонические коэффициенты)
- $\alpha \in \mathbb{R}$: Непрозрачность
Уравнение рендеринга:
6.4 Оценка качества
| Показатель | Hunyuan 3D | DreamGaussian | LGM | InstantMesh |
|---|---|---|---|---|
| PSNR ↑ | 28.5 | 25.3 | 26.8 | 27.1 |
| SSIM ↑ | 0.92 | 0.87 | 0.89 | 0.90 |
| LPIPS ↓ | 0.08 | 0.14 | 0.11 | 0.10 |
| Время генерации | 3s | 15s | 10s | 8s |
| Мультивидовная согласованность | Отлично | Хорошо | Хорошо | Хорошо |
6.5 Быстрый старт
# Клонирование репозиторияgit clone https://github.com/Tencent/Hunyuan3D.gitcd Hunyuan3D
# Установка зависимостейpip install -r requirements.txt
# Из одного изображения в 3Dpython generate.py \ --image input.jpg \ --output output.glb \ --texture_resolution 2048 \ --mesh_format glb
# Python APIfrom hunyuan3d import Hunyuan3DPipeline
pipeline = Hunyuan3DPipeline.from_pretrained("tencent/Hunyuan3D-v1")mesh = pipeline( image="photo.jpg", num_views=6, texture_quality="high")mesh.save("scene.glb")GitHub: github.com/Tencent/Hunyuan3D Онлайн-демо: 3d.hunyuan.tencent.com
7. Инструментарий разработчика и лучшие практики
7.1 Полный инструментарий разработки
graph LR
subgraph Среда разработки
A["VS Code + ИИ-плагины"]
B["Cursor / Windsurf"]
C["Jupyter Notebook"]
end
subgraph Слой моделей
D["llama.cpp<br/>Локальный вывод"]
E["Ollama<br/>Управление моделями"]
F["vLLM<br/>Высокопроизводительный сервис"]
end
subgraph Слой приложений
G["LangChain<br/>Фреймворк приложений"]
H["LlamaIndex<br/>RAG фреймворк"]
I["CrewAI<br/>Многоагентное взаимодействие"]
end
subgraph Слой развёртывания
J["Docker<br/>Контейнеризация"]
K["Kubernetes<br/>Оркестрация"]
L["Периферийное развёртывание"]
end
A --> D
B --> E
C --> F
D --> G
E --> H
F --> I
G --> J
H --> K
I --> L
7.2 Матрица выбора технологий
| Сценарий | Рекомендуемое решение | Бэкенд вывода | Формат модели | Развёртывание |
|---|---|---|---|---|
| Личная разработка/Эксперимент | llama.cpp + Ollama | CPU/GPU | GGUF | Локально |
| API малой/средней команды | vLLM + FastAPI | GPU | HuggingFace | Docker |
| Корпоративная высокая нагрузка | TensorRT-LLM + Triton | NVIDIA GPU | ONNX/TensorRT | K8s |
| Мобильный | llama.cpp (Mobile) | NPU/GPU | Квантование Q4 | Встраиваемый |
| Конфиденциальность | Полностью локальный llama.cpp | CPU | Квантование Q8 | Офлайн |
7.3 Формулы оптимизации производительности
Стратегии оптимизации:
- Квантование: FP16 → Q4 снижает использование VRAM на 75%
- Пакетная обработка: Batch=8 обычно даёт 3-4x пропускной способности по сравнению с Batch=1
- KV-кэш: Уменьшает избыточные вычисления на 30-50%
- Спекулятивное декодирование: Может ускорить 1.5-2.5x
# Пример оптимизации производительностиfrom llama_cpp import Llama
# Оптимизированная конфигурацияllm = Llama( model_path="model-Q4_K_M.gguf", n_ctx=8192, # Длина контекста n_batch=512, # Размер пакета n_threads=8, # Потоков CPU n_gpu_layers=-1, # Выгрузить всё на GPU use_mlock=True, # Заблокировать память verbose=False)
# Использование спекулятивного декодированияoutput = llm( "Explain quantum computing", max_tokens=512, temperature=0.7, # Параметры спекулятивного декодирования draft_model="tiny-model.gguf", num_assistant_tokens=10)8. Активность сообщества и руководство по участию
8.1 Тенденции вклада в проекты
xychart-beta
title "Ежемесячный рост контрибьюторов проектов ИИ с открытым кодом"
x-axis ["Янв", "Фев", "Мар", "Апр", "Май"]
y-axis "Активные контрибьюторы" 0 --> 500
line "llama.cpp" [280, 310, 350, 420, 450]
line "12-Factor Agents" [50, 80, 120, 180, 220]
line "Sana" [20, 40, 90, 150, 200]
line "Hunyuan3D" [10, 25, 60, 100, 140]
8.2 Руководство по участию
graph LR
A["Форкнуть репозиторий"] --> B["Создать ветку<br/>feature/your-feature"]
B --> C["Написать код"]
C --> D["Добавить тесты"]
D --> E["Запустить тесты<br/>make test"]
E --> F{"Тесты пройдены?"}
F -->|"Нет"| C
F -->|"Да"| G["Отправить PR"]
G --> H["Проверка кода"]
H --> I{"Проверка пройдена?"}
I -->|"Нет"| C
I -->|"Да"| J["Слияние с основной веткой"]
8.3 Ресурсы сообщества
| Тип ресурса | Ссылка | Описание |
|---|---|---|
| Discord сообщество | discord.gg/llamacpp | Официальное обсуждение llama.cpp |
| Технический блог | huggingface.co/blog | Последние технические статьи |
| Видеоуроки | YouTube AI канал | От новичка до продвинутого |
| Китайское сообщество | Колонка Zhihu AI | Китайский форум обсуждений |
| Отслеживание статей | arXiv cs.AI | Последние исследования |
8.4 Краткий справочник по лицензиям
graph TD
Q["Ваш сценарий использования?"] --> C1["Коммерческое использование?"]
C1 -->|"Да"| C2["Распространение с закрытым кодом?"]
C1 -->|"Нет"| C3["Личное/Исследование"]
C2 -->|"Да"| L1["Apache 2.0<br/>MIT<br/>BSD"]
C2 -->|"Нет"| L2["GPL<br/>AGPL"]
C3 --> L3["Любая лицензия"]
L1 --> R1["✅ Рекомендуется"]
L2 --> R2["⚠️ Внимание: копилефт"]
L3 --> R3["✅ Свободное использование"]
8.5 Будущая дорожная карта
gantt
title Дорожная карта проектов ИИ с открытым кодом 2026
dateFormat 2026-06
section llama.cpp
v1.0 Стабильная версия :llama1, 2026-06, 2M
Мультимодальная поддержка :llama2, 2026-08, 3M
Оптимизация квантования :llama3, 2026-10, 2M
section Sana
v2.0 Генерация видео :sana1, 2026-07, 3M
Поддержка ControlNet :sana2, 2026-09, 2M
section Hunyuan 3D
v2.0 Управление видео :h3d1, 2026-08, 3M
Анимация/Скелеты :h3d2, 2026-11, 2M
section 12-Factor Agents
v2.0 Реализация фреймворка :ag1, 2026-06, 2M
Многоязычный SDK :ag2, 2026-09, 3M
---
## Заключение
Экосистема открытого ИИ в 2026 году демонстрирует **четыре основных тренда**:
1. **Периферийные вычисления**: Проекты llama.cpp, эластичный DiT и TTS на устройстве делают ИИ по-настоящему локальным
2. **Производственная зрелость**: Проекты вроде 12-Factor Agents знаменуют переход ИИ-агентов от игрушек к производственным средам
3. **Мультимодальность**: От текста к изображениям, 3D и аудио — экосистема с открытым кодом охватывает всё
4. **Восход Китая**: Tencent Hunyuan 3D, Alibaba Qwen и другие китайские проекты с открытым кодом быстро набирают влияние
$$\text{Будущее открытого ИИ} = \text{Открытое сотрудничество} \times \text{Технические инновации} \times \text{Жизнеспособность сообщества}$$
---
## Ссылки
### Репозитории проектов
- [llama.cpp GitHub](https://github.com/ggerganov/llama.cpp) ⭐ 111K
- [12-Factor Agents GitHub](https://github.com/humanlayer/12-factor-agents) ⭐ 20.5K
- [Синтез речи на устройстве GitHub](https://github.com/edwko/Pinc) ⭐ 8.3K
- [NVIDIA Sana GitHub](https://github.com/NVlabs/Sana) ⭐ 6.5K
- [Tencent Hunyuan 3D GitHub](https://github.com/Tencent/Hunyuan3D) ⭐ 1.8K
### Видеоуроки
- [llama.cpp с нуля до профессионала](https://www.youtube.com/results?search_query=llama.cpp+tutorial)
- [Практика генерации изображений Sana](https://www.youtube.com/results?search_query=nvidia+sana+tutorial)
- [Hunyuan 3D Быстрый старт](https://www.youtube.com/results?search_query=tencent+hunyuan3d+tutorial)
- [Продакшн-разработка ИИ-агентов](https://www.youtube.com/results?search_query=12+factor+agents+tutorial)
### Сообщество и документация
- [Hugging Face библиотека моделей](https://huggingface.co/models)
- [Официальный сайт Ollama](https://ollama.com/)
- [Документация LangChain](https://python.langchain.com/)
- [Документация vLLM](https://docs.vllm.ai/)
---
*Этот документ составлен AI Daily News 2026/5/19 и посвящён процветающему развитию экосистемы открытого ИИ.*