Сервис запуска и взаимодействия с LLM
# Установка зависимостей
make deps
# Генерация proto
make gen
# Сборка библиотек (без CUDA)
make build-libs-cpu
# Сборка библиотек с поддержкой NVIDIA (CUDA)
make build-libs-gpu
# Запуск (CPU, без CUDA)
make run-cpu
# Запуск (GPU, NVIDIA CUDA)
make run-gpu
# Сборка бинарника (CPU)
make build-cpu
# Сборка бинарника (CUDA)
make build-gpu./build/gen-runner download --repo <org/model> --list
./build/gen-runner download --repo <org/model> --file ....gguf./build/gen-runner remote ping
./build/gen-runner remote models
./build/gen-runner remote run --model mymodel --prompt "привет"# Собрать yaml из Modelfile
./build/gen-runner create myalias -f ./Modelfile [--force]
# Показать yaml манифеста или экспорт в Modelfile
./build/gen-runner show myalias
./build/gen-runner show myalias --modelfile # или -m
# Только путь к .yaml (для скриптов)
./build/gen-runner show myalias --path-only
# Список локальных .gguf в каталоге model_path
./build/gen-runner models