Рубрики
Технологии

Как я разогнал Qwen3.6-27B до 73 токен/с в llama.cpp: параметры, которые реально работают

Локальные LLM сейчас — это действительно мощный инструмент. Они уже вплотную приблизились к проприетарным моделям вроде Claude, особенно в задачах кодинга. Я сам активно использую локальные модели для разработки на TypeScript и Go. На данный момент самая интересная модель для моего стека — Qwen3.6-27B. Но один только выбор хорошей модели ничего не гарантирует. Без правильных […]

Рубрики
Технологии

AI для PHP-разработчиков. Часть 7: Экосистема AI-агентов в PHP – от простых вызовов OpenAI до мультиагентных платформ

За последние два года в экосистеме PHP вокруг AI-разработки сформировалась целая индустрия. Если раньше интеграция LLM выглядела как несколько строк кода с вызовом OpenAI API, то сегодня разработчики строят полноценные агентные системы: с памятью, инструментами, workflow, наблюдаемостью (observability) и даже командами специализированных агентов. Обычно, когда говорят об AI-разработке, в первую очередь говорят о Python. Тут […]

Рубрики
Технологии

Zero Trust для AI-агентов: как безопасно давать LLM доступ к инструментам, данным и действиям

AI-агенты уже вышли за пределы чат-ботов. Они читают документы, вызывают API, анализируют логи, создают тикеты, готовят правки в коде и выполняют многошаговые задачи без ручного подтверждения каждого шага. Это делает их полезными, но меняет модель риска: агент с инструментами становится явным риском внутри инфраструктуры. Главная идея Zero Trust для таких систем проста: агенту нельзя доверять […]

Рубрики
Технологии

Дешёвая модерация анонимной стены: 3-слойный каскад и ROT13-джейлбрейк в проде

Построили модерацию для открытой анонимной мультиязычной стены — дешёвый каскад (regex → классификатор → LLM-судья → fallback), ≈$0 на API. И кто-то попытался обойти его ROT13-джейлбрейком, LLM-судья раскусил закодированную инъекцию, которую keyword-фильтр бы пропустил. Разбор архитектуры, экономики и того, что спросил r/selfhosted. Читать далее

Рубрики
Технологии

Как я собрал LLM-печку на 4 GPU, и на что она способна

Всем привет, недавно я собрал и сейчас активно использую ПК для локального запуска хоть сколько-то серьезных LLM, и захотелось поделиться этим опытом с сообществом. На статью меня сподвигло то, что в рунете до обидного мало информации на тему, как собрать ПК на несколько GPU не на майнерском, не на серверном или не на HEDT, а […]

Рубрики
Технологии

Вайбаналитика: как я учил LLM описывать бизнес-процессы, а не имитировать их

Опыт ERP-архитектора: почему ChatGPT сначала выдавал красивые, но непроверяемые процессы — и почему решение оказалось не в промптах, а в предметной модели, технологической последовательности и проверяемых артефактах. Читать далее

Рубрики
Технологии

Приручаем недетерминизм агентных систем

Агентные системы ломаются не на сложных задачах и не на плохих моделях. Главная причина — недетерминизм LLM: температура, апдейты моделей, дрейф мира. Как отлаживать то, что не воспроизводится? Как перезапустить упавший пайплайн не с нуля? Как вообще понять поведение системы, если каждый запуск чуть-чуть другой? Event Sourcing — паттерн, где состояние не снапшот, а иммутабельный […]

Рубрики
Технологии

Copilot написал трекер привычек на Laravel, а я выложил код на Github

Зачем на свете нужен ещё один трекер привычек? Их же и так — на любой вкус и цвет. Проблема в том, что ни один из них не нравился моей жене, поэтому пришлось в список идей для пет-проектов добавить и его. Последние полгода я активно применяю LLM в своей работе. Автокомплитом от Github Copilot я пользуюсь […]

Рубрики
Технологии

Пишем Java-скрипт, который собирает проект в один файл для контекста в чат DeepSeek или другие LLM

У нейросетей есть ограничение на количество символов в чате или на число запросов. И бывает так, что лимит уже закончился, а разработка проекта — нет. Тогда приходится открывать новый чат и заново напоминать контекст: что за проект, какая структура, какие файлы важны, где уже были изменения. Обычно это сводится к ручному копированию кода, а это […]

Рубрики
Технологии

Honor 600 Pro стал первым в мире смартфоном на SoC MediaTek Dimensity 8550 — платформа поддерживает локальную работу нейросети Gemini Nano V3

В этом состоит ключевое отличие Dimensity 8550 от Dimensity 8500 MediaTek официально представила однокристальную систему Dimensity 8550 — слегка улучшенный вариант Dimensity 8500. Ключевым и самым важным нововведением стало появление технологии LLM Booster, а также интеграции нейросети Gemini Nano V3, оптимизированной для локальной работы на смартфонах без необходимости подключения к облачным серверам. При этом за […]