Метка: LLM

Как я разогнал Qwen3.6-27B до 73 токен/с в llama.cpp: параметры, которые реально работают

Автор записи Автор: admin
Дата записи 2 июня, 2026 / 16:49

Локальные LLM сейчас — это действительно мощный инструмент. Они уже вплотную приблизились к проприетарным моделям вроде Claude, особенно в задачах кодинга. Я сам активно использую локальные модели для разработки на TypeScript и Go. На данный момент самая интересная модель для моего стека — Qwen3.6-27B. Но один только выбор хорошей модели ничего не гарантирует. Без правильных […]

Метки LLM, Выборы

Технологии

AI для PHP-разработчиков. Часть 7: Экосистема AI-агентов в PHP – от простых вызовов OpenAI до мультиагентных платформ

Автор записи Автор: admin
Дата записи 30 мая, 2026 / 20:57

За последние два года в экосистеме PHP вокруг AI-разработки сформировалась целая индустрия. Если раньше интеграция LLM выглядела как несколько строк кода с вызовом OpenAI API, то сегодня разработчики строят полноценные агентные системы: с памятью, инструментами, workflow, наблюдаемостью (observability) и даже командами специализированных агентов. Обычно, когда говорят об AI-разработке, в первую очередь говорят о Python. Тут […]

Метки LLM, OpenAI, PHP, Python, Долги

Технологии

Zero Trust для AI-агентов: как безопасно давать LLM доступ к инструментам, данным и действиям

Автор записи Автор: admin
Дата записи 30 мая, 2026 / 14:58

AI-агенты уже вышли за пределы чат-ботов. Они читают документы, вызывают API, анализируют логи, создают тикеты, готовят правки в коде и выполняют многошаговые задачи без ручного подтверждения каждого шага. Это делает их полезными, но меняет модель риска: агент с инструментами становится явным риском внутри инфраструктуры. Главная идея Zero Trust для таких систем проста: агенту нельзя доверять […]

Метки LLM, Zero

Технологии

Дешёвая модерация анонимной стены: 3-слойный каскад и ROT13-джейлбрейк в проде

Автор записи Автор: admin
Дата записи 30 мая, 2026 / 10:57

Построили модерацию для открытой анонимной мультиязычной стены — дешёвый каскад (regex → классификатор → LLM-судья → fallback), ≈$0 на API. И кто-то попытался обойти его ROT13-джейлбрейком, LLM-судья раскусил закодированную инъекцию, которую keyword-фильтр бы пропустил. Разбор архитектуры, экономики и того, что спросил r/selfhosted. Читать далее

Метки LLM

Технологии

Как я собрал LLM-печку на 4 GPU, и на что она способна

Автор записи Автор: admin
Дата записи 30 мая, 2026 / 09:56

Всем привет, недавно я собрал и сейчас активно использую ПК для локального запуска хоть сколько-то серьезных LLM, и захотелось поделиться этим опытом с сообществом. На статью меня сподвигло то, что в рунете до обидного мало информации на тему, как собрать ПК на несколько GPU не на майнерском, не на серверном или не на HEDT, а […]

Метки LLM

Технологии

Вайбаналитика: как я учил LLM описывать бизнес-процессы, а не имитировать их

Автор записи Автор: admin
Дата записи 30 мая, 2026 / 00:55

Опыт ERP-архитектора: почему ChatGPT сначала выдавал красивые, но непроверяемые процессы — и почему решение оказалось не в промптах, а в предметной модели, технологической последовательности и проверяемых артефактах. Читать далее

Метки ChatGPT, LLM, Бизнес

Технологии

Приручаем недетерминизм агентных систем

Автор записи Автор: admin
Дата записи 29 мая, 2026 / 09:58

Агентные системы ломаются не на сложных задачах и не на плохих моделях. Главная причина — недетерминизм LLM: температура, апдейты моделей, дрейф мира. Как отлаживать то, что не воспроизводится? Как перезапустить упавший пайплайн не с нуля? Как вообще понять поведение системы, если каждый запуск чуть-чуть другой? Event Sourcing — паттерн, где состояние не снапшот, а иммутабельный […]

Метки LLM

Технологии

Copilot написал трекер привычек на Laravel, а я выложил код на Github

Автор записи Автор: admin
Дата записи 29 мая, 2026 / 09:58

Зачем на свете нужен ещё один трекер привычек? Их же и так — на любой вкус и цвет. Проблема в том, что ни один из них не нравился моей жене, поэтому пришлось в список идей для пет-проектов добавить и его. Последние полгода я активно применяю LLM в своей работе. Автокомплитом от Github Copilot я пользуюсь […]

Метки Copilot, GitHub, Laravel, LLM

Технологии

Пишем Java-скрипт, который собирает проект в один файл для контекста в чат DeepSeek или другие LLM

Автор записи Автор: admin
Дата записи 28 мая, 2026 / 09:58

У нейросетей есть ограничение на количество символов в чате или на число запросов. И бывает так, что лимит уже закончился, а разработка проекта — нет. Тогда приходится открывать новый чат и заново напоминать контекст: что за проект, какая структура, какие файлы важны, где уже были изменения. Обычно это сводится к ручному копированию кода, а это […]

Метки Java, LLM, Долги

Технологии

Honor 600 Pro стал первым в мире смартфоном на SoC MediaTek Dimensity 8550 — платформа поддерживает локальную работу нейросети Gemini Nano V3

Автор записи Автор: admin
Дата записи 28 мая, 2026 / 00:57

В этом состоит ключевое отличие Dimensity 8550 от Dimensity 8500 MediaTek официально представила однокристальную систему Dimensity 8550 — слегка улучшенный вариант Dimensity 8500. Ключевым и самым важным нововведением стало появление технологии LLM Booster, а также интеграции нейросети Gemini Nano V3, оптимизированной для локальной работы на смартфонах без необходимости подключения к облачным серверам. При этом за […]

Метки 5G, Bluetooth, Gemini, HONOR, LLM, TSMC, Wi-Fi, нейросети, поддержка