Рубрики
Технологии

Приручаем недетерминизм агентных систем

Агентные системы ломаются не на сложных задачах и не на плохих моделях. Главная причина — недетерминизм LLM: температура, апдейты моделей, дрейф мира. Как отлаживать то, что не воспроизводится? Как перезапустить упавший пайплайн не с нуля? Как вообще понять поведение системы, если каждый запуск чуть-чуть другой? Event Sourcing — паттерн, где состояние не снапшот, а иммутабельный […]

Рубрики
Технологии

Copilot написал трекер привычек на Laravel, а я выложил код на Github

Зачем на свете нужен ещё один трекер привычек? Их же и так — на любой вкус и цвет. Проблема в том, что ни один из них не нравился моей жене, поэтому пришлось в список идей для пет-проектов добавить и его. Последние полгода я активно применяю LLM в своей работе. Автокомплитом от Github Copilot я пользуюсь […]

Рубрики
Технологии

Пишем Java-скрипт, который собирает проект в один файл для контекста в чат DeepSeek или другие LLM

У нейросетей есть ограничение на количество символов в чате или на число запросов. И бывает так, что лимит уже закончился, а разработка проекта — нет. Тогда приходится открывать новый чат и заново напоминать контекст: что за проект, какая структура, какие файлы важны, где уже были изменения. Обычно это сводится к ручному копированию кода, а это […]

Рубрики
Технологии

Honor 600 Pro стал первым в мире смартфоном на SoC MediaTek Dimensity 8550 — платформа поддерживает локальную работу нейросети Gemini Nano V3

В этом состоит ключевое отличие Dimensity 8550 от Dimensity 8500 MediaTek официально представила однокристальную систему Dimensity 8550 — слегка улучшенный вариант Dimensity 8500. Ключевым и самым важным нововведением стало появление технологии LLM Booster, а также интеграции нейросети Gemini Nano V3, оптимизированной для локальной работы на смартфонах без необходимости подключения к облачным серверам. При этом за […]

Рубрики
Технологии

Google DeepMind смогла решить ещё девять открытых задач Эрдёша и десятки математических гипотез

Новая система AlphaProof Nexus решила задачи, используя формальную верификацию через язык Lean Google DeepMind представила систему AlphaProof Nexus — новый математический фреймворк, который смог самостоятельно решить девять открытых задач из знаменитого списка Пола Эрдёша (Paul Erdos). Некоторые из них оставались нерешёнными более полувека. Система также доказала 44 открытые гипотезы из Online Encyclopedia of Integer Sequences […]

Рубрики
Технологии

Пост @MaxRokatansky — Блог компании OTUS (+3) — N/P

Когда регрессия уже не спасает: что почитать тестировщику про современный QA QA больше не живёт в мире, где достаточно прогнать чек‑лист, закрыть пару багов и сказать: «ну вроде работает». Сейчас тестировщику приходится думать шире: какие ошибки реально блокируют релиз, почему зелёные E2E‑тесты могут ничего не проверять, как flaky‑тесты ломают доверие к CI и где ИИ помогает, а где просто уверенно угадывает. Начать стоит со […]

Рубрики
Технологии

Так умеет только Xiaomi? Скидки до 99% объявлены на API MiMo-V2.5, лимиты использования увеличены в 5–8 раз

Компания делает ставку на удешевление ИИ и расширение доступа к моделям Президент Xiaomi Лу Вэйбинг (Lu Weibing) сообщил о масштабном обновлении ценовой политики для API семейства MiMo-V2.5. По его словам, стоимость API снижена на постоянной основе, а максимальное удешевление достигает 99% без привязки к длине входных данных. Одновременно пересмотрена система токенов: объём доступных токенов увеличен […]

Рубрики
Технологии

Не используйте LLM для текста

Если пользоваться моделью, держите ее в роли клерка, критика или чернового редактора. Не отдавайте ей роль автора. Чем больше финального голоса вы передаете модели, тем сильнее текст перенимает ее привычки: мягкую нейтральность, фальшивые концовки, ровный ритм и общие фразы. Читать далее

Рубрики
Технологии

Пост @antonkrylov — CAD/CAM (+1) — 26.05.2026 10:40

Логарифмический браслет ИИ и LLM уже впечатляют: они помогают быстрее исследовать идеи, писать черновики кода, генерировать визуальные концепты и ускорять прототипирование. Но для серьезной production- разработки они все еще недостаточно надежны. Особенно там, где ошибка стоит дорого: CAD, BIM, инженерные расчеты, безопасность, инфраструктура, финансы, медицина. Модель может уверенно выдать неверный ответ, пропустить важное ограничение, создать […]

Рубрики
Технологии

Красивый скриншот вашего кода. Большое обновление

Привет, хабражители! Я уже писал тут о своём открытом сервисе для скриншотов кода (и простого текста), который позволяет красиво отобразить фрагмент вашего кода в статьях, презентациях, примерах до-после и т.п., насколько хватит вашей фантазии. Периодически я сам использую его для иллюстраций к своим статьям. И шаг за шагом приходят в голову новые идеи, как получить […]