Рубрики
Технологии

Когда компании пора строить свой LLM-кластер, а не пользоваться внешними API

На раннем этапе внедрения LLM в компании выглядят как быстрый выигрыш: подключается внешний API (например, ChatGPT), ускоряется работа с текстами, автоматизируются ответы, появляются первые сценарии аналитики и агентных пайплайнов через Make или n8n. До определённого масштаба этого достаточно. По мере роста компании LLM перестаёт быть вспомогательным инструментом и становится частью операционных процессов. В системе появляются […]

Рубрики
Технологии

Промпт-инъекции в реальных данных, широкие права доступа и другие способы сломать ИИ-агента

Привет, Хабр! На связи команда Jay Guard — платформы, которая помогает безопасно использовать языковые модели и ИИ-агентов. Недавно мы опубликовали статью про AI-агента для HR-процессов. В комментариях почти сразу появились вопросы про данные — куда уходят персональные данные, что из этого видит LLM, что пишется в логи (журнал событий) и как все это соотносится с […]

Рубрики
Технологии

Runtime‑память для локальной LLM: слепки, паттерны и эффект Memento

Я разрабатываю локальный AI‑runtime JIN, без использования привычных методов сохранения информации и с упором на долговременную память. На данный момент runtime использует три слоя памяти. В статье я кратко и с примерами разбираю что хранит каждый слой и какую проблему решает. Читать далее

Рубрики
Технологии

Выпущен бенчмарк FrontierCode для оценки ИИ-моделей по «качеству пулл-реквестов»

Компания Cognition выпустила новый бенчмарк FrontierCode для измерения «способности ИИ-моделей выдерживать стандарты качества реальных кодовых баз». По словам его создателей, обычно кодинговые бенчмарки для LLM оценивают лишь формальное выполнение задач, а теперь пора задаваться более сложным вопросом: «могут ли модели писать хороший код?» Для оценки этого они оттолкнулись от другого вопроса: «Если бы выполнение тестовой […]

Рубрики
Технологии

Деплой LLM on-prem: Это наша корова и мы ее доим

Кто виноват? Что делать?© Заметили, что в наше веселое турбулентное время рождения многополярного мира все больше запросов на он‑прем деплоймент ЛЛМ — а так как подводных камней там много, а опыта мало — то попробуем разобраться с вопросом. — Как дела с проектом?— Мы на финальной стадии!— Супер, сдаете?— Нет, ищем виноватого! Итак — вот пришли к вам с типичными требованиями — хотим все в закрытом периметре. Чтобы Железный Болван болтал с клиентами на их языке, […]

Рубрики
Технологии

[Перевод] Месть дата-сайентиста: почему LLM не отменили нашу профессию

LLM упростили запуск AI-функций до нескольких вызовов API, и дата-сайентисты будто бы выпали из критического пути. На практике именно здесь начинаются самые дорогие ошибки: команды берут готовые метрики, доверяют LLM-судьям и строят evals на синтетике, которая не похожа на прод. В статье — пять типичных ловушек современной AI-разработки и разбор того, почему умение смотреть в […]

Рубрики
ИТ

Что умеют наушники Яндекс Дропс — первое ИИ-устройство от Яндекса с Алисой AI

Яндекс продолжает строить свою экосистему с упором на ИИ теперь в ассортименте устройств появились беспроводные наушники. Логика выбора именно этой категории проста: мы активно используем Алису дома через колонки и ТВ-Станции, но чтобы вызвать ассистента в дороге или на улице, нужно как минимум куда-то нажимать. Компания решила добавить возможность поговорить с ассистентом без лишних жестов. […]

Рубрики
Технологии

[Перевод] Структурированная разработка на основе промптов

Как сделать изменения, вносимые с помощью LLM, управляемыми, проверяемыми и воспроизводимыми. Программные ассистенты LLM продемонстрировали значительную ценность, но в основном для отдельных разработчиков. Внутренняя ИТ-организация Thoughtworks использует их для своих команд и разработала метод и рабочий процесс, называемый структурированной разработкой на основе промптов (Structured Prompt-Driven Development, SPDD). В одноименной статье Вэй Чжан и Джесси Цзе Ся, опубликованной на […]

Рубрики
Технологии

Тени странных петель

Четвёртая, заключительная статья цикла «Слова, которых нет». Если совместное мышление человека и LLM возможно — то где его границы? Ответа нет, но вопрос имеет смысл — и он о том, с кем мы на самом деле разговариваем, когда разговариваем с ИИ. Читать далее

Рубрики
Технологии

Пост @AIguide — Искусственный интеллект — 08.06.2026 08:37

Apple подружила Siri с Gemini Siri Итак, сегодняшняя WWDC 2026. Главная новость, которая перебила вообще все ожидания от летней конференции  Apple официально интегрировала в Siri модели Gemini от Google. Да, те самые. Конкуренты. В одном флаконе. Инсайдеры говорят, что соглашение обошлось примерно в миллиард долларов в год. Apple цифру официально не подтверждает, но дыма без […]