Рубрики
На повестке дня

Простой и быстрый тест LLM для прототипа: сравниваем 16 open-source-моделей на запросе с разной температурой

Привет, Хабр! Меня зовут Дмитрий Фролов, я ведущий разработчик в Центре RnD МТС Диджитал. С ростом популярности LLM создание на них прототипа может прилететь даже тем, кто напрямую с ML не связан. Допустим, вы работаете аналитиком, а ваше начальство резко захотело генератор текста или отчетов в стиле клиентского менеджера с open-source LLM под капотом. Скорее […]

Рубрики
На повестке дня

State Space Models. Mamba

Ни для кого не секрет, что доминирующей на данный момент архитектурой в области Deep Learning являются трансформеры. Они произвели настоящий фурор и стали основой для самых известных LLM. На данный момент они используются почти во всех фундаментальных моделях, от тех, что с открытым исходным кодом, таких как Mistral, до закрытых, таких как ChatGPT. Однако, трансформеры […]

Рубрики
На повестке дня

Тестируем Pixtral12B и LLaMA 3.2 11B на народных Tesla P100 и P40

Привет Хабр! С вами снова ServerFlow, и мы начинаем наш новый цикл статей о проектах связанных с GPU. В начале цикла мы хотим заняться непривычной для нас темой – нейросетями, а именно большими языковыми моделями LLM. В сентябре-октябре, судя по новостям вышел особенно богатый урожай мультимодальных нейросетей в открытом доступе, в этом посте будем смотреть […]

Рубрики
На повестке дня

Как диалоги с LLM превращаются в танец идей

«Вы когда‑нибудь задумывались, каково это — органично сочетать технологию с творчеством?» Привет, меня зовут Ден, и я всегда был на переднем крае технологического прогресса, движимый неутолимым любопытством к технической и творческой сторонам нашего цифрового мира, сегодня мы поговорим о LLM… Давай почитаем

Рубрики
На повестке дня

«Я спросил у Ясеня». Преимущества и недостатки использования искусственного интеллекта в работе системного аналитика

Привет Хабр! Меня зовут Татьяна Ошуркова, я разработчик, аналитик и автор телеграм-канала IT Talks. В этой статье я хочу разобрать преимущества, возможности и недостатки использования больших языковых моделей в работе системного аналитика. С появлением возможности использовать LLM в работе, решение многих задач приняло совершенно новый вид. Безусловно, как и все технологии, LLM сегодня помогают найти новые […]

Рубрики
На повестке дня

[Перевод] Уделите внимание токенизаторам — и вот почему

На прошлой неделе я помогал одному другу пустить одно его новое приложение в свободное плавание. Пока не могу особенно об этом распространяться, но упомяну, что это приложение, конечно же, сдобрено искусственным интеллектом — сегодня этим не удивишь. Может быть, даже изрядно сдобрено, в зависимости от того, к чему вы привыкли. В большинстве современных приложений с […]

Рубрики
На повестке дня

FlexiPrompt: Удобное создание динамических промптов в Python

Эта статья будет полезна Python-разработчикам, работающим с языковыми моделями (LLM). Недавно у меня возникла потребность в формировании промптов внутри python кода. Не хотелось брать тяжеловесные решения. Результатом работы стала небольшая библиотека. Читать далее

Рубрики
На повестке дня

Под микроскопом: AI Product Hack

Сколько раз вы были свидетелями судейства на хакатонах, которое, на первый взгляд, казалось неверным? Думаем, таких случаев было много. Сегодня мы посмотрим на результаты AI Product Hack и постараемся разобраться в том, кто после присуждения мест оказался прав: раздосадованные поражением участники команд или судьи. В частности мы будем рассматривать кейс компании Raft — «Мониторинг токсичного контента в AI‑продуктах». Первый справедливый вопрос, почему токсичный контент? Все […]