Рубрики
Технологии

«Т-Банк» открыл доступ к русскоязычной ИИ-модели с 32 млрд параметров

«Т-банк» открыл доступ к двум большим языковым моделям (LLM): T-Pro с 32 млрд параметров и обновленной T-Lite с 7 млрд параметров, созданным на базе моделей семейства Qwen-2.5 китайской Alibaba Group, и дообученным с адаптацией к русскому языку, пишут «Ведомости» со ссылкой на представителя компании. Ранее, в июле «Т-банк» открыл доступ к первой версии T-Lite. Источник […]

Рубрики
Наука

Представлены новые открытые большие языковые модели на русском языке

Группа «Т-Технологии» представила две большие языковые модели: T-Pro на 32 млрд параметров и обновленной T-Lite на 7 млрд параметров. Многочисленные индустриальные бенчмарки, такие как MERA, ruMMLU, Ru Arena Hard, MT Bench и AlpacaEval, показали, что это лучшие в мире открытые LLM на русском языке.

Рубрики
Новости

Российские разработчики представили две новые большие языковые модели

Группа «Т-Технологии» (в состав входит Т-Банк) открыла доступ к двум большим языковым моделям (LLM): T-Pro и обновленной T-Lite, созданным отечественными разработчиками. Об этом сообщили представители компании. Как подчеркнули в «Т-Технологиях», данные модели превосходят все российские и зарубежные аналоги (на индустриальных бенчмарках).

Рубрики
Технологии

[Перевод] 5 лучших фреймворков с открытым исходным кодом для оценки больших языковых моделей (LLM) в 2024 году

«У меня такое чувство, что решений для оценки LLM больше, чем проблем, связанных с их оценкой», — сказал Дилан, руководитель отдела ИИ в компании из списка Fortune 500. И я полностью согласен — кажется, что каждую неделю появляется новый репозиторий с открытым исходным кодом, пытающийся сделать то же самое, что и другие 30+ уже существующих […]

Рубрики
Технологии

Запускаем 8B LLM в браузере: AQLM.rs

Меня долгое время интересовал запуск больших языковых моделей на пользовательских устройствах: есть что‑то в том, чтобы запустить одну из лучших языковых моделей на обычном домашнем компьютере или на мобильном телефоне, помещающемся в карман. В этом посте я расскажу о своём пет‑проекте AQLM.rs. Я написал инференс модели Llama 3.1 8B, работающий в браузере на WebAssembly без использования GPU, с помощью алгоритма сжатия, разработанного нашей лабораторией. Попробовать можно на сайте […]

Рубрики
Технологии

Мобильная разработка за неделю #567 (2 — 8 декабря)

В новом дайджесте уменьшение размера банковского приложения и транзишинометр для Android, вопперы и табы, сертификаты и профили, сколько приложений, из выпущенных в 2024 году, стали успешными, вранье LLM и многое другое. Подключайтесь! Читать дальше →

Рубрики
Технологии

Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду. Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год […]

Рубрики
Технологии

Пост @ru_vds — Блог компании RUVDS.com (+2) — N/P

Google поплохело: мы живём в эпоху падения империй? После того, как СМИ отправили в отставку Пэта Гелсингера, аналитики принялись гадать — выживет ли Intel. Но если американского чипмейкера давно лихорадит, то проблемы Google возникли совсем недавно. И не очень понятно, случайное ли это падение. Эксперты полагают, что рекламный бизнес Google под угрозой. Молодёжь привыкла искать […]

Рубрики
Технологии

Галлюцинации в LLM и методы борьбы

Одна из основных проблем использования больших языковых моделей (LLM) в бизнесе заключается в том, что LLM склонны к галлюцинациям. Как можно доверить своих клиентов чат-боту, который может слететь с катушек и в любой момент сказать что-то неуместное? Или как можно доверять корпоративному AI-ассистенту, если он рандомно придумывает факты? Это действительно проблема, особенно если учесть, что […]

Рубрики
Технологии

Виртуальная лаборатория: AI открывает новые горизонты в биомедицине

Виртуальная лаборатория, которую разработали исследователи из Стэнфордского университета и Chan Zuckerberg Biohub, представляет новый подход к междисциплинарным исследованиям. Она сочетает человеческое руководство и возможности LLM, и способна разрабатывать сложные решения, такие как создание нанотел, связывающихся с последними вариантами SARS-CoV-2 (вызывает COVID-19). Читать далее