Люди и модели похожи больше, чем вы думаете. Собственно, это и не удивительно, ведь модели для этого и создаются. В идеале они должны когда‑нибудь стать вообще неотличимыми от людей. Но как это проявляется сейчас, на данном этапе их развития? И в чем конкретно мы так похожи на них, или они на нас? Подойдем к этому вопросу в терминах, свойственных самим LLM. Читать далее
Метка: LLM
МТС выпускает нейросетевую модель (LLM) с открытым кодом и возможностью донастройки под бизнес-задачи. Российские разработчики больших языковых моделей, такие как «Сбер» и «Яндекс», специализируются на закрытых моделях, хотя точечно и открывают проекты. Участники рынка в целом приветствуют открытый подход к работе с кодом, но некоторые напоминают, что практичнее было бы открыть сообществу дата-сеты, на которых […]
По словам журналиста издания Bloomberg Марка Гурмана, известно, что компания Apple отложила запуск множества функций, которые должны были быть представлены в iOS 19, на более поздние сроки. Согласно его информации, новые функции будут доступны лишь в iOS 19.4 — это означает, что пользователи получат к ним доступ весной 2026 года. Причины задержки не раскрываются, однако […]
Разработчикам приложений Generative AI стоит обратить внимание на новую коллекцию моделей Qwen 2.5 и Qwen 2.5 Coder. С сентября 2024 года эти модели привлекают внимание разработчиков благодаря своей эффективности. Эти модели созданы Alibaba Cloud и предлагают много полезных для AI-сообщества функций. Во-первых, веса Qwen 2.5 доступны в версиях от 0.5B параметров — это очень легковесная […]
В эпоху стремительного развития искусственного интеллекта большие языковые модели (Large Language Models, LLM) становятся неотъемлемой частью множества приложений – от интеллектуальных чат-ботов до систем анализа данных. Эффективное применение больших языковых моделей не обходится без тонкой настройки, потому что базовые модели, обученные на обобщенных данных, могут не учитывать уникальные особенности конкретных задач или доменов. Тонкая настройка […]
TL;DR: Драма вокруг OpenAI и гонка за AGI (2015–2024) Илон хотел остановить Демиса и DeepMind от создания «диктатуры AGI» Назначил себя гендиректором OpenAI Грег и Илья возразили: «Илон сам может стать диктатором AGI» Сэм пытался взять контроль, Илья обвинил его в жадности и политике Карпати предложил объединить OpenAI с Tesla. Илон поддержал, остальные — нет […]
Системы дополненной генерации (RAG) были разработаны для улучшения качества ответа крупной языковой модели (LLM). Когда пользователь отправляет запрос, система RAG извлекает релевантную информацию из векторной базы данных и передает ее в LLM в качестве контекста. Затем LLM использует этот контекст для генерации ответа для пользователя. Этот процесс значительно улучшает качество ответов LLM с меньшим количеством […]
Я давно хотел узнать, может ли LLM написать интересный рассказ так, как это делает писатель.Насколько будет хорош литературный стиль и высока художественная выразительность?Достаточно ли качественно будет создан сюжет и интересны герои повествования?Насколько хорош и уместен юмор? Читать далее
Привет, на связи Елена Кузнецова, специалист по автоматизации Шерпа Роботикс. Сегодня я перевела для вас статью на очень важную тему, в ней затрагивается проблема удаления персональных и других важных данных из LLM моделей. В статье особенно интересно то, как команда учёных нашла лазейку с помощью которой смогла успешно восстанавливать такие «удалённые» данные. Читать далее
В 2024 году не иметь доступа к генеративным ИИ вроде ChatGPT или YandexGPT — моветон. Эту проблему мы решили еще в прошлом году, когда разработали чат-бота для Telegram, который работает без танцев с бубном. А по ходу еще написали API для работы наших внутренних сервисов со сторонними LLM. О том, как шел ход разработки, рассказал […]