Метка: LLM

Люди и LLM похожи больше, чем вы думаете. У нас тоже есть системный промпт, контекст и всё остальное

Автор записи Автор:
Дата записи 26 ноября, 2024 / 10:54

Люди и модели похожи больше, чем вы думаете. Собственно, это и не удивительно, ведь модели для этого и создаются. В идеале они должны когда‑нибудь стать вообще неотличимыми от людей. Но как это проявляется сейчас, на данном этапе их развития? И в чем конкретно мы так похожи на них, или они на нас? Подойдем к этому вопросу в терминах, свойственных самим LLM. Читать далее

Метки LLM

Новости

Нейросети открыты для предложений // Корпорации идут к обнародованию своих языковых моделей

Автор записи Автор:
Дата записи 26 ноября, 2024 / 00:43

МТС выпускает нейросетевую модель (LLM) с открытым кодом и возможностью донастройки под бизнес-задачи. Российские разработчики больших языковых моделей, такие как «Сбер» и «Яндекс», специализируются на закрытых моделях, хотя точечно и открывают проекты. Участники рынка в целом приветствуют открытый подход к работе с кодом, но некоторые напоминают, что практичнее было бы открыть сообществу дата-сеты, на которых […]

Метки LLM, Бизнес, МТС, нейросети, Россия, Яндекс

Киберспорт

Apple перенесли выпуск некоторых функций для iOS 19 на 2026 год

Автор записи Автор:
Дата записи 25 ноября, 2024 / 14:33

По словам журналиста издания Bloomberg Марка Гурмана, известно, что компания Apple отложила запуск множества функций, которые должны были быть представлены в iOS 19, на более поздние сроки. Согласно его информации, новые функции будут доступны лишь в iOS 19.4 — это означает, что пользователи получат к ним доступ весной 2026 года. Причины задержки не раскрываются, однако […]

Метки Apple, iOS, LLM, Siri

Технологии

Qwen 2.5 и Qwen 2.5 Coder — перспективная коллекция LLM для систем агентов

Автор записи Автор:
Дата записи 25 ноября, 2024 / 11:39

Разработчикам приложений Generative AI стоит обратить внимание на новую коллекцию моделей Qwen 2.5 и Qwen 2.5 Coder. С сентября 2024 года эти модели привлекают внимание разработчиков благодаря своей эффективности. Эти модели созданы Alibaba Cloud и предлагают много полезных для AI-сообщества функций. Во-первых, веса Qwen 2.5 доступны в версиях от 0.5B параметров — это очень легковесная […]

Метки ChatGPT, LLM

Технологии

Оптимизируем дообучение LLM: теория + гайд

Автор записи Автор:
Дата записи 24 ноября, 2024 / 16:15

В эпоху стремительного развития искусственного интеллекта большие языковые модели (Large Language Models, LLM) становятся неотъемлемой частью множества приложений – от интеллектуальных чат-ботов до систем анализа данных. Эффективное применение больших языковых моделей не обходится без тонкой настройки, потому что базовые модели, обученные на обобщенных данных, могут не учитывать уникальные особенности конкретных задач или доменов. Тонкая настройка […]

Метки ChatGPT, LLM, Бизнес

Технологии

Пост @iFamily — Машинное обучение — 24.11.2024 13:46

Автор записи Автор:
Дата записи 24 ноября, 2024 / 13:46

TL;DR: Драма вокруг OpenAI и гонка за AGI (2015–2024) Илон хотел остановить Демиса и DeepMind от создания «диктатуры AGI» Назначил себя гендиректором OpenAI Грег и Илья возразили: «Илон сам может стать диктатором AGI» Сэм пытался взять контроль, Илья обвинил его в жадности и политике Карпати предложил объединить OpenAI с Tesla. Илон поддержал, остальные — нет […]

Метки LLM, Microsoft, OpenAI, Tesla, Twitter, Илон Маск, поддержка

Технологии

[Перевод] Полное руководство по оценке компонентов системы RAG: что необходимо знать

Автор записи Автор:
Дата записи 24 ноября, 2024 / 12:35

Системы дополненной генерации (RAG) были разработаны для улучшения качества ответа крупной языковой модели (LLM). Когда пользователь отправляет запрос, система RAG извлекает релевантную информацию из векторной базы данных и передает ее в LLM в качестве контекста. Затем LLM использует этот контекст для генерации ответа для пользователя. Этот процесс значительно улучшает качество ответов LLM с меньшим количеством […]

Метки LLM

Технологии

Сказка для программистов в арабском стиле, написанная LLM. «Волшебная лампа Аладдина»

Автор записи Автор:
Дата записи 24 ноября, 2024 / 11:58

Я давно хотел узнать, может ли LLM написать интересный рассказ так, как это делает писатель.Насколько будет хорош литературный стиль и высока художественная выразительность?Достаточно ли качественно будет создан сюжет и интересны герои повествования?Насколько хорош и уместен юмор? Читать далее

Метки LLM

Технологии

[Перевод] Забыть не значит удалить: SURE — новый устойчивый к квантованию метод «забывания» в LLM

Автор записи Автор:
Дата записи 22 ноября, 2024 / 15:09

Привет, на связи Елена Кузнецова, специалист по автоматизации Шерпа Роботикс. Сегодня я перевела для вас статью на очень важную тему, в ней затрагивается проблема удаления персональных и других важных данных из LLM моделей. В статье особенно интересно то, как команда учёных нашла лазейку с помощью которой смогла успешно восстанавливать такие «удалённые» данные. Читать далее

Метки LLM

Технологии

Разрабатывали Telegram-бота для доступа к ChatGPT, а в итоге сделали интерфейс для взаимодействия с внешними LLM

Автор записи Автор:
Дата записи 22 ноября, 2024 / 14:23

В 2024 году не иметь доступа к генеративным ИИ вроде ChatGPT или YandexGPT — моветон. Эту проблему мы решили еще в прошлом году, когда разработали чат-бота для Telegram, который работает без танцев с бубном. А по ходу еще написали API для работы наших внутренних сервисов со сторонними LLM. О том, как шел ход разработки, рассказал […]

Метки ChatGPT, LLM, Telegram, ИИ