Метка: LLM

Тестируем LLM для русского языка: Какие модели справятся с вашими задачами?

Автор записи Автор:
Дата записи 6 ноября, 2024 / 18:33

В последние годы большие языковые модели (LLM) стали важной частью бизнес-решений на базе ИИ, применяемых для генерации текста и анализа данных. Однако, большинство разработок ориентированы на англоязычные проекты, что создает сложности для компаний, работающих с русскоязычными данными. Готовые LLM для русского языка часто показывают низкую точность и ограниченные возможности. Проблемы конфиденциальности также вынуждают компании выбирать […]

Метки LLM, Бизнес, ИИ

На повестке дня

Исследователи из России выяснили, что эмоции могут существенно повлиять на поведение больших языковых моделей

Автор записи Автор:
Дата записи 6 ноября, 2024 / 18:33

Исследователи из Института AIRI, ИСП РАН и Лаборатории искусственного интеллекта «Сбера» провели анализ влияния эмоциональных факторов на принятие решений большими языковыми моделями (LLM). Они изучили, как эмоции — гнев, печаль, радость, отвращение и страх — влияют на логику принятия решений в стратегических играх и этических дилеммах. Результаты исследования будут представлены на NeurIPS 2024 в Ванкувере, одном из ведущих мероприятий по искусственному интеллекту.

Метки LLM, РАН, Россия

На повестке дня

[Перевод] Пользователи тестируют способности LLM посредством игр, в частности с помощью Minecraft и Pictionary

Автор записи Автор:
Дата записи 6 ноября, 2024 / 01:10

Большинство тестов для оценки ИИ-моделей не слишком информативны: они часто сводятся к простому запоминанию ответов или касаются тем, которые не всегда актуальны для пользователей. Поэтому некоторые ИИ-энтузиасты используют игры как способ оценки навыков решения задач.

Метки LLM, Minecraft, ИИ

На повестке дня

Квантизация позволяет запускать Llama 3.2 на мобилках

Автор записи Автор:
Дата записи 5 ноября, 2024 / 21:10

Квантизация помогла портировать последнюю версию LLM Llama 3.2 на мобильные платформы — iOS и Android. Для этого разработчики выпустили квантованные версии Llama 3.2 1B и 3B, которые при тестах на ARM-процессорах показали высокую скорость инференса, по сравнению с несжатыми весами в формате BF16. Как вообще получилось, что Llama работает на мобильных процессорах, ведь для ее […]

Метки Android, ARM, ChatGPT, iOS, Linux, LLM, SWIFT, Россия

На повестке дня

Как я автоматизировал поиск работы при помощи LLM

Автор записи Автор:
Дата записи 5 ноября, 2024 / 13:31

В свете последних новостей о сокращениях в IT-индустрии вопрос поиска работы встает все более остро даже для людей, которые в данный момент трудоустроены. Встал он и для меня, так как хоть на данный момент с работой у меня все в порядке, но начали появляться звоночки, намекающие на возможную необходимость ее смены в ближайшее время. И […]

Метки LLM

Новости

Как бесплатно установить нейросеть типа ChatGPT прямо на Mac или ПК в России и пользоваться ей без интернета. LM Studio рулит

Автор записи Автор:
Дата записи 5 ноября, 2024 / 13:30

На видеопрезентации новых MacBook Pro с процессорами M4 мне попался неожиданный момент. На экране новых Mac промелькнула очень знакомая программа – фактически, Apple сделала ей рекламу. Это LM Studio – малоизвестное в широких кругах, но определённо лучшее приложение для развёртывания LLM-нейросетей на обычных компьютерах. Если говорить простыми словами, с помощью LM Studio вы можете поставить…

Метки Apple, ChatGPT, LLM, M4, Mac, MacBook, Россия

На повестке дня

Почему галлюцинируют нейросети [и что с этим делают]

Автор записи Автор:
Дата записи 4 ноября, 2024 / 19:46

Австрийский математик Курт Гёдель еще в 1931 году сформулировал и доказал две теоремы о неполноте. В общем случае первая теорема гласит, что всякая непротиворечивая теория имеет утверждения, которые нельзя доказать средствами этой теории. Теорема оказала значительное влияние на различные научные области и в некоторой степени может способствовать пониманию того, почему галлюцинации в системах ИИ неизбежны. […]

Метки LLM, ИИ, нейросети

На повестке дня

[Перевод] Как мы нашли уязвимость в SQLite при помощи LLM

Автор записи Автор:
Дата записи 4 ноября, 2024 / 13:55

Введение В нашем предыдущем посте Project Naptime: Evaluating Offensive Security Capabilities of Large Language Models мы рассказали о фреймворке для исследований уязвимостей при помощи языковых моделей и продемонстрировали его потенциал, усовершенствовав показатели современных бенчмарков CyberSecEval2 компании Meta. С тех пор Naptime эволюционировал в Big Sleep — совместный проект Google Project Zero и Google DeepMind. Сегодня мы […]

Метки Google, LLM, SQL, Zero, ИИ, уязвимость

На повестке дня

[Перевод] Анатомия LLM RCE

Автор записи Автор:
Дата записи 3 ноября, 2024 / 11:54

По мере того, как большие языковые модели (LLM) становятся все более сложными, и разработчики наделяют их новыми возможностями, резко увеличиваются случаи возникновения угрозы безопасности. Манипулируемые LLM представляют собой не только риск нарушения этических стандартов, но и реальную угрозу безопасности, способную скомпрометировать системы, в которые они интегрированы. Такие критические уязвимости недавно были выявлены в различных приложениях, […]

Метки LLM, SQL, уязвимость

На повестке дня

Третий Alfa Analyze IT Meetup: генерация документации, LLM и уязвимости

Автор записи Автор:
Дата записи 2 ноября, 2024 / 18:40

5 ноября в 18:30 проведём третий на тему искусственного интеллекта. Расскажем и покажем, как применять его в работе, а ещё обсудим, какие потенциальные угрозы могут нести большие языковые модели. После докладов оставим время на афтерпати и нетворкинг.

Метки LLM, уязвимость