Китайский стартап Moonshot AI представил модель Kimi K2 с 1 трлн параметров

Китайский стартап Moonshot AI, создатель чат-бота Kimi, выпустил открытую языковую модель Kimi K2. Новая разработка напрямую конкурирует с проприетарными системами OpenAI и Anthropic, демонстрируя выдающиеся результаты в программировании и автономных задачах.

Kimi K2 использует архитектуру mixture-of-experts («смесь экспертов») с общим числом параметров в 1 трлн, из которых активны 32 млрд. Компания представила две версии: базовую и оптимизированную Kimi K2-Instruct для чатов и автономных агентов. «Kimi K2 не просто отвечает — он действует», — заявили в Moonshot AI.

Иллюстрация: Sora

Ключевым преимуществом модели стали «агентные» возможности: автономная работа с инструментами, написание и выполнение кода, решение многошаговых задач без участия человека. В тесте SWE-bench Verified, оценивающем инженерные навыки, Kimi K2 показала точность 65,8%, опередив большинство открытых альтернатив и сравнившись с проприетарными аналогами.

На реалистичном тесте кодирования LiveCodeBench модель достигла 53,7% точности против 46,9% у DeepSeek-V3 и 44,7% у GPT-4.1. В математическом тесте MATH-500 результат составил 97,4% против 92,4% у GPT-4.1. При этом Moonshot добилась этого с меньшими затратами на обучение и вычисления.

Техническая документация раскрывает инновацию MuonClip — оптимизатор, обеспечивший стабильное обучение триллионной модели «с нулевой нестабильностью». Этот подход решает проблему «взрывных» логитов внимания через масштабирование матриц весов, потенциально снижая вычислительные затраты отрасли.

Moonshot предлагает двойной доступ: бесплатную версию и коммерческий API по цене $0,15 за 1 млн входных токенов и $2,50 за 1 млн выходных.