цепляет сразу

Выпущен бенчмарк, проверяющий способность ИИ воссоздать FFmpeg

Автор записи Автор: admin
Дата записи 5 мая, 2026 / 22:56

Новый бенчмарк ProgramBench использует нестандартный подход к измерению способностей LLM. Модель получает бинарные файлы и документацию ряда приложений (FFMpeg и других), а затем должна самостоятельно создать приложения с аналогичной функциональностью. Доступа в интернет у модели при этом нет.

Метки LLM, ИИ