OpenAI обучила модели o1 и o3 «размышлять» о своей политике безопасности

В пятницу OpenAI объявила о новой серии моделей AI для рассуждений, o3, которые как утверждает стартап, более продвинуты, чем o1 или любые другие выпущенные ранее. Эти улучшения, по-видимому, были достигнуты за счет масштабирования вычислений во время тестирования. OpenAI также заявляет, что использовала новую парадигму безопасности для обучения своей серии моделей «o». В пятницу OpenAI выпустила новое исследование по делиберативному выравниванию, в котором изложен последний способ компании гарантировать, что модели AI для рассуждений остаются согласованными с ценностями своих человеческих разработчиков. Стартап использовал этот метод, чтобы заставить o1 и o3 размышлять о политике безопасности OpenAI во время вывода, фазы после того, как пользователь нажимает ввод на своем запросе.