
Мы расширили наш Foundation Models Catalog — добавили в него модели для транскрибации аудио (Speech-to-Text), включая легендарное семейство Whisper и GLM-ASR-Nano — новую передовую модель для распознавания речи. Они умеют конвертировать живую речь в связный структурированный текст: отлично справляются с шумом, распознают сложные термины, понимают разные акценты и автоматически расставляют знаки препинания.