Мгновенный, точный и полностью автономный перевод звонков на шесть языков – прямо на устройстве
Компания HONOR, мировой лидер в создании экосистемы AI-устройств, объявила о запуске первой в индустрии крупной модели распознавания речи, работающей не в облаке, а напрямую на смартфоне. Новая технология дебютировала в международной версии флагмана HONOR Magic V5 и стала важным прорывом в области многоязычного распознавания и перевода речи.
Разработчикам HONOR удалось преодолеть ключевые технические барьеры – от минимизации задержек при потоковом распознавании до эффективного размещения крупномасштабных моделей на мобильных устройствах. Эти достижения были подтверждены научным сообществом: сразу две исследовательские работы компании получили признание на INTERSPEECH 2025 – крупнейшей мировой конференции, посвящённой науке и технологиям обработки речи.
Решение дилеммы: приватность vs производительность
Большинство существующих систем перевода опираются на облачные серверы, что вызывает серьёзные вопросы приватности – особенно в случае телефонных разговоров. На рынке есть решения с локальной обработкой, но они обычно страдают от низкой скорости, недостаточной точности и высокого потребления памяти. HONOR впервые предложила полноценный облачный опыт — без облака. Новая технология обеспечивает конфиденциальность, так как вся обработка происходит непосредственно на устройстве, и при этом сохраняет высокую производительность, не жертвуя скоростью и качеством перевода.
Ключевые преимущества для пользователей
HONOR удалось добиться впечатляющей оптимизации: модель занимает всего 800 МБ вместо привычных 3–4 ГБ, что означает экономию памяти на 75%. В систему уже встроены шесть языков: китайский, английский, немецкий, французский, испанский и итальянский, что избавляет пользователя от необходимости скачивать дополнительные пакеты и экономит почти 2,8 ГБ памяти. Перевод теперь происходит быстро: устройство обрабатывает речь по мере её поступления, а не ждёт окончания предложения. Такой подход позволил повысить скорость работы на 38%, а точность перевода — на 16% по сравнению с традиционными методами.
Научная основа инноваций
Первая работа, «MFLA: Monotonic Finite Look-ahead Attention for Streaming Speech Recognition», предлагает новый метод низкозадержного распознавания речи, интегрирующий предсказатель на основе механизма CIF с стратегией Wait-k. Это позволило перенести успешный подход из машинного перевода в область ASR (автоматического распознавания речи) и существенно снизить вычислительные затраты.
Вторая работа, «Novel Parasitic Dual-Scale Modeling for Efficient and Accurate Multilingual Speech Translation», созданная совместно с Шанхайским университетом Цзяо Тун, описывает инновационный метод ускорения вывода модели без потерь качества, что обеспечивает стабильную работу даже на устройствах с ограниченными ресурсами.
Взгляд в будущее
HONOR остаётся верной своей миссии – развивать искусственный интеллект на устройствах, делая взаимодействие человека и технологий максимально умным, приватным и естественным.