Компанія Google розробила алгоритм Translatotron, здатний синхронно перекладати мовлення іншою мовою, не використовуючи текстове зображення сказаних слів. Окрім цього, алгоритм може зберігати характеристики голосу людини на перекладеному записі.
Сьогодні в перекладачах, включно з Google Translate, за усного перекладу звук спочатку конвертується в текст, а потім назад в аудіо. Основна відмінність Translatotron в тому, що він минує цей етап і працює безпосередньо зі звуком – система створює «зліпок» вихідної мови і трансформує його.
Цей алгоритм дозволяє збільшити швидкість перекладу, зменшити кількість помилок у розпізнаванні мови та під час перекладу слів, які не перекладаються, наприклад, імен. Фахівці Google відзначають, що Translatotron – перша система прямого перекладу без конвертації в текст.
Алгоритм також навчили зберігати інтонації і паузи, щоб переклад звучав природніше. Нейромережа може зберігати вихідний голос, але ця система навчена на меншій кількості даних, тому варіанти перекладу дещо різняться.
Послухати приклади перекладу можна за посиланням.