fbpx

Google навчив алгоритм прямому перекладу усного мовлення. Тепер є інтонація та голос!

20 Травня 2019
мова штучний інтелект

Компанія Google розробила алгоритм Translatotron, здатний синхронно перекладати мовлення іншою мовою, не використовуючи текстове зображення сказаних слів. Окрім цього, алгоритм може зберігати характеристики голосу людини на перекладеному записі.

Сьогодні в перекладачах, включно з Google Translate, за усного перекладу звук спочатку конвертується в текст, а потім назад в аудіо. Основна відмінність Translatotron в тому, що він минує цей етап і працює безпосередньо зі звуком – система створює «зліпок» вихідної мови і трансформує його.

Цей алгоритм дозволяє збільшити швидкість перекладу, зменшити кількість помилок у розпізнаванні мови та під час перекладу слів, які не перекладаються, наприклад, імен. Фахівці Google відзначають, що Translatotron – перша система прямого перекладу без конвертації в текст.

Алгоритм також навчили зберігати інтонації і паузи, щоб переклад звучав природніше. Нейромережа може зберігати вихідний голос, але ця система навчена на меншій кількості даних, тому варіанти перекладу дещо різняться.

Послухати приклади перекладу можна за посиланням.

20 Травня 9:09
мова штучний інтелект
Найцiкавiше на сайтi