Дикторы против ИИ: заменят ли нейросети актеров дубляжа

Искусственный интеллект научился «говорить» голосом актера

100%

Depositphotos

Программы для генерации речи могут копировать голоса людей, тем самым создавая аудио-дипфейки. Так, благодаря ИИ автор мода для игры «Ведьмак 3» смог озвучить реплики главного героя голосом популярного актера дубляжа. Данное событие заставило задуматься о том, что профессия актера озвучки может умереть, однако некоторые представители цеха, опрошенные «Газетой.Ru», с этим не согласны.

Актеры против ИИ

Мод A Night to Remember для игры The Witcher 3: Wild Hunt использует ПО CyberVoice от российской компании Mind Simulation Lab для озвучки главного героя Геральта, сообщил портал Inputmag.

Эта программа представляет собой ИИ, который был обучен на репликах Дага Кокла, озвучивавшего главного героя игры. Таким образом искусственный интеллект смог «говорить» голосом актера.

Как заявила Натали Винтер, работавшая над озвучкой таких игр, как Assassin's Creed: Valhalla, подобные технологии могут с легкостью отнять работу у актеров озвучки.

В беседе с «Газетой. Ru» генеральный директор Mind Simulation Lab Леонид Дерикьянц рассказал о целях компании. Так, Mind Simulation Lab хочет, чтобы научные разработки в области ИИ могли быть использованы и в реальной жизни.

«Первым таким продуктом стал проект CyberMind, который дает возможность оживить всех NPC (неигровые персонажи), дать им интеллект, создать им цифровые личности, чтобы с ними было интересно общаться, даже если вы действуете вне сюжетной линии», — объяснил Дерикьянц.

По его словам, с помощью этого ПО NPC смогут вести свободные диалоги с игроками, отвечать на их вопросы или запоминать новую информацию. Следовательно, будет невозможно заранее записать все реплики, так как такие NPC думают и генерируют свои мысли «на лету».

При этом, Дерикьянц во время беседы сделал упор на то, что такая технологии синтеза речи никак не скажется на актерах дубляжа и дикторах.

«По поводу устаревания профессии. Такой вопрос можно задать практически любому инновационному проекту: беспилотные комбайны, автопилот Tesla, синтез речи и другие. То же самое и с голосом. Не сможет человек при всём желании озвучивать статьи с трех сайтов, например, даже с одного. Это огромный объём, придется жить у микрофона. Невозможно самостоятельно озвучить донат на стриме, диктор же не будет сидеть и следить за всеми стримами, чтобы вовремя озвучить фразу. И так во многих других ситуациях», — привел примеры генеральный директор компании.

По его словам, работа настоящего актера никуда не денется. Он — первоисточник голоса, особенно в играх, а работа ИИ сфокусирована на втором фронте, когда персонаж озвучивает свои мысли, или на том контенте, который озвучивать самостоятельно невозможно.

Диктор Антон Киреев также выразил сомнение в том, что профессия актера озвучки достанется ИИ.

«Конечно, с помощью таких технологий можно заменить и дикторов и актеров дубляжа. Нейросети достаточно «скормить» определённое количество часов звука, чтобы она смогла синтезировать голос. Однако качество особенно «актерской работы» этой нейросети будет оставлять желать лучшего», — поделился специалист.

По словам Киреева, автор мода сам не раз упоминал о том, что нейросеть значительно уступает профессионалам, если говорить о качестве озвучки.

«Вот и получается, что заменить-то можно, но вопрос качества еще несколько лет будет оставаться актуальным. Может 5, может 10 лет. Самые простые IVR [интерактивное голосовое меню] уже сейчас может озвучить робот, да. Но интонации и логика речи всё равно хромают. О замене актёров озвучивания речи сейчас не идёт совсем. Повторюсь, сделать это можно, но слушать такое в играх или фильмах будут самые непривередливые граждане», — рассуждает Киреев.

Диктор и актер дубляжа Петр Гланц отметил, что ИИ зачастую прослушивает очень большой объем речи персонажа и дальше он воспроизводит то, что он услышал, не придумывая что-то новое.

«Для создания каких-то небольших проектов это удобно, и такой ИИ уже давно работает на разных платформах, позволяя транслировать голоса известных людей. Но создать что-то новое он не в силах. Поэтому профессии диктора и актера дубляжа никуда не уйдут. Скорее всего произойдет разделение: плохие актеры станут никому не нужны, и их место займет ИИ. Например, нейросеть сможет записывать «гур-гур» [фоновые речевые шумы]. Однако в тех проектах, где авторы вкладываются и хотят создать что-то стоящее, искусственный интеллект точно не подойдет», — считает Гланц.

Публицист Дмитрий Пучков, который занимался пародийным переводом фильмов, также выразил сомнение в скорой смерти профессии актера дубляжа.

«Если и заменят [актеров], то очень нескоро», — сказал Пучков.

А что с мошенниками?

Однако там, где есть технологии, место найдется и для мошенников. Так как многие ИИ могут копировать голоса людей, в мире участились случаи, когда голос человека используют без его ведома.

Так, например, в 2019 году британский менеджер был обманут и перевел $260 тыс. на счет преступникам, которые скопировали голос его босса.

По словам Дерикьянца, Mind Simulation Lab работает над тем, чтобы максимально затруднить возникновение таких ситуаций.

«Мы не создаём голоса известных реальных личностей и не предоставляем к ним доступ, не позволяем пользователям создавать любые новые голоса на платформе, только их собственные и работаем над системой «цифровых подписей» или, если хотите, «водяных знаков» на аудио, чтобы всегда можно было определить происхождение аудио», — рассказал специалист.

При этом, с его слов, создатель мода к «Ведьмаку» не получал доступа к самому голосу, и не мог использовать его недобросовестно.

«В качестве демонстрации возможностей нашей технологии мы можем создать голоса, сильно похожие на те, что люди привыкли слышать в играх. Подчеркну, они используются для демонстрации. Однако иногда мы можем поддерживать сообщество разработчиков модов и помогать им с озвучкой. В таком случае разработчик отправляет нам текст реплик, мы его читаем и убеждаемся в том, что это реплики для мода. После этого самостоятельно озвучиваем и отправляем аудио файлы создателю мода.», — отметил Дерикьянц.

Партнер юридической компании 2b law office Антон Городецкий отметил, что использование чужого голоса пока не регулируется законодательно.

«Прямых норм, регулирующих данный вопрос, российское законодательство не содержит. Однако российское гражданское право в этом случае позволяет применять нормы, регулирующие сходные отношения (аналогия закона). Наиболее близкой нормой является статья 152.1 Гражданского кодекса РФ, касающаяся использования и охраны изображений граждан. Эта норма предусматривает, что за исключением отдельных случаев, использование изображения гражданина допускается только с согласия этого гражданина. Вероятнее всего, в случае рассмотрения судом спора о незаконном использовании чужого голоса, суд будет руководствоваться тем же подходом», — рассказал Городецкий.

По его словам, в случае отсутствия согласия гражданина на использование его голоса, пострадавшее лицо будет вправе требовать пресечения такого незаконного использования, уничтожения, в том числе изъятия из сети интернет, материалов с его голосом, а также компенсации вызванных таким действием убытков и морального вреда. При этом обратиться в суд с такими требованиями сможет не только сам потерпевший, но и, в случае его смерти, дети, переживший супруг или, в случае отсутствия последних, родители.

Старший юрист юридической фирмы Digital Rights Center Владимир Ожерельев отметил, что гражданский кодекс не охраняет право на голос наравне с правом на изображение, несмотря на правовое сходство данных объектов.

«Но для работы технологии, имитирующей голос, необходимо её обучение на базе уже существующих записей голоса, которые охраняются законом как исполнения и фонограммы. За незаконное использование записи голоса нарушитель может быть привлечен к административной, гражданской и уголовной ответственности, размер которой зависит от объёма нарушения», — отметил специалист.