Отключен JavaScript

У вас отключен JavaScript. Некоторые возможности системы не будут работать. Пожалуйста, включите JavaScript для получения доступа ко всем функциям.

Нейросети как инструмент для переозвучки видео

Автор DrSlon, 30 мар 2023 21:28

Авторизуйтесь для ответа в теме

Сообщений в теме: 12

#1 DrSlon

Почти местный слон

Модераторы разделов
1 220 сообщений

Пол:Мужчина
Город:где-то в низовьях Дона
Интересы:Что-нибудь делать в перерыве между едой.

Отправлено 30 марта 2023 - 21:28

Часто авторы альтернативных переводов при переозвучке видео используют три метода:

1. Просто сносят оригинальную звуковую дорогу, вставляют музыку и записывают альтернативные реплики. При этом видео выглядит "пустым" из-за отсутствия фоновых звуков. Особо упёртые заморачиваются наложением фоновых звуков из библиотек, коих тьма.

2. Приглушают оригинальную стерео-дорожку, ища компромисс между громкостью оригинала и наложенных альтернативных голосов. При желании наложить альтернативную музыку, этот способ не подходит.

3. В шестиполосном звуке приглушают центральную дорожку, что позволяет достичь довольно неплохих результатов: оригинальные голоса почти не слышны, фоновые звуки присутствуют. Альтернативную музыку почти всегда наложить без потери фоновых звуков не удается.

В экспериментальных целях вырезал кусочек стерео-аудиодороги и скормил ее нейросети https://mvsep.com/ru/. Там есть алгоритм, позволяющий разделить стерео-аудиодорогу на голос, музыку и фоновые звуки.

В примере по ссылке я переозвучил фрагмент фильма с использованием вырезанных нейросетью фоновых звуков и альтернативной музыки, а в конце фоновые звуки+оригинальная музыка.

"Милые дерутся-только тешатся"

https://drive.google...iew?usp=sharing

Сообщение отредактировал DrSlon: 30 марта 2023 - 21:36

Перешел в режим пофигизма

Наверх

#2 MrClon

Администратор

Администраторы
15 535 сообщений

Пол:Мужчина
Город:Москва

Отправлено 31 марта 2023 - 00:49

Выложил бы ещё отдельно исходный кусок и дорожки на которые его нейросеть наплостала, для тех кому лень самим тестить.

Техника походу перспективная

На самом деле будущее наступило несколько дней назад, просто никто этого не заметил.

Jabber: mrclon@jabber.ru

Наверх

#3 Halfanonim

Постоянный житель

Модераторы разделов
2 378 сообщений

Пол:Мужчина

Отправлено 31 марта 2023 - 00:57

Помню, в Аудасити есть функция отделения голоса от бекграунда, но чет она не особо помогла. Может, хоть здесь чет получится.

Наверх

#4 MrClon

Администратор

Администраторы
15 535 сообщений

Пол:Мужчина
Город:Москва

Отправлено 31 марта 2023 - 02:29

Думаю там просто разделение по частотам или что-то такое, а тут заявляется некая нейросетевая магия. Машинлёгнинг, диппфистинг, вот это вот всё

На самом деле будущее наступило несколько дней назад, просто никто этого не заметил.

Jabber: mrclon@jabber.ru

Наверх

#5 notimer

Пессимист сайта энтузиастов

Модераторы разделов
1 531 сообщений

Пол:Мужчина

Отправлено 01 апреля 2023 - 09:19

Пользовался сайтом https://mvsep.com/ru/, пока не открыл для себя другую нейронку, которая хавает и выдает куда более глубокое разделение.
А какая эта нейронка не скажу, сасите пидары!

Наверх

#6 DrSlon

Почти местный слон

Модераторы разделов
1 220 сообщений

Пол:Мужчина
Город:где-то в низовьях Дона
Интересы:Что-нибудь делать в перерыве между едой.

Отправлено 01 апреля 2023 - 20:10

Если ты имеешь ввиду lalal.ai, то она не умет отделять фоновые звуки от музыки.

Перешел в режим пофигизма

Наверх

#7 DrSlon

Почти местный слон

Модераторы разделов
1 220 сообщений

Пол:Мужчина
Город:где-то в низовьях Дона
Интересы:Что-нибудь делать в перерыве между едой.

Отправлено 01 апреля 2023 - 21:42

Для проверки возможностей нейросети https://mvsep.com/ru/ поэкспериментировал с русскоязычной озвучкой. Огрехи конечно есть, но вполне можно использовать как основу для альт. перевода русских фильмов. Примеры с разными полученными дорожками во фрагменте:

https://drive.google...?usp=share_link

Перешел в режим пофигизма

Наверх

#8 notimer

Пессимист сайта энтузиастов

Модераторы разделов
1 531 сообщений

Пол:Мужчина

Отправлено 02 апреля 2023 - 10:18

Если ты имеешь ввиду lalal.ai, то она не умет отделять фоновые звуки от музыки.

Нет, не её, есть гораздо лучше.

Наверх

#9 DrSlon

Почти местный слон

Модераторы разделов
1 220 сообщений

Пол:Мужчина
Город:где-то в низовьях Дона
Интересы:Что-нибудь делать в перерыве между едой.

Отправлено 06 июня 2023 - 22:13

Свежий видосик от Димы Череватенко ("лицо" пиратского профессионального дубляжа студии RHS) на тему нейросетей в озвучке

Смотреть на YouTube

Ролик длинный, кому лень смотреть: Со времен Апы и озвучки ботами они ушли вперед. Но не сильно. Механическую озвучку сразу слышно, например слово "бухАть", нейросеть читает как бУхать :sm34:

Перешел в режим пофигизма

Наверх

#10 DrSlon

Почти местный слон

Модераторы разделов
1 220 сообщений

Пол:Мужчина
Город:где-то в низовьях Дона
Интересы:Что-нибудь делать в перерыве между едой.

Отправлено 06 июня 2023 - 22:16

Свежий видосик от Димы Череватенко ("лицо" пиратского профессионального дубляжа студии RHS) на тему нейросетей в озвучке

Смотреть на YouTube

Ролик длинный, суть в следующем: Со времен Апы и озвучки ботами они ушли вперед. Но не сильно. Механическую озвучку сразу слышно, например слово "бухАть", нейросеть читает как бУхать

Перешел в режим пофигизма

Наверх

#11 Jimmy J.

Активный участник

Модераторы разделов
450 сообщений

Пол:Мужчина

Отправлено 08 июня 2023 - 05:22

Да пизда придет. Параллельно развиваются разные подходы.

Клонирование голоса - сократит количество специалистов сфере скорее всего. Будут голоса известных артистов типа Бурунова или Севки Кузнецова, которым повезло попасть во время когда прогресс наложился на их известность, они могут в теории получать отчисления, ноунеймы если и будут, то будут либо еще меньше получать, либо работать голосом на который потом накладывается голосовая маска Севки или Бурунова.

Если разовьется технология перевода на другой язык с сохранением интонаций то дубляж в принципе отвалится (можно сюда добавить автолипсинг нейронки который уже есть)

Текст ту спич в дубляж не засунешь скорее всего, либо засунешь хуй знает через сколько лет, такая ИИ должна понимать контекст, эмоции и т.д.

Текст ту видео ебнет кино.

Закадр отвалится быстрее дубляжа.

Аудиокниги быстрее закадра.

:huh:

Наверх

#12 Alex666

Житель форума

Пользователи
602 сообщений

Пол:Мужчина
Город:где-то между Николаевом и Одессой
Интересы:Электроника, рок, мотопутешествия.

Отправлено 08 июня 2023 - 12:44

И да грядёт Апокалипсис!

Кино, как таковое, сейчас-то неинтересное совсем (посмотрев что-либо сегодня, назавтра не можешь вспомнить - о чём был фильм), а после тотальной пизды в виде подключения ИИ к озвучке (а там глядишь - и к созданию сценария с режиссурой) оно превратится в хер знает что. И ведь это ещё только начало...конца.

"Не надо прогибаться под изменчивый мир - пусть лучше он прогнётся под нас."

А.Макаревич "Машина Времени"

Наверх

#13 v_kosmin

Житель форума

Пользователи
885 сообщений

Пол:Мужчина
Город:г. Москва
Интересы:футбол, чтение, кино, музыка и многое другое...

Отправлено 28 июля 2023 - 16:19

Главное в фундаментализме доктрины - не потерять голос. Свет, камера, мотор - и начинаются "ладушки". Лучшая награда за труды - пельмешки от Олешки...

https://youtu.be/nykEMiwqg6I

Наверх

Обратно в Технические вопросы

Количество пользователей, читающих эту тему: 0

0 пользователей, 0 гостей, 0 скрытых пользователей

Нейросети как инструмент для переозвучки видео

Количество пользователей, читающих эту тему: 0

Войти