Вопрос или проблема
У меня есть субтитры без тайминга, и мне нужно автоматически синхронизировать их с видео.
После некоторых поисков я нашел
- http://www.jaivox.com/wordalign.html
- http://cmusphinx.sourceforge.net/2014/07/long-audio-aligner-landed-in-trunk/
- https://bitbucket.org/natsuhh/prosub/
Я хотел бы получить рекомендацию по программному обеспечению, которое может синхронизировать мои субтитры. Предпочтительно на основе личного опыта.
У меня есть доступ к Linux и Windows. Я предпочитаю оффлайн инструмент, хотя онлайн тоже подойдет. Форматы видео и субтитров не имеют значения: я могу конвертировать видео и субтитры в что-то, с чем сможет работать инструмент для выравнивания.
YouTube имеет функцию “Автоматическое время” для транскрипций на английском, голландском, французском, немецком, итальянском, японском, корейском, португальском, русском и испанском языках.
Вот еще один способ:
- Загрузите оригинальные видео на иностранном языке в Whisper API, или установите Whisper LLM локально
- Пусть Whisper транскрибирует видео и вернет его в виде .srt файла. Это будет содержать очень точные метки.
- Вставьте .srt файлы в Google Translate или в какой-то другой сервис перевода
- Сравните машинные переводы с вашими предварительно существующими переводами вручную, замените машинные переводы на сделанные вручную переводы
Обновление 2024: Google теперь вводит лимит в 5000 символов в своем веб-интерфейсе translate.google.com. Сшивание многих блоков переведенного текста по 5000 символов возможно через веб-интерфейс, но это утомительно, и результаты и “стыки” так себе.
Ответ или решение
Автоматическая синхронизация субтитров: Полное руководство
В условиях современных мультимедийных технологий автоматическая синхронизация субтитров становится неотъемлемой частью создания контента. Если у вас есть субтитры без временных меток, вы можете использовать несколько инструментов и методов для их автоматической синхронизации с видео. В этой статье мы обсудим наиболее эффективные решения и программное обеспечение для данной задачи, которые могут работать на платформах Linux и Windows.
1. Подходящие инструменты для синхронизации субтитров
Существует несколько утилит, которые помогают автоматизировать процесс синхронизации субтитров. Мы рассмотрим некоторые из наиболее популярных:
-
WordAlign: Этот инструмент, доступный на сайте Jaivox, позволяет выполнять выравнивание текста и субтитров с помощью языковых моделей. WordAlign хорошо подходит для пользователей, знакомых с языком программирования Python.
-
CMU Sphinx: Проект CMU Sphinx предлагает мощный аудиопроцессор, который может быть использован для синхронизации длинных аудиофайлов с текстами. Данная утилита лицензируется как открытое ПО, что делает её особенно привлекательной для разработчиков.
-
Prosub: Утилита, размещенная на Bitbucket, приспособлена для работы с несколькими языковыми форматами. Prosub имеет дружественный интерфейс и может быть полезен для пользователей, не обладающих глубокими техническими знаниями.
2. Использование YouTube для автоматической синхронизации
Если у вас есть доступ к загруженной версии видео на YouTube, вы можете воспользоваться функцией автоматического времени. Подробности можно найти на официальной странице помощи YouTube. Эта функция автоматически генерирует временные метки для субтитров на поддерживаемых языках, таких как английский, испанский и другие.
3. Альтернативный способ с использованием Whisper API
Вы также можете воспользоваться нейросетевым сервисом от OpenAI:
- Загрузите оригинальное видео через Whisper API или установите Whisper на своем устройстве (GitHub Whisper).
- Дайте Whisper транскрибировать видео и получите файл формата .srt с высокоточными временными метками.
- Используйте Google Translate или аналогичный сервис для машинного перевода полученного .srt файла.
- Проведите сравнительный анализ машинного перевода и оригинала, вручную исправляя перевод.
Важный момент
С 2024 года Google ввел ограничение в 5000 символов для своей веб-версии переводчика. Это может вызвать трудности при обработке больших текстов.
4. Заключение
Синхронизация субтитров — это важный шаг в процессе редактирования видео, и существуют различные инструменты для помощи в этом. Поскольку каждый метод имеет свои преимущества и недостатки, ваш выбор должен зависеть от конкретных условий задачи и доступных ресурсов. Использование автоматизированных решений, таких как Whisper или CMU Sphinx, может значительно сэкономить время и улучшить качество конечного продукта.
Таким образом, вы сможете оптимизировать процесс редактирования вашего мультимедийного контента и обеспечить доступность видео для более широкой аудитории.