Вопрос или проблема
Существует ли программное обеспечение, которое может делать это в реальном времени и различать голоса, так что их можно было бы описать как Персонаж1 Персонаж2 с временными метками и тем, что они говорят.
Otter предлагает автоматическую транскрипцию с определением нескольких говорящих уже несколько лет.
Аудиоформаты
- AAC (отображается в Finder с расширением файла .m4p)
- MP3
- M4A (включая голосовые заметки Apple)
- WAV
- WMA
- OGG
Ответ или решение
Да, существует несколько программных инструментов, которые могут осуществлять живую транскрипцию встреч, основанную на системном аудио, с поддержкой различия голосов. Одним из наиболее известных и эффективных решений является Otter.ai.
Otter.ai предлагает автоматическую транскрипцию в режиме реального времени и имеет возможность различать голоса участников встречи, обозначая их как "Person1", "Person2" и так далее. Кроме того, каждая запись снабжена временными метками, что позволяет удобно отслеживать, кто и что сказал в ходе дискуссии.
Кроме Otter.ai, существуют и другие аналогичные инструменты:
-
Microsoft Teams: Если вы использовали Teams для встреч, в некоторых версиях этой платформы доступна функция транскрипции, которая поддерживает автоматическое определение участников.
-
Google Meet: В Google Meet также предлагается функция субтитров, которую можно использовать для создания текстовой версии разговора в режиме реального времени, хотя она не всегда может присваивать имена участникам.
-
Sonix: Этот инструмент предоставляет возможности живой транскрипции с идентификацией голосов, а также позволяет интегрироваться с различными платформами для видеозвонков.
-
Descript: Эта программа также поддерживает транскрипцию живого аудио и может различать голоса, хотя может потребоваться предварительная настройка для лучшей идентификации участников.
Не забудьте проверить, какие системы аудио поддерживаются конкретными инструментами, так как некоторые из них могут иметь ограничения на форматы файлов. Некоторые из упомянутых сервисов имеют бесплатные тарифные планы, но для полной функциональности может потребоваться подписка на платный обслуживающий план.
В целом, если вам нужно решение для живой транскрипции с поддержкой различения голосов, Otter.ai может стать отличным выбором, однако не забудьте рассмотреть и другие варианты, исходя из ваших конкретных требований и рабочего окружения.