speech-recognition
Программное обеспечение
Вопрос или проблема DNNs — это огромные алгоритмы, требующие большого объема данных, особенно двунаправленные LSTM. Для моделей распознавания речи существует нехватка голосовых корпусов для конкретных языков/акцентов. Однако YouTube является огромной библиотекой для этого.
Программное обеспечение
Вопрос или проблема Мой случай: у меня есть аудио речи и уже подготовленный текст той же речи. И мне нужно добавить временные метки для текста, чтобы я мог перемещаться между частями аудио с помощью текстовых подсказок. Как я вижу, Google Speech-to-Text позволяет это сделать.
Убунту
Вопрос или проблема В LibreOffice, похоже, нет встроенной функции голосового ввода. Есть ли способ включить голосовой ввод в LibreOffice? Если нет, есть ли другое бесплатное и с открытым исходным кодом программное обеспечение, с помощью которого я могу
Программное обеспечение
Вопрос или проблема Мне нужен пакет nodeJS для преобразования голоса в текст. Он должен поддерживать все браузеры, быть с открытым исходным кодом и бесплатным для использования в корпоративных целях. Попробуйте Google Cloud Speech: Node.
Программное обеспечение
Вопрос или проблема Я хочу запустить Whisper от OpenAI из командной строки и расшифровать каталог с тысячами звуковых файлов. Для этого можно использовать клиент командной строки, но командный клиент не предлагает все опции, которые предлагают соответствующие библиотеки.
Программное обеспечение
Вопрос или проблема Предыстория Ищу способ для перевода в реальном времени с английского на другой язык (например, мандарин, корейский, японский, немецкий, французский, испанский и т.д.) с использованием телефона на Android (Samsung Galaxy S10e).
Программное обеспечение
Вопрос или проблема У меня есть множество заметок, сделанных в mp3-файлах, которые я хочу транскрибировать в текстовые заметки. Я не хочу использовать онлайн-инструменты по соображениям конфиденциальности. Не могли бы вы порекомендовать инструмент для
Программное обеспечение
Вопрос или проблема У меня есть множество заметок, сделанных в mp3-файлах, которые я хочу транскрибировать в текстовые заметки. Я не хочу использовать онлайн-инструменты по причинам конфиденциальности. Не могли бы вы порекомендовать инструмент для оффлайн-транскрипции
Unix-подобные системы
Вопрос или проблема Я пытаюсь написать программу распознавания речи для Raspberry Pi, однако сталкиваюсь с некоторыми проблемами при использовании библиотеки speech_recognition в Python. Судя по сообщениям об ошибках (они приведены ниже), я думаю, что
Вопросы и ответы
Вопрос или проблема Мы разрабатываем систему распознавания голоса, которая должна определять голос, а затем переводить его в текст для ввода. Мы используем API распознавания речи. Но у нас возникают проблемы с тем, чтобы микрофон Bluetooth-гарнитуры работал
Программное обеспечение
Вопрос или проблема Я хочу создавать видеоконтент, который использует синтезированный голос, чтобы сохранить анонимность (и говорить в более “последовательной” манере, чем я это делаю, а также генерировать “чистый”
Программное обеспечение
Вопрос или проблема У меня есть несколько песен на английском языке, для которых не опубликованы тексты, так как они не популярны. Поэтому я ищу онлайн-сервис или самостоятельное приложение, которое может извлекать (распознавать) тексты песен (в качестве
Программное обеспечение
Вопрос или проблема Есть ли хорошие приложения (предпочтительно для Windows или Android), которые могут преобразовывать речь в текст и также переводить текст с английского на испанский или с испанского на английский? Я понимаю, что они не будут идеальными
Программное обеспечение
Вопрос или проблема У Google есть функция распознавания речи на странице поиска, но возможно ли получить доступ к тому же API/функционалу для преобразования речи в текст на компьютере с Windows, вне браузера? Я не уверен, является ли целью использование