audio-recognition - ответы на вопросы

Data Science

Сегментируйте аудио длительностью 5-7 минут на аудиоклипы по предложениям для создания набора данных для распознавания речи.

00

Вопрос или проблема Я пытаюсь создать набор данных для распознавания речи, особенно для индийских акцентов. Я собираю данные от коллег для этого. Каждый день я отправляю ссылку на статью и прошу их записать и загрузить запись на Google Drive.

Data Science

Обучение нейронной сети для локализации звука

00

Вопрос или проблема Я пытаюсь обучить нейронную сеть, чтобы оценить местоположение (в градусах от 0 до 180), откуда исходит звук. Я использую TensorFlow Keras в Python для обучения модели. Входные данные представляют собой два бинауральных признака, а

Data Science

Классификация звуков для нескольких классов английских букв

00

Вопрос или проблема Я записал аудиофайлы для английских букв, каждый файл включает 26 букв. Я разделил каждую букву на отдельный аудиофайл. Теперь я хочу поместить подобные аудиобуквы в одну папку. Я могу сделать это вручную, но это займет время.

Data Science

Автоматическая генерация треклиста для микса на YouTube.

00

Вопрос или проблема Я работаю над личным проектом, в котором хочу автоматически генерировать временные метки для треклистов музыкальных миксов на YouTube. Для получения названий треков я использую этот API Shazam https://rapidapi.

Data Science

Возможно ли для компьютеров определить, сколько людей говорит в аудиозаписи?

00

Вопрос или проблема Предположим, у меня есть аудиозапись 15 студентов, которые одновременно говорят “Я здесь”. Могу ли я сказать, сколько студентов говорило и кто они, используя машинное обучение? Я хочу создать приложение для учета посещаемости

Data Science

Использование SVM для классификации аудиоданных

00

Вопрос или проблема Если бы у меня было 1000 аудиофайлов, где три человека независимо говорят название животного одновременно, может быть 9 независимых меток животных. Какие характеристики я должен выбрать из аудиофайла, и как мне их нормализовать, чтобы

Data Science

Модель CNN недостаточно обучается. Точность остается на одном уровне.

00

Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь

Data Science

Модель (CNN) недостаточно обучается, или, по крайней мере, я считаю, что это так. Точность остается неизменной.

00

Вопрос или проблема В настоящее время я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивки голосов. В процессе предварительной обработки данных я выполнил все в соответствии с опубликованными статьями.

Data Science

Сдерживающие значения или сглаживание результатов при подгонке модели

00

Вопрос или проблема Я работаю над обучением сети для предсказания направления прихода, и у меня возникла проблема: независимо от того, какая у меня сеть (ResNet 18 – 101, CRNN, CNN и т. д.), мои результаты склоняются к одному небольшому диапазону