Data Science
Сегментируйте аудио длительностью 5-7 минут на аудиоклипы по предложениям для создания набора данных для распознавания речи.
00
Вопрос или проблема Я пытаюсь создать набор данных для распознавания речи, особенно для индийских акцентов. Я собираю данные от коллег для этого. Каждый день я отправляю ссылку на статью и прошу их записать и загрузить запись на Google Drive.
Data Science
Обучение нейронной сети для локализации звука
00
Вопрос или проблема Я пытаюсь обучить нейронную сеть, чтобы оценить местоположение (в градусах от 0 до 180), откуда исходит звук. Я использую TensorFlow Keras в Python для обучения модели. Входные данные представляют собой два бинауральных признака, а
Data Science
Классификация звуков для нескольких классов английских букв
00
Вопрос или проблема Я записал аудиофайлы для английских букв, каждый файл включает 26 букв. Я разделил каждую букву на отдельный аудиофайл. Теперь я хочу поместить подобные аудиобуквы в одну папку. Я могу сделать это вручную, но это займет время.
Data Science
Автоматическая генерация треклиста для микса на YouTube.
00
Вопрос или проблема Я работаю над личным проектом, в котором хочу автоматически генерировать временные метки для треклистов музыкальных миксов на YouTube. Для получения названий треков я использую этот API Shazam https://rapidapi.
Data Science
Возможно ли для компьютеров определить, сколько людей говорит в аудиозаписи?
00
Вопрос или проблема Предположим, у меня есть аудиозапись 15 студентов, которые одновременно говорят “Я здесь”. Могу ли я сказать, сколько студентов говорило и кто они, используя машинное обучение? Я хочу создать приложение для учета посещаемости
Data Science
Использование SVM для классификации аудиоданных
00
Вопрос или проблема Если бы у меня было 1000 аудиофайлов, где три человека независимо говорят название животного одновременно, может быть 9 независимых меток животных. Какие характеристики я должен выбрать из аудиофайла, и как мне их нормализовать, чтобы
Data Science
Модель CNN недостаточно обучается. Точность остается на одном уровне.
00
Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь
Data Science
Модель (CNN) недостаточно обучается, или, по крайней мере, я считаю, что это так. Точность остается неизменной.
00
Вопрос или проблема В настоящее время я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивки голосов. В процессе предварительной обработки данных я выполнил все в соответствии с опубликованными статьями.
Data Science
Сдерживающие значения или сглаживание результатов при подгонке модели
00
Вопрос или проблема Я работаю над обучением сети для предсказания направления прихода, и у меня возникла проблема: независимо от того, какая у меня сеть (ResNet 18 – 101, CRNN, CNN и т. д.), мои результаты склоняются к одному небольшому диапазону