audio-recognition
Data Science
Вопрос или проблема Я работаю над личным проектом, в котором хочу автоматически генерировать временные метки для треклистов музыкальных миксов на YouTube. Для получения названий треков я использую этот API Shazam https://rapidapi.
Data Science
Вопрос или проблема Предположим, у меня есть аудиозапись 15 студентов, которые одновременно говорят “Я здесь”. Могу ли я сказать, сколько студентов говорило и кто они, используя машинное обучение? Я хочу создать приложение для учета посещаемости
Data Science
Вопрос или проблема Если бы у меня было 1000 аудиофайлов, где три человека независимо говорят название животного одновременно, может быть 9 независимых меток животных. Какие характеристики я должен выбрать из аудиофайла, и как мне их нормализовать, чтобы
Data Science
Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь
Data Science
Вопрос или проблема В настоящее время я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивки голосов. В процессе предварительной обработки данных я выполнил все в соответствии с опубликованными статьями.
Data Science
Вопрос или проблема Я работаю над обучением сети для предсказания направления прихода, и у меня возникла проблема: независимо от того, какая у меня сеть (ResNet 18 – 101, CRNN, CNN и т. д.), мои результаты склоняются к одному небольшому диапазону