Data Science
Модель идентификации говорящих на основе глубокого обучения Keras показывает отличные результаты во время обучения, а затем проваливает предсказания.
00
Вопрос или проблема Я пытаюсь создать модель идентификации говорящего 1:N с использованием Keras и TensorFlow в качестве бэкенда. Я использовал корпус LibriSpeech для обучающих данных и предварительно обработал данные, сначала конвертировав каждый файл из .
Data Science
Переобучение на валидационном наборе данных
00
Вопрос или проблема Я работаю над проектом в области машинного обучения, в котором у меня есть два набора данных: X (признаки индивидуумов) и y (двоичные прогнозы: -1 или 1). Моя цель – предсказать y на основе признаков в X.
Data Science
Почему линейная регрессия не показывает худших результатов при низком весе атрибута?
00
Вопрос или проблема Мне удалось построить несколько моделей линейной регрессии, которые могут достаточно хорошо прогнозировать прочность материала: минимальное RMSE составляет 17.95 с использованием 11 признаков, которые я выбрал из 159 оригинальных признаков.
Data Science
Советы по созданию модели рекомендаций для маркетинга
00
Вопрос или проблема Я работаю над проектом предоставления рекомендаций команде по маркетингу для запуска эффективных кампаний. Набор данных, который у меня есть, содержит информацию о существующих клиентах, их демографические и платежные данные, а также
Data Science
Как улучшить модель машинного обучения, используя 2 и более датасетов
00
Вопрос или проблема Я строю модель машинного обучения с учителем, которая (например) предсказывает сердечную недостаточность (да/нет). У меня есть два набора данных из двух разных лабораторий A и B, которые оба имеют приличное распределение, то есть нет
Data Science
Уравнение гиперплоскости для радиальной основы SVM.
00
Вопрос или проблема Мне нужно сгенерировать уравнение для гиперплоскости, у меня есть две независимые переменные и одна бинарная зависимая переменная. Что касается следующего уравнения для svm, $f(x)=sgn( sum_i alpha_i K(sv_i,x) + b )$ У меня есть две
Data Science
Оценка неопределенности регрессионных моделей
00
Вопрос или проблема Учитывая регрессионную модель с n признаками, как я могу измерить неопределенность или доверие к модели для каждого предсказания? Предположим, для конкретного предсказания точность потрясающая, но для другого –
Data Science
Бинарная классификация Сравнение двух временных рядов переменной длины
00
Вопрос или проблема Существует ли модель машинного обучения (что-то вроде LSTM или 1D-CNN), которая принимает на вход две временные серии переменной длины и выдает бинарную классификацию (Истина/Ложь, являются ли временные серии одного ярлыка)?
Data Science
Я получаю ошибку AttributeError: у объекта ‘DataFrame’ нет атрибута ‘data’
00
Вопрос или проблема import pandas as pd from sklearn.feature_selection import SelectKBest from sklearn.feature_selection import chi2 data=pd.read_csv(‘filename.csv’) x = data.data y = data.target Преобразование в DataFrame для лучшей визуализации column_names = [f’
Data Science
Хи-квадрат как оценочный метод для моделей регрессии нелинейного машинного обучения
00
Вопрос или проблема Я использую модели машинного обучения для предсказания порядковой переменной (значения: 1, 2, 3, 4 и 5) с использованием 7 различных признаков. Я рассмотрел это как задачу регрессии, поэтому окончательные выводы модели –
Data Science
МЛ-подход для получения списка наблюдений с похожими признаками (дискретные + непрерывные)
00
Вопрос или проблема У меня есть набор данных с 19 тысячами наблюдений. Каждое из них имеет примерно 448 признаков: – Текстовое описание, переведенное в векторы размером 300 – 16 категориальных переменных, представленных числовым образом –
Data Science
Граница решения нейронной сети
00
Вопрос или проблема Начнем с a). Для первого узла: 0 * x1 + 1 * x2 + 1 > 0 (0, потому что порог 0), что эквивалентно x2+1 > 0. Для второго узла: x1 * 1 + x2 * 0 + 1 > 0 (0, потому что порог 0), что эквивалентно x1 + 1 > […]
Data Science
Как я могу предсказать лучшее лечение для нового пациента?
00
Вопрос или проблема В рамках школьного проекта мне нужно проанализировать набор данных с пациентами (с характеристиками: пол, возраст, курящий 0/1 и т. д.), которые получали различные лечения (по одному на пациента) с ответом на это лечение 1/0.
Data Science
Возможно ли создать алгоритм машинного обучения, который сможет превзойти людей в сложных играх с использованием современных технологий?
00
Вопрос или проблема Сможет ли такая компания, как OpenAI, осуществить создание бота, который сможет превзойти лучших игроков в киберспорте в сложных играх, таких как PubG, используя технологии, доступные сегодня, обычному человеку?
Data Science
Как построить модель, в которой несколько точек данных способствуют результату
00
Вопрос или проблема Я пытаюсь разобраться, как обработать данные и смоделировать следующий сценарий: Посетители ресторана оценивают качество обслуживания по шкале от 1 до 10. У меня есть данные о взаимодействиях между официантами и клиентами.
Data Science
Может кто-то объяснить мне формулы обновления веса и смещения в регрессии как можно менее математически?
00
Вопрос или проблема Я пытаюсь построить регрессионную модель, но я запутался в формулах обратного распространения ошибки, не мог бы кто-нибудь помочь мне, пожалуйста? Ответ или решение Конечно! Давайте подробно разберемся в обновлениях весов и смещений
Data Science
Как классифицировать упорядоченные метки (ординальные данные)?
00
Вопрос или проблема У меня есть данные, похожие на рейтинги фильмов, и метки расположены в порядке, например, от 1 до 10. Поскольку целевая метка не является номинальной, а порядковой переменной, какие типы моделей мне следует использовать для классификации таких данных?
Data Science
Ошибка значения: неопределенность кардинальности данных: (Jupyter Notebook)
00
Вопрос или проблема Я создаю OCR для считывания текста со счетчиков воды. Я сталкиваюсь с указанной выше ошибкой, когда пытаюсь подогнать модель машинного обучения. Я использую библиотеку Python segmentation_models. BACKBONE = 'resnet34' preprocess_input = sm.
Data Science
Как сгенерировать матрицу путаницы для классификации с тремя классами с использованием кросс-валидации?
00
Вопрос или проблема Мне нужно сгенерировать матрицу путаницы для классификации фруктов, зараженных бактериями, грибами и вирусами, как для трехклассовой классификации. Для этого я использовал модель CNN. Для этой модели CNN я отправил изображения R, G
Data Science
У меня 100% точность на тестовом наборе, неужели что-то не так?
00
Вопрос или проблема Я получил 100% точности на своем тестовом наборе, используя алгоритм дерева решений, но только 85% точности с использованием случайного леса. Есть ли что-то не так с моей моделью или дерево решений наиболее подходит для предоставленного набора данных?