machine-learning - ответы на вопросы - Page 26 of 27

Data Science

Настройка порогов с методом один против всех для многоклассовой классификации на Python

00

Вопрос или проблема В настоящее время я использую алгоритм случайного леса One vs Rest для задачи многоклассовой классификации на Python и хочу найти оптимальный порог для каждого класса. Как я могу сделать это с помощью подхода OVR (One-Vs-Rest)?

Data Science

Я хочу автоматизировать процесс перемещения файлов с похожими именами в отдельную папку.

00

Вопрос или проблема У меня есть список путей ко всем папкам в подпапке, и некоторые имена путей содержат слова “Chapetrs”, “Chapter”, “chapter” или даже “chaptser”. Я хочу обнаружить эти слова в путях и

Data Science

Как я могу заставить модель разучиться? Обратное распространение ошибок?

00

Вопрос или проблема Я наткнулся на крайне многомерный минимум, который не могу воспроизвести, сколько бы моделей я ни обучал. Проблема в том, что я прошел несколько эпох слишком далеко и переобучился на обучающих данных. Мои критерии ранней остановки

Data Science

Как бы вы описали кластер 2 из этого вывода работы программы EM?

00

Вопрос или проблема Мое описание: Кластер 2 состоит из 9511 экземпляров, средний возраст составляет около 42 лет (колеблется от 29.7207 до 54.5257). Учитывая возраст, Кластер 2 хорошо отделен от Кластера 1, с расстоянием 18.9513.

Data Science

Какие самые быстрые методы уменьшения размерности можно использовать в готовом виде?

00

Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать движения в высокоразмерном, но разреженном векторном пространстве (например, вектор 1×75, где большинство элементов закодированы в формате one-hot или по модулю 3).

Data Science

Определить членов, которые, вероятно, изменят место получения лекарственной терапии.

00

Вопрос или проблема У меня есть доступ к данным по медицинским выплатам от крупной страховой компании. Как некоторые из вас уже знают, существует большая разница в цене на препарат X в зависимости от места его применения. Наша компания хочет помочь участникам

Data Science

Как извлечь характеристики из длинных химических названий?

00

Вопрос или проблема У меня есть интересная проблема, не знаю даже, с чего начать. Я работаю над бинарным классификатором, который будет принимать химическое название, закодированное в виде строки, и прогнозировать, является ли оно ‘

Data Science

Является ли обобщение модели, а затем удаление обобщения, полезным для FFNN?

00

Вопрос или проблема Если вы обучаете базовую FFNN (Сеть с прямой связью), вы можете применять регуляризации, такие как дроп-аут, l1, l2 и гауссовский шум, чтобы модель была устойчивой и показывала лучшие результаты на новых данных.

Data Science

Требуется ли масштабирование для таких наборов данных?

00

Вопрос или проблема У меня есть набор данных с такими характеристиками, как количество просмотров продукта (в сотнях тысяч), количество кликов по продуктам (в тысячах), коэффициент конверсии (в десятичном формате, например, 7,6%) и продажи (в сотнях).

Data Science

Включение структурной информации в трансформер?

03

Вопрос или проблема В задаче нейронного машинного перевода (NMT) мои входные данные содержат реляционную информацию. Эти отношения можно смоделировать с помощью графовой структуры. Один из подходов может заключаться в использовании графовой нейронной

Data Science

Скорость для различных ядер в SVM scikit-learn

00

Вопрос или проблема Я использую scikit-learn в Python для создания моделей, пробуя разные ядра. Я был удивлён, увидев, что RBF обучается менее чем за секунду, тогда как линейная модель заняла минуту, а полиномиальная — часы. Может кто-то объяснить, почему это происходит?

Data Science

Как обрабатывать сходство слов и категоризировать группу слов в одно слово.

00

Вопрос или проблема Я новичок в этой области и довольно долго искал решения, только чтобы наткнуться на множество различных возможных подходов, но ничего конкретного. Если у меня есть список слов, скажем: email_addr, email, email_address, address или

Вопросы и ответы

Ошибка cuDNN: CUDNN_STATUS_EXECUTION_FAILED

00

Вопрос или проблема Я пытаюсь провести инференс модели обнаружения объектов. У меня есть несколько камер с одинаковым сценарием использования, поэтому я использую многопоточность для обработки этого. У меня есть объект Model().

Data Science

ValueError: Ошибка при проверке входных данных: ожидался вход dense_36_input с формой (None, 12), но получен массив с формой (140, 2)

00

Вопрос или проблема Создание модели: model=Sequential() model.add(Dense(input_dim = 12, units = 10, activation='relu', kernel_initializer="uniform")) model.add(Dense(units = 8, activation='relu', kernel_initializer="uniform")) model.

Data Science

Метрики регрессии интерпретации

00

Вопрос или проблема Я провел анализ набора данных с помощью модели случайного леса. Результаты следующие. Почему MSE крайне высок, но коэффициент детерминации (r2) показывает точность около 83-84%? Это нормально и связано с набором данных, или это указывает на проблему?

Data Science

Как выбрать подходящие предикторы для модели классификации?

00

Вопрос или проблема Я работаю над задачей классификации. У меня есть две модели: Модель логистической регрессии Модель случайного леса Для первой модели, если я выберу только предикторы с p-значениями<0.05, я снизлю точность, полноту и т.

Data Science

Плохие результаты метрик из-за сильного классового дисбаланса в классификации кредитных карт.

00

Вопрос или проблема Здравствуйте, в данный момент я пишу дипломную работу и застрял на некоторых этапах. Я разработал несколько моделей машинного обучения (XGBoost, (сбалансированный) случайный лес, ElasticNet и др.) на крайне несбалансированном наборе

Data Science

Как я могу оценить надежность специфики модели с очень маленькими обучающими, тестовыми и валидационными наборами данных?

00

Вопрос или проблема Я новичок в статистике. У меня есть небольшая выборка из 646 образцов, на которой я обучил достаточно производительную модель (около 99% точности на тестовой и валидационной выборках). Чтобы усложнить задачу, классы немного несбалансированы.

Data Science

Почему моя нейронная сеть не может выучить функцию abs(x1-x2)?

00

Вопрос или проблема Я пытаюсь обучить простую нейронную сеть для многоклассовой классификации. У меня есть столбцы x1, x2, x3, x4 с 4 классами для предсказания. Если тренировать только на x1, x2, x3, x4, то я получаю точность 88% С некоторыми знаниями

Data Science

Извлечение ключевых слов из сообщений с помощью собственной модели NER

00

Вопрос или проблема Я начинаю проект, в котором хочу извлекать ключевые слова из заданных сообщений. Ключевые слова, например, такие как: “жесткий диск”, “часы” или другие технические компоненты. Я работаю с набором данных, в котором