supervised-learning
Data Science
Вопрос или проблема Я новичок, и у меня есть вопрос. Можно ли использовать результаты кластеризации на основе вероятности для обучающего обучения? Данные производства содержат 80000 строк. Они не размечены, но есть информация о том, что уровень дефектов составляет 7,2%.
Data Science
Вопрос или проблема Для проекта я пытаюсь предсказать утечки в сети. Сеть состоит из узлов, соединённых ссылками. У меня есть несколько “сценариев”, в каждом из которых утечка присутствует на другом узле (также возможно, что утечки нет).
Data Science
Вопрос или проблема Я хочу предсказать коэффициенты конверсии для интернет-магазина. У меня есть данные из Google Analytics с такими характеристиками, как средняя продолжительность сессии, показатель отказов, количество посетителей по источникам и т.
Data Science
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors
Data Science
Вопрос или проблема У меня есть небольшой набор данных с 300 строками и несбалансированным распределением классов (35% положительных). Когда я обучаю модель логистической регрессии, она постоянно показывает результаты хуже случайного выбора.
Data Science
Вопрос или проблема Я использую набор данных, содержащий около 1,5 миллиона документов. Каждый документ сопровождается ключевыми словами, описывающими темы данного документа (то есть многоярлык). Каждый документ принадлежит нескольким авторам (не одному автору для документа).
Data Science
Вопрос или проблема Я работаю над проектом, который пытается определить, являются ли пользователи ботами или нет. В настоящее время метки, которые содержит набор данных, ненадежны, но я нашел некоторые тенденции/особенности, которые хорошо подходят для
Data Science
Вопрос или проблема Я говорю о простых нейронных сетях, МЛП. Я прочитал статью Глорот и Бенгио (2010), Понимание сложности обучения глубоких прямых нейронных сетей. В ней я прочитал интересное утверждение: «Методы глубокого обучения стремятся к обучению
Data Science
Вопрос или проблема В необучаемом обнаружении аномалий, превращает ли включение процента загрязнения изолирующий лес в обучаемый, а не необучаемый, когда я подгоняю данные после этого? Изолирующий лес является по сути необучаемым алгоритмом.
Data Science
Вопрос или проблема Я читал о вариантах перекрестной проверки для временных рядов и нашел изменение, называемое заблокированной перекрестной проверкой. На странице, которую я читал, говорится следующее: “Тем не менее, это может привести к утечке информации
Data Science
Вопрос или проблема Я работаю над задачей с контролируемым обучением с несбалансированными классами. У меня есть несколько вопросов о наилучшем способе обработки разбиения данных и недостающих значений. Мой текущий подход заключается в разбиении данных
Data Science
Вопрос или проблема Я работаю над задачей извлечения и классификации отношений. Данные представлены в виде текстовых файлов. Данные несбалансированные. Я хочу использовать функцию потерь focal для решения проблемы несбалансированности классов в данных.
Data Science
Вопрос или проблема У меня есть 4 ГБ данных по пошаговому прохождению для многих игр в одной стратегической игре. Кажется, что большинство людей, заинтересованных в использовании машинного обучения для создания ИИ для пошаговых игр, используют обучение
Data Science
Вопрос или проблема Какие хорошие сайты предоставляют вопросы для тестов по управляемому обучению и машинному обучению в целом? У меня скоро тест, и я хотел бы к нему подготовиться. Это зависит от того, о каком тесте идет речь.
Data Science
Вопрос или проблема Я новичок в машинном обучении и Data Science. Проведя некоторое время в сети, я смог довольно хорошо понять правило обучения восприятия. Но я все еще не понимаю, как применять его к набору данных. Например, у нас могут быть следующие
Data Science
Вопрос или проблема Контекст: Я работаю в индустрии ПЛК (программируемых логических контроллеров), где мы получаем схемы от клиентов, показывающие, как подключены различные устройства, и программируем ПЛК соответственно. Наша команда состоит из аналитика
Data Science
Вопрос или проблема У меня есть две базы данных с около 60,000 примеров каждая. Обе имеют одинаковые характеристики (одинаковые названия столбцов), которые представляют собой определенные вещи с текстом или категориями (превращенными в числа).
Data Science
Вопрос или проблема Какие хорошие способы расширить модель машинного обучения новой классом без повторной маркировки всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время контролируемого обучения Предположим
Data Science
Вопрос или проблема У меня есть набор данных о характеристиках победителей теннисных турниров и о характеристиках проигравших: возраст_победителя, рейтинг_победителя / возраст_проигравшего, рейтинг_проигравшего Чтобы провести надлежащий EDA, мне нужно
Data Science
Вопрос или проблема Какие существуют хорошие способы расширить модель машинного обучения новой классом без переобучения всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время supervised обучения Предположим