Data Science
Как LGBM делает предсказание?
00
Вопрос или проблема В данный момент мы пытаемся разобраться, как LGBM создает свои деревья и как после этого делаются предсказания. На мой нынешний взгляд, это работает следующим образом: Последовательно создаются несколько “
Data Science
Алгоритм бинарной классификации, где входные переменные являются массивами.
00
Вопрос или проблема Для проекта я пытаюсь предсказать утечки в сети. Сеть состоит из узлов, соединённых ссылками. У меня есть несколько “сценариев”, в каждом из которых утечка присутствует на другом узле (также возможно, что утечки нет).
Data Science
Насколько близка или далека информация о важности признаков из модели машинного обучения от каузальных диаграмм?
00
Вопрос или проблема Заголовок в значительной степени охватывает мой вопрос, но чтобы подробнее его объяснить: учитывая данные (предположим, для простоты, что это достаточно хорошее представление подлежащего распределения) для задачи бинарной классификации
Data Science
Очень высокий F1 балл после использования Random Forest на этом наборе данных — это признак переобучения? Как решить эту проблему?
00
Вопрос или проблема Я работал над проектом по обнаружению фишинга в качестве учебного упражнения. После очистки данных, создания новых признаков, масштабирования не бинарных и обучения модели случайного леса, я достиг F1-метрики 0.
Data Science
Случайный лес всегда прогнозирует класс большинства
00
Вопрос или проблема Я предсказываю исход болезни, используя биологические данные (метаболиты плюс ковариаты: возраст, пол и ИМТ). Исход является бинарной переменной и умеренно несбалансирован (~12% положительных случаев). У меня относительно большое число
Data Science
Пожалуйста, прокомментируйте моё предложение для выпускной работы (нужны предложения!!!)
00
Вопрос или проблема 🎗 Название Проекта Space Vet: Ветеринарные услуги и уход за виртуальными питомцами с использованием ИИ 🔗 Область Интересов (AOI), Домен, Фокус Исследования (RF), Кейсовое Исследование (CS) AOI: Аналитика Данных/Текстов (Искусственный
Data Science
Как создать модель для выбора набора категорий с набором атрибутов?
00
Вопрос или проблема У меня есть несколько сотен категорий, каждая из которых имеет конкретный набор атрибутов с различными значениями (историческими). Проблема, которую мне нужно решить, заключается в том, чтобы выбрать лучший набор категорий из меньшей
Data Science
Как применить модель к обучающим данным для выявления неправильно размеченных наблюдений?
00
Вопрос или проблема У меня есть список людей, атрибуты этих людей (рост, вес, кровяное давление и т. д.) и двоичная целевая переменная, называемая has_heart_issues. Эти данные представляют собой полную популяцию данных, и я пытаюсь определить, похожи
Data Science
Кто написал формулу важности Джини/оценки важности признаков в sklearn?
00
Вопрос или проблема Я искал статью, в которой впервые была предложена важность Джини, но не уверен, действительно ли так это и произошло. Вот формула, с которой я знаком и которую ищу в статье: $$\frac{N_s}{N_t} * \left(i –
Data Science
Почему мои модели имеют довольно высокую точность с небольшим обучающим набором данных?
00
Вопрос или проблема Я задавался вопросом, почему мои модели (дерево решений, SVM, случайный лес) ведут себя таким образом, с “высокой” точностью на небольшом обучающем наборе данных. Это признак переобучения? График представляет собой точность
Data Science
Несбалансированный класс в моем наборе данных
00
Вопрос или проблема Я работаю с несбалансированным набором данных для предсказания инсультов, где положительный класс (возникновение инсульта) значительно недопредставлен. Сначала я использовал логистическую регрессию, но из-за несбалансированности классов
Data Science
Примите любое предложение по созданию тренировочных данных из корреляционной матрицы, чтобы найти исключение и определить разницу в вариации.
00
Вопрос или проблема У меня есть N временных векторных признаков, полученных путём записи различных параметров с течением времени. Это приводит к матрице схожести размера N*N, которая содержит значения корреляции один к одному для каждого признака.
Data Science
Недостающие данные продолжают появляться.
00
Вопрос или проблема Я работаю над проектом и использую алгоритм машинного обучения Random Forest. Прежде чем использовать модель, я должен был очистить свои данные, и я уже удалил пропущенные значения, но когда я пытаюсь использовать свою модель, она
Data Science
Теория функции оценки изолированного леса
00
Вопрос или проблема В настоящее время я читаю эту статью о изоляционных лесах. В разделе о функции счета они упоминают следующее. Для справки, $h(x)$ определяется как длина пути точки данных, проходящей через iTree, а $n$ — это размер выборки, используемый для роста iTree.
Data Science
Классификация методом случайного леса с нуля
00
Вопрос или проблема Я построил модель классификации с использованием случайного леса на Python, которая работает очень хорошо. Однако для реализации я хочу построить её с нуля на SQL. Есть ли у модели классификации случайного леса коэффициенты?
Data Science
Смешанная модель случайного леса с эффектами для Python Windows
00
Вопрос или проблема Кто-нибудь знает, есть ли модель смешанных эффектов случайного леса для Python на Windows? Пакет merf https://anaconda.org/search?q=merf+ кажется, доступен только в среде Linux? Спасибо! Я пытался установить “
Data Science
Вычислите функцию ранга из регрессионных признаков.
00
Вопрос или проблема Я использую 3 признака (x1, x2, x3) для регрессии. Некоторые из моих признаков являются непрерывными, а некоторые – категориальными. Моя зависимая переменная – это количество бронирований. И я могу предсказать количество бронирований.
Data Science
Случайный лес Цель/предсказание максимум минимум
00
Вопрос или проблема У меня есть регрессионный случайный лес, который нацелен на непрерывную переменную (сумма продаж). Есть ли какая-либо конфигурация для классификатора, которая позволяет установить максимум и минимум для целевой переменной?
Data Science
Можно ли применять лаг-функции к тестовым данным без меток?
00
Вопрос или проблема Могут ли лаговые признаки быть применены к тестовым данным без меток? Я об этом задумывался. Я пытался построить модель случайного леса, используя набор данных: обучающие данные (с меткой Y) и тестовые данные (без метки Y).
Data Science
Иллюстрация уменьшения размерности, выполненного моделью классификации или регрессии.
00
Вопрос или проблема Кратко: Вы можете предсказать что-то, но как объяснить предсказание? Редактирование: Я создал веб-сайт, который пытается ответить на этот вопрос с помощью внедрения / визуальной кластеризации данных в соответствии с путями, которые