Data Science
Инженерия признаков: признак свежести
00
Вопрос или проблема У меня есть проблема с оценкой клиентов, над которой я работаю, в частности, с прогнозированием конверсии и подсчетом вероятностного балла конверсии (в данный момент используется классификатор xgboost). Есть один признак, который я
Data Science
Я получаю отрицательный убыток, используя PyCharm, и положительный, используя Google Colab или Kaggle.
00
Вопрос или проблема У меня есть данные в виде изображений и 2 столбца: один содержит значения тангенса, а второй – для указания, являются ли мои значения отрицательными или положительными. У меня есть два выхода: классификация и регрессия.
Data Science
Проблема с моей пользовательской функцией потерь: я получаю отрицательное значение потерь в PyCharm и положительное в Google Colab или Kaggle.
00
Вопрос или проблема У меня есть данные в виде изображений и 2 колонок: одна содержит значения тангенсов, а вторая указывает, являются ли мои значения отрицательными или положительными, и у меня есть два вывода: классификация и регрессия.
Data Science
Как обрабатывать один столбец с непрерывными и категориальными данными для модели машинного обучения
00
Вопрос или проблема Я работаю с финансовыми данными, где у меня есть признак (столбец) с 90% значений в диапазоне от 0 до 1000 (непрерывные) и 10% значений как -1, -2 и -9. (значения по умолчанию) Определение значений по умолчанию: -1: данные недоступны
Data Science
Имеет ли смысл использовать важности признаков, основанные на индексе Джини, для других классификаторов?
00
Вопрос или проблема Мне хотелось бы узнать, имеет ли смысл запускать yellowbrick.features.FeatureImportances с моделью RandomForestClassifier, чтобы найти наиболее влиятельные признаки, а затем подгонять другую модель (например, MLPClassifier) с этими признаками.
Data Science
Классификация методом случайного леса с нуля
00
Вопрос или проблема Я построил модель классификации с использованием случайного леса на Python, которая работает очень хорошо. Однако для реализации я хочу построить её с нуля на SQL. Есть ли у модели классификации случайного леса коэффициенты?
Data Science
Бинарная классификация Сравнение двух временных рядов переменной длины
00
Вопрос или проблема Существует ли модель машинного обучения (что-то вроде LSTM или 1D-CNN), которая принимает на вход две временные серии переменной длины и выдает бинарную классификацию (Истина/Ложь, являются ли временные серии одного ярлыка)?
Data Science
SOS: Скрипт работающей модели LightGBM для поиска лучшей модели
00
Вопрос или проблема Я пытался получить работающую модель LightGBM, которую я мог бы обучить на своих данных, выбрать наилучшую модель с наивысшим F1 показателем, а затем использовать ее для получения F1 показателя на тестовых данных.
Data Science
Почему у SVM хуже граница разделения, чем у логистической регрессии?
00
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.
Data Science
Поиск реализации Faster RCNN
00
Вопрос или проблема Какие из известных вам реализаций Faster RCNN являются наилучшими по написанию и структурированию? Пожалуйста, предоставьте ссылки. Если вы знакомы с Tensorflow, вы можете обратиться к Tensorflow Object Detection API.
Data Science
Сравнение работы сети с тройной потерей и многоклассовой классификации
00
Вопрос или проблема Я обучаю сеть классификации на основе тройного потерь и обычную сеть многоклассовой классификации на основе некоторых изображений. В моем случае сеть с тройным потерями работает хуже, чем многоклассовая сеть.
Data Science
Классификация последовательных данных
00
Вопрос или проблема В настоящее время я пытаюсь классифицировать дискретные последовательные данные на пять классов с помощью машинного обучения. Настройка следующая: Фактический объект заполнен различными свойствами, но для разделения объектов и назначения
Data Science
Точность и потеря в МЛП
00
Вопрос или проблема Я пытаюсь исследовать модели для предсказания, выиграет ли команда или проиграет, основываясь на характеристиках команды и ее соперника. Мои обучающие данные состоят из 15 000 образцов с 760 числовыми признаками.
Data Science
Определите окно временного ряда “стационарного состояния”
00
Вопрос или проблема Я новичок в анализе временных рядов. У меня есть несколько временных рядов (конечно, шумных), которые являются частью одного и того же набора измерений (достигнутых одновременно). Временные ряды – это результаты стохастического
Data Science
Моя модель LSTM RNN всегда выдает один и тот же результат для каждого предсказания, что я могу сделать?
00
Вопрос или проблема У меня есть набор данных с траекториями (несколько массивов с плавающей точкой), которые я хочу классифицировать (0 или 1, в зависимости от типа траектории). features = np.column_stack(( sat.inclinations, sat.
Data Science
Модель Tensorflow работает для классификации, но не для регрессии (все предсказания равны смещению выходного слоя).
00
Вопрос или проблема Я пытаюсь создать модель для прогноза валютных курсов. Она дает многообещающие результаты для классификации каждого периода как покупка/продажа/нейтрально. При использовании в качестве классификатора фактическая доходность преобразуется
Data Science
Биномиальная семья в логистической регрессии
00
Вопрос или проблема Меня спросили на интервью, почему мы используем биномиальное распределение в логистической регрессии и как это связано с классом, который мы предсказываем? Может кто-то объяснить, без каких-либо математических уравнений, почему мы
Data Science
Как решить, кого продвигать? Кластеризация или дерево решений?
00
Вопрос или проблема Я работаю с набором данных, который имеет достаточно наблюдений и около 10 переменных, половина переменных числовые другая половина переменных категориальные с 2-3 уровнями (демографические) одна переменная идентификатора одна последняя
Data Science
Как иметь несколько меток в одном видео?
00
Вопрос или проблема Я разрабатываю систему классификации теннисных ударов с использованием CNN. Я предполагаю, что каждый удар состоит из 3 этапов/классов (‘Готовность’, ‘Импакт’, ‘Финиш’). Я хочу обучить модель, которая
Data Science
Классификация многомерных данных в многомерные кластеры с изменяющейся структурой подкластеров.
00
Вопрос или проблема У меня есть большой набор данных со смешанными (числовыми, категориальными, текстовыми) данными, которые мне нужно классифицировать. Кластеры хорошо определены, но многомерны (т.е. имеют векторное значение) и имеют различную структуру