Data Science

Классификация методом случайного леса с нуля

00

Вопрос или проблема Я построил модель классификации с использованием случайного леса на Python, которая работает очень хорошо. Однако для реализации я хочу построить её с нуля на SQL. Есть ли у модели классификации случайного леса коэффициенты?

Data Science

Как я могу обучить модель изменять вектор, поощряя модель на основе ближайших соседей измененных векторов?

00

Вопрос или проблема Я провожу эксперимент с системой извлечения документов, в которой документы представлены в виде векторов. Когда поступают запросы, они преобразуются в векторы тем же методом, который используется для документов.

Data Science

Скорость обучения уменьшается при добавлении большего количества GPU.

00

Вопрос или проблема Я использую распределенный Tensorflow с стратегией Mirrored. Я обучаю VGG16 на основе пользовательского Estimator. Однако при увеличении количества GPU время обучения увеличивается. По моим проверкам, использование GPU составляет около

Data Science

точность и полнота равны нулю

00

Вопрос или проблема Почему моя модель показывает такие метрики? Во время тренировки у модели точность и полнота были равны нулю? Я пытаюсь сделать бинарную классификацию грибов [съедобные, ядовитые]. У меня есть модель CNN с некоторым дроп-аутом и батч-нормализацией.

Data Science

Корреляция пропущенных значений

00

Вопрос или проблема Стоит ли изучать корреляцию пропусков между столбцами? Если у вас сильно коррелированные отсутствующие значения (скажем, между двумя столбцами, A и B), как это изменит или повлияет на ваш взгляд на данные? Добавляет ли это новую информацию при анализе данных?

Data Science

Бинарная классификация Сравнение двух временных рядов переменной длины

00

Вопрос или проблема Существует ли модель машинного обучения (что-то вроде LSTM или 1D-CNN), которая принимает на вход две временные серии переменной длины и выдает бинарную классификацию (Истина/Ложь, являются ли временные серии одного ярлыка)?

Data Science

Как взвесить несбалансированные мягкие метки?

00

Вопрос или проблема Цель — это вероятность между N классами, я не хочу, чтобы она предсказывала класс с наивысшей вероятностью, а ‘фактическую’ вероятность для каждого класса. Например: | | Класс 1 | Класс 2 | Класс 3 | ------------------------------------ | 1 | 0.

Data Science

Понимание интуиции, лежащей в основе сигмоидной кривой в контексте обратного распространения.

00

Вопрос или проблема Я пытался понять значимость S-образной формы сигмоидной/логистической функции. Наклон/производная сигмоиды приближается к нулю для очень больших и очень маленьких значений входных данных. То есть $σ'(z) ≈ 0$ для $z >

Data Science

Как использовать Word2Vec CBOW в статистическом алгоритме?

00

Вопрос или проблема Я видел несколько примеров использования CBOW в моделях нейронных сетей (хотя я их не понял). Я знаю, что Word2Vec не похож на BOW или TFIDF, так как для CBOW нет единственного значения, и все примеры, которые я видел, использовали нейронные сети.

Data Science

SOS: Скрипт работающей модели LightGBM для поиска лучшей модели

00

Вопрос или проблема Я пытался получить работающую модель LightGBM, которую я мог бы обучить на своих данных, выбрать наилучшую модель с наивысшим F1 показателем, а затем использовать ее для получения F1 показателя на тестовых данных.

Data Science

Наблюдения последовательностей разной длины при обучении скрытой модели Маркова

00

Вопрос или проблема Я хочу обучить классификатор последовательностей с помощью модели скрытых Марковских процессов. Длина наблюдаемых последовательностей не фиксирована. Я попробовал несколько пакетов HMM, таких как инструмент HMM в Matlab и библиотеку Кевина Мерфи.

Data Science

Как вычислить f1_score для многоклассовой многометочной классификации

00

Вопрос или проблема Я использовал одномерное кодирование [1,0,0][0,1,0][0,0,1] для своей функциональной модели классификации. Предсказанные вероятности для тестовых данных yprob = model.predict(testX) дают мне : yprob = array([[0.

Data Science

Что значит нормализовать временной ряд по отношению к другому?

00

Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные

Data Science

В качестве промежуточного программиста на R, желающего погрузиться в машинное обучение, мне стоит выбрать Python или остаться на R?

00

Вопрос или проблема Предыстория Я промежуточный R программист с некоторым опытом в концепциях машинного обучения и простом моделировании в R. У меня есть возможность сотрудничать с профессиональной командой машинного обучения, которая не против того

Data Science

Откуда взялось правило “глубокое обучение требует больших данных”?

00

Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “

Data Science

Использование оператора if в качестве модели в orange

00

Вопрос или проблема Я стремлюсь оценить логистическую регрессию по сравнению с классификацией на основе правил (вложенные операторы if-else) в Orange. Шаги, которые я предпринял для исследования этого вопроса, приводятся ниже: Я не смог идентифицировать

Data Science

Активные функции без ReLU лучше для небольших/плотных наборов данных?

15

Вопрос или проблема Исходя из вопросов ниже, я пришёл к выводу, что ReLu требует меньше вычислительных ресурсов и лучше справляется с разреженностью. Почему ReLU используется в качестве функции активации? Почему ReLU лучше других функций активации

Data Science

Как применить дискретизацию энтропии к набору данных

00

Вопрос или проблема У меня есть простой набор данных, к которому я хотел бы применить дискретизацию по энтропии. Программа должна дискретизировать атрибут на основе следующих критериев: Когда истинно одно из условий “a”

Data Science

Почему совместное встраивание слов и изображений работает?

00

Вопрос или проблема Я часто вижу некоторые работы, где авторы выполняют поэлементное умножение векторного представления слов и изображений (например, изображение ниже). Почему эта реализация работает? Я не понимаю. Модель более сложная, чем поэлементное

Data Science

Несупервизорное обнаружение и подсчет паттерна в временном сигнале без предварительных знаний.

00

Вопрос или проблема Я сталкиваюсь с проблемой, и, похоже, я не могу найти рабочее решение уже несколько лет. Кратко : Существует ли известный алгоритм или нейронная модель, которая может автоматически обнаруживать и подсчитывать паттерны в временном сигнале