Data Science
Классификация методом случайного леса с нуля
00
Вопрос или проблема Я построил модель классификации с использованием случайного леса на Python, которая работает очень хорошо. Однако для реализации я хочу построить её с нуля на SQL. Есть ли у модели классификации случайного леса коэффициенты?
Data Science
Как я могу обучить модель изменять вектор, поощряя модель на основе ближайших соседей измененных векторов?
00
Вопрос или проблема Я провожу эксперимент с системой извлечения документов, в которой документы представлены в виде векторов. Когда поступают запросы, они преобразуются в векторы тем же методом, который используется для документов.
Data Science
Скорость обучения уменьшается при добавлении большего количества GPU.
00
Вопрос или проблема Я использую распределенный Tensorflow с стратегией Mirrored. Я обучаю VGG16 на основе пользовательского Estimator. Однако при увеличении количества GPU время обучения увеличивается. По моим проверкам, использование GPU составляет около
Data Science
точность и полнота равны нулю
00
Вопрос или проблема Почему моя модель показывает такие метрики? Во время тренировки у модели точность и полнота были равны нулю? Я пытаюсь сделать бинарную классификацию грибов [съедобные, ядовитые]. У меня есть модель CNN с некоторым дроп-аутом и батч-нормализацией.
Data Science
Корреляция пропущенных значений
00
Вопрос или проблема Стоит ли изучать корреляцию пропусков между столбцами? Если у вас сильно коррелированные отсутствующие значения (скажем, между двумя столбцами, A и B), как это изменит или повлияет на ваш взгляд на данные? Добавляет ли это новую информацию при анализе данных?
Data Science
Бинарная классификация Сравнение двух временных рядов переменной длины
00
Вопрос или проблема Существует ли модель машинного обучения (что-то вроде LSTM или 1D-CNN), которая принимает на вход две временные серии переменной длины и выдает бинарную классификацию (Истина/Ложь, являются ли временные серии одного ярлыка)?
Data Science
Как взвесить несбалансированные мягкие метки?
00
Вопрос или проблема Цель — это вероятность между N классами, я не хочу, чтобы она предсказывала класс с наивысшей вероятностью, а ‘фактическую’ вероятность для каждого класса. Например: | | Класс 1 | Класс 2 | Класс 3 | ------------------------------------ | 1 | 0.
Data Science
Понимание интуиции, лежащей в основе сигмоидной кривой в контексте обратного распространения.
00
Вопрос или проблема Я пытался понять значимость S-образной формы сигмоидной/логистической функции. Наклон/производная сигмоиды приближается к нулю для очень больших и очень маленьких значений входных данных. То есть $σ'(z) ≈ 0$ для $z >
Data Science
Как использовать Word2Vec CBOW в статистическом алгоритме?
00
Вопрос или проблема Я видел несколько примеров использования CBOW в моделях нейронных сетей (хотя я их не понял). Я знаю, что Word2Vec не похож на BOW или TFIDF, так как для CBOW нет единственного значения, и все примеры, которые я видел, использовали нейронные сети.
Data Science
SOS: Скрипт работающей модели LightGBM для поиска лучшей модели
00
Вопрос или проблема Я пытался получить работающую модель LightGBM, которую я мог бы обучить на своих данных, выбрать наилучшую модель с наивысшим F1 показателем, а затем использовать ее для получения F1 показателя на тестовых данных.
Data Science
Наблюдения последовательностей разной длины при обучении скрытой модели Маркова
00
Вопрос или проблема Я хочу обучить классификатор последовательностей с помощью модели скрытых Марковских процессов. Длина наблюдаемых последовательностей не фиксирована. Я попробовал несколько пакетов HMM, таких как инструмент HMM в Matlab и библиотеку Кевина Мерфи.
Data Science
Как вычислить f1_score для многоклассовой многометочной классификации
00
Вопрос или проблема Я использовал одномерное кодирование [1,0,0][0,1,0][0,0,1] для своей функциональной модели классификации. Предсказанные вероятности для тестовых данных yprob = model.predict(testX) дают мне : yprob = array([[0.
Data Science
Что значит нормализовать временной ряд по отношению к другому?
00
Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные
Data Science
В качестве промежуточного программиста на R, желающего погрузиться в машинное обучение, мне стоит выбрать Python или остаться на R?
00
Вопрос или проблема Предыстория Я промежуточный R программист с некоторым опытом в концепциях машинного обучения и простом моделировании в R. У меня есть возможность сотрудничать с профессиональной командой машинного обучения, которая не против того
Data Science
Откуда взялось правило “глубокое обучение требует больших данных”?
00
Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “
Data Science
Использование оператора if в качестве модели в orange
00
Вопрос или проблема Я стремлюсь оценить логистическую регрессию по сравнению с классификацией на основе правил (вложенные операторы if-else) в Orange. Шаги, которые я предпринял для исследования этого вопроса, приводятся ниже: Я не смог идентифицировать
Data Science
Активные функции без ReLU лучше для небольших/плотных наборов данных?
15
Вопрос или проблема Исходя из вопросов ниже, я пришёл к выводу, что ReLu требует меньше вычислительных ресурсов и лучше справляется с разреженностью. Почему ReLU используется в качестве функции активации? Почему ReLU лучше других функций активации
Data Science
Как применить дискретизацию энтропии к набору данных
00
Вопрос или проблема У меня есть простой набор данных, к которому я хотел бы применить дискретизацию по энтропии. Программа должна дискретизировать атрибут на основе следующих критериев: Когда истинно одно из условий “a”
Data Science
Почему совместное встраивание слов и изображений работает?
00
Вопрос или проблема Я часто вижу некоторые работы, где авторы выполняют поэлементное умножение векторного представления слов и изображений (например, изображение ниже). Почему эта реализация работает? Я не понимаю. Модель более сложная, чем поэлементное
Data Science
Несупервизорное обнаружение и подсчет паттерна в временном сигнале без предварительных знаний.
00
Вопрос или проблема Я сталкиваюсь с проблемой, и, похоже, я не могу найти рабочее решение уже несколько лет. Кратко : Существует ли известный алгоритм или нейронная модель, которая может автоматически обнаруживать и подсчитывать паттерны в временном сигнале