Data Science
Data Science
Вопрос или проблема Я построил модель классификации с использованием случайного леса на Python, которая работает очень хорошо. Однако для реализации я хочу построить её с нуля на SQL. Есть ли у модели классификации случайного леса коэффициенты?
Data Science
Вопрос или проблема Я провожу эксперимент с системой извлечения документов, в которой документы представлены в виде векторов. Когда поступают запросы, они преобразуются в векторы тем же методом, который используется для документов.
Data Science
Вопрос или проблема Я использую распределенный Tensorflow с стратегией Mirrored. Я обучаю VGG16 на основе пользовательского Estimator. Однако при увеличении количества GPU время обучения увеличивается. По моим проверкам, использование GPU составляет около
Data Science
Вопрос или проблема Почему моя модель показывает такие метрики? Во время тренировки у модели точность и полнота были равны нулю? Я пытаюсь сделать бинарную классификацию грибов [съедобные, ядовитые]. У меня есть модель CNN с некоторым дроп-аутом и батч-нормализацией.
Data Science
Вопрос или проблема Стоит ли изучать корреляцию пропусков между столбцами? Если у вас сильно коррелированные отсутствующие значения (скажем, между двумя столбцами, A и B), как это изменит или повлияет на ваш взгляд на данные? Добавляет ли это новую информацию при анализе данных?
Data Science
Вопрос или проблема Существует ли модель машинного обучения (что-то вроде LSTM или 1D-CNN), которая принимает на вход две временные серии переменной длины и выдает бинарную классификацию (Истина/Ложь, являются ли временные серии одного ярлыка)?
Data Science
Вопрос или проблема Цель — это вероятность между N классами, я не хочу, чтобы она предсказывала класс с наивысшей вероятностью, а ‘фактическую’ вероятность для каждого класса. Например: | | Класс 1 | Класс 2 | Класс 3 | ------------------------------------ | 1 | 0.
Data Science
Вопрос или проблема Я пытался понять значимость S-образной формы сигмоидной/логистической функции. Наклон/производная сигмоиды приближается к нулю для очень больших и очень маленьких значений входных данных. То есть $σ'(z) ≈ 0$ для $z >
Data Science
Вопрос или проблема Я видел несколько примеров использования CBOW в моделях нейронных сетей (хотя я их не понял). Я знаю, что Word2Vec не похож на BOW или TFIDF, так как для CBOW нет единственного значения, и все примеры, которые я видел, использовали нейронные сети.
Data Science
Вопрос или проблема Я пытался получить работающую модель LightGBM, которую я мог бы обучить на своих данных, выбрать наилучшую модель с наивысшим F1 показателем, а затем использовать ее для получения F1 показателя на тестовых данных.
Data Science
Вопрос или проблема Я хочу обучить классификатор последовательностей с помощью модели скрытых Марковских процессов. Длина наблюдаемых последовательностей не фиксирована. Я попробовал несколько пакетов HMM, таких как инструмент HMM в Matlab и библиотеку Кевина Мерфи.
Data Science
Вопрос или проблема Я использовал одномерное кодирование [1,0,0][0,1,0][0,0,1] для своей функциональной модели классификации. Предсказанные вероятности для тестовых данных yprob = model.predict(testX) дают мне : yprob = array([[0.
Data Science
Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные
Data Science
Вопрос или проблема Предыстория Я промежуточный R программист с некоторым опытом в концепциях машинного обучения и простом моделировании в R. У меня есть возможность сотрудничать с профессиональной командой машинного обучения, которая не против того
Data Science
Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “
Data Science
Вопрос или проблема Я стремлюсь оценить логистическую регрессию по сравнению с классификацией на основе правил (вложенные операторы if-else) в Orange. Шаги, которые я предпринял для исследования этого вопроса, приводятся ниже: Я не смог идентифицировать
Data Science
Вопрос или проблема Исходя из вопросов ниже, я пришёл к выводу, что ReLu требует меньше вычислительных ресурсов и лучше справляется с разреженностью. Почему ReLU используется в качестве функции активации? Почему ReLU лучше других функций активации
Data Science
Вопрос или проблема У меня есть простой набор данных, к которому я хотел бы применить дискретизацию по энтропии. Программа должна дискретизировать атрибут на основе следующих критериев: Когда истинно одно из условий “a”
Data Science
Вопрос или проблема Я часто вижу некоторые работы, где авторы выполняют поэлементное умножение векторного представления слов и изображений (например, изображение ниже). Почему эта реализация работает? Я не понимаю. Модель более сложная, чем поэлементное
Data Science
Вопрос или проблема Я сталкиваюсь с проблемой, и, похоже, я не могу найти рабочее решение уже несколько лет. Кратко : Существует ли известный алгоритм или нейронная модель, которая может автоматически обнаруживать и подсчитывать паттерны в временном сигнале