machine-learning
Data Science
Вопрос или проблема Я хочу обучить классификатор последовательностей с помощью модели скрытых Марковских процессов. Длина наблюдаемых последовательностей не фиксирована. Я попробовал несколько пакетов HMM, таких как инструмент HMM в Matlab и библиотеку Кевина Мерфи.
Data Science
Вопрос или проблема Предыстория Я промежуточный R программист с некоторым опытом в концепциях машинного обучения и простом моделировании в R. У меня есть возможность сотрудничать с профессиональной командой машинного обучения, которая не против того
Data Science
Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “
Data Science
Вопрос или проблема Я часто вижу некоторые работы, где авторы выполняют поэлементное умножение векторного представления слов и изображений (например, изображение ниже). Почему эта реализация работает? Я не понимаю. Модель более сложная, чем поэлементное
Data Science
Вопрос или проблема Я пытаюсь создать многоклассовый классификатор изображений, но он возвращает только 0 или 1. Почему он не возвращает “Камень”, “Бумага”, “Ножницы”? И почему только 0 и 1, но не 2?
Data Science
Вопрос или проблема Я хочу извлечь сущности, используя 5 списков сущностей, которые я собрал. Списки на Python содержат около миллиона элементов каждый. Списки следующие: национальность, организация, профессия, религия, хобби.
Data Science
Вопрос или проблема Я работаю над задачей с контролируемым обучением с несбалансированными классами. У меня есть несколько вопросов о наилучшем способе обработки разбиения данных и недостающих значений. Мой текущий подход заключается в разбиении данных
Data Science
Вопрос или проблема Обзор: Я ищу технические рекомендации от сообщества ML/науки о данных о том, как я мог бы решить свою бизнес-проблему. Контекст: В двух словах, у меня есть группа клиентов, которые неоднократно покупают продукты из определенной категории
Data Science
Вопрос или проблема Я обучал модель для классификации различных изображений по разным меткам, вначале 2, и если бы это хорошо работало, я добавил бы больше меток для обучения. Я получил хорошие результаты по точности и прецизионности в ходе обучения
Data Science
Вопрос или проблема Я пытаюсь улучшить точность. Я создал несколько новых признаков на основе старых признаков. Поэтому мне нужно заполнить пустые ячейки новых признаков одинаковыми значениями, чтобы уравнять формы. Затем я попробовал это с медианой
Data Science
Вопрос или проблема Извините за очень специфичный вопрос. У меня есть набор данных генов, с помощью которого я использую машинное обучение для предсказания того, вызывает ли ген заболевание. Одна из характеристик, которую я имею, –
Data Science
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.
Data Science
Вопрос или проблема Я пытаюсь выполнить кросс-валидацию с использованием классификации одного класса – я использую библиотеку PyOD – но не знаю, делаю ли я это правильно. Точность слишком низка, и я также не могу вывести среднее и стандартное отклонение F1.
Data Science
Вопрос или проблема У меня есть проблема, с которой мне сложно справиться: я не понимаю концепцию, которая приводит к этим результатам. Я использую плотный слой keras для отображения 13 входных признаков на 3 выходные метки. Во время обучения значение
Data Science
Вопрос или проблема Я понял из этого поста, что нам нужно нормализовать тренировочные характеристики и масштабировать тестовые/валидационные характеристики с использованием тренировочных данных. Мои тренировочные образцы имеют фиксированные размеры, но
Data Science
Вопрос или проблема Я пишу набор тестов (на Python) с целью измерения скорости различных вычислительных экземпляров моей компании. Цель состоит в том, чтобы увидеть, как быстро разные экземпляры AWS EC2 выполняют различные модели машинного обучения или
Data Science
Вопрос или проблема В худшем случае мы можем считать предварительно обученные веса случайной инициализацией, такой же, как если бы мы обучали модель с нуля, верно? Если это так, разве не было бы лучше всегда начинать с предварительно обученной модели
Data Science
Вопрос или проблема Я пытаюсь понять разницу между феноменом двойного спуска и доброкачественным переобучением. Двойной спад возникает в модели, когда ошибка на тестах возрастает с увеличением сложности модели после определенной точки, а затем снова уменьшается
Data Science
Вопрос или проблема У нас есть большая коллекция документов (D), каждый из которых сопровождается набором метаданных (M). В этой коллекции некоторые документы являются родительскими и имеют несколько дочерних документов. Как родительские, так и дочерние
Data Science
Вопрос или проблема Мне действительно трудно смоделировать набор данных, который я получил, проводя эксперименты. Конкретно это временные ряды (онлайн) данных измерений, а целевые параметры – это кинетические параметры, которые я подгонял под каждый