machine-learning - ответы на вопросы - Page 13 of 28

Data Science

Наблюдения последовательностей разной длины при обучении скрытой модели Маркова

00

Вопрос или проблема Я хочу обучить классификатор последовательностей с помощью модели скрытых Марковских процессов. Длина наблюдаемых последовательностей не фиксирована. Я попробовал несколько пакетов HMM, таких как инструмент HMM в Matlab и библиотеку Кевина Мерфи.

Data Science

В качестве промежуточного программиста на R, желающего погрузиться в машинное обучение, мне стоит выбрать Python или остаться на R?

00

Вопрос или проблема Предыстория Я промежуточный R программист с некоторым опытом в концепциях машинного обучения и простом моделировании в R. У меня есть возможность сотрудничать с профессиональной командой машинного обучения, которая не против того

Data Science

Откуда взялось правило “глубокое обучение требует больших данных”?

00

Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “

Data Science

Почему совместное встраивание слов и изображений работает?

00

Вопрос или проблема Я часто вижу некоторые работы, где авторы выполняют поэлементное умножение векторного представления слов и изображений (например, изображение ниже). Почему эта реализация работает? Я не понимаю. Модель более сложная, чем поэлементное

Data Science

predict_classes() возвращает только 0 или 1 для многоклассовой классификации изображений

00

Вопрос или проблема Я пытаюсь создать многоклассовый классификатор изображений, но он возвращает только 0 или 1. Почему он не возвращает “Камень”, “Бумага”, “Ножницы”? И почему только 0 и 1, но не 2?

Data Science

Как удалить неактуальную информацию из списков сущностей?

00

Вопрос или проблема Я хочу извлечь сущности, используя 5 списков сущностей, которые я собрал. Списки на Python содержат около миллиона элементов каждый. Списки следующие: национальность, организация, профессия, религия, хобби.

Data Science

Как выполнить кросс-валидацию и заполнить пропущенные значения с помощью KNNImputer?

00

Вопрос или проблема Я работаю над задачей с контролируемым обучением с несбалансированными классами. У меня есть несколько вопросов о наилучшем способе обработки разбиения данных и недостающих значений. Мой текущий подход заключается в разбиении данных

Data Science

Определение участников, которые, вероятно, перейдут на продукт с более низкой стоимостью.

00

Вопрос или проблема Обзор: Я ищу технические рекомендации от сообщества ML/науки о данных о том, как я мог бы решить свою бизнес-проблему. Контекст: В двух словах, у меня есть группа клиентов, которые неоднократно покупают продукты из определенной категории

Data Science

Почему моя обученная модель не распознает новые изображения, которые отличаются от тестового набора данных?

00

Вопрос или проблема Я обучал модель для классификации различных изображений по разным меткам, вначале 2, и если бы это хорошо работало, я добавил бы больше меток для обучения. Я получил хорошие результаты по точности и прецизионности в ходе обучения

Data Science

Заполнение созданной функции значениями

00

Вопрос или проблема Я пытаюсь улучшить точность. Я создал несколько новых признаков на основе старых признаков. Поэтому мне нужно заполнить пустые ячейки новых признаков одинаковыми значениями, чтобы уравнять формы. Затем я попробовал это с медианой

Data Science

Как интерпретировать важность конкретной характеристики?

00

Вопрос или проблема Извините за очень специфичный вопрос. У меня есть набор данных генов, с помощью которого я использую машинное обучение для предсказания того, вызывает ли ген заболевание. Одна из характеристик, которую я имею, –

Data Science

Почему у SVM хуже граница разделения, чем у логистической регрессии?

00

Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.

Data Science

Кросс-валидация с однолассной классификацией в Python

00

Вопрос или проблема Я пытаюсь выполнить кросс-валидацию с использованием классификации одного класса – я использую библиотеку PyOD – но не знаю, делаю ли я это правильно. Точность слишком низка, и я также не могу вывести среднее и стандартное отклонение F1.

Data Science

Потеря валидации не уменьшается при использовании плотных слоев, хотя данные для обучения и валидации имеют одно и то же распределение.

00

Вопрос или проблема У меня есть проблема, с которой мне сложно справиться: я не понимаю концепцию, которая приводит к этим результатам. Я использую плотный слой keras для отображения 13 входных признаков на 3 выходные метки. Во время обучения значение

Data Science

проблема нормализации признаков

00

Вопрос или проблема Я понял из этого поста, что нам нужно нормализовать тренировочные характеристики и масштабировать тестовые/валидационные характеристики с использованием тренировочных данных. Мои тренировочные образцы имеют фиксированные размеры, но

Data Science

Какие хорошие модели можно использовать для тестирования скорости машины для Data Science?

00

Вопрос или проблема Я пишу набор тестов (на Python) с целью измерения скорости различных вычислительных экземпляров моей компании. Цель состоит в том, чтобы увидеть, как быстро разные экземпляры AWS EC2 выполняют различные модели машинного обучения или

Data Science

Тонкая настройка с использованием предобученной модели всегда лучше, чем обучение с нуля?

00

Вопрос или проблема В худшем случае мы можем считать предварительно обученные веса случайной инициализацией, такой же, как если бы мы обучали модель с нуля, верно? Если это так, разве не было бы лучше всегда начинать с предварительно обученной модели

Data Science

Разница между феноменом двойного спада и доброкачественным переобучением

00

Вопрос или проблема Я пытаюсь понять разницу между феноменом двойного спуска и доброкачественным переобучением. Двойной спад возникает в модели, когда ошибка на тестах возрастает с увеличением сложности модели после определенной точки, а затем снова уменьшается

Data Science

Прогнозирование последовательности в наборе данных родитель-ребенок

00

Вопрос или проблема У нас есть большая коллекция документов (D), каждый из которых сопровождается набором метаданных (M). В этой коллекции некоторые документы являются родительскими и имеют несколько дочерних документов. Как родительские, так и дочерние

Data Science

Не удается подогнать ИНС к “простому” набору данных?

00

Вопрос или проблема Мне действительно трудно смоделировать набор данных, который я получил, проводя эксперименты. Конкретно это временные ряды (онлайн) данных измерений, а целевые параметры – это кинетические параметры, которые я подгонял под каждый