Data Science
Наблюдения последовательностей разной длины при обучении скрытой модели Маркова
00
Вопрос или проблема Я хочу обучить классификатор последовательностей с помощью модели скрытых Марковских процессов. Длина наблюдаемых последовательностей не фиксирована. Я попробовал несколько пакетов HMM, таких как инструмент HMM в Matlab и библиотеку Кевина Мерфи.
Data Science
В качестве промежуточного программиста на R, желающего погрузиться в машинное обучение, мне стоит выбрать Python или остаться на R?
00
Вопрос или проблема Предыстория Я промежуточный R программист с некоторым опытом в концепциях машинного обучения и простом моделировании в R. У меня есть возможность сотрудничать с профессиональной командой машинного обучения, которая не против того
Data Science
Откуда взялось правило “глубокое обучение требует больших данных”?
00
Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “
Data Science
Почему совместное встраивание слов и изображений работает?
00
Вопрос или проблема Я часто вижу некоторые работы, где авторы выполняют поэлементное умножение векторного представления слов и изображений (например, изображение ниже). Почему эта реализация работает? Я не понимаю. Модель более сложная, чем поэлементное
Data Science
predict_classes() возвращает только 0 или 1 для многоклассовой классификации изображений
00
Вопрос или проблема Я пытаюсь создать многоклассовый классификатор изображений, но он возвращает только 0 или 1. Почему он не возвращает “Камень”, “Бумага”, “Ножницы”? И почему только 0 и 1, но не 2?
Data Science
Как удалить неактуальную информацию из списков сущностей?
00
Вопрос или проблема Я хочу извлечь сущности, используя 5 списков сущностей, которые я собрал. Списки на Python содержат около миллиона элементов каждый. Списки следующие: национальность, организация, профессия, религия, хобби.
Data Science
Как выполнить кросс-валидацию и заполнить пропущенные значения с помощью KNNImputer?
00
Вопрос или проблема Я работаю над задачей с контролируемым обучением с несбалансированными классами. У меня есть несколько вопросов о наилучшем способе обработки разбиения данных и недостающих значений. Мой текущий подход заключается в разбиении данных
Data Science
Определение участников, которые, вероятно, перейдут на продукт с более низкой стоимостью.
00
Вопрос или проблема Обзор: Я ищу технические рекомендации от сообщества ML/науки о данных о том, как я мог бы решить свою бизнес-проблему. Контекст: В двух словах, у меня есть группа клиентов, которые неоднократно покупают продукты из определенной категории
Data Science
Почему моя обученная модель не распознает новые изображения, которые отличаются от тестового набора данных?
00
Вопрос или проблема Я обучал модель для классификации различных изображений по разным меткам, вначале 2, и если бы это хорошо работало, я добавил бы больше меток для обучения. Я получил хорошие результаты по точности и прецизионности в ходе обучения
Data Science
Заполнение созданной функции значениями
00
Вопрос или проблема Я пытаюсь улучшить точность. Я создал несколько новых признаков на основе старых признаков. Поэтому мне нужно заполнить пустые ячейки новых признаков одинаковыми значениями, чтобы уравнять формы. Затем я попробовал это с медианой
Data Science
Как интерпретировать важность конкретной характеристики?
00
Вопрос или проблема Извините за очень специфичный вопрос. У меня есть набор данных генов, с помощью которого я использую машинное обучение для предсказания того, вызывает ли ген заболевание. Одна из характеристик, которую я имею, –
Data Science
Почему у SVM хуже граница разделения, чем у логистической регрессии?
00
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.
Data Science
Кросс-валидация с однолассной классификацией в Python
00
Вопрос или проблема Я пытаюсь выполнить кросс-валидацию с использованием классификации одного класса – я использую библиотеку PyOD – но не знаю, делаю ли я это правильно. Точность слишком низка, и я также не могу вывести среднее и стандартное отклонение F1.
Data Science
Потеря валидации не уменьшается при использовании плотных слоев, хотя данные для обучения и валидации имеют одно и то же распределение.
00
Вопрос или проблема У меня есть проблема, с которой мне сложно справиться: я не понимаю концепцию, которая приводит к этим результатам. Я использую плотный слой keras для отображения 13 входных признаков на 3 выходные метки. Во время обучения значение
Data Science
проблема нормализации признаков
00
Вопрос или проблема Я понял из этого поста, что нам нужно нормализовать тренировочные характеристики и масштабировать тестовые/валидационные характеристики с использованием тренировочных данных. Мои тренировочные образцы имеют фиксированные размеры, но
Data Science
Какие хорошие модели можно использовать для тестирования скорости машины для Data Science?
00
Вопрос или проблема Я пишу набор тестов (на Python) с целью измерения скорости различных вычислительных экземпляров моей компании. Цель состоит в том, чтобы увидеть, как быстро разные экземпляры AWS EC2 выполняют различные модели машинного обучения или
Data Science
Тонкая настройка с использованием предобученной модели всегда лучше, чем обучение с нуля?
00
Вопрос или проблема В худшем случае мы можем считать предварительно обученные веса случайной инициализацией, такой же, как если бы мы обучали модель с нуля, верно? Если это так, разве не было бы лучше всегда начинать с предварительно обученной модели
Data Science
Разница между феноменом двойного спада и доброкачественным переобучением
00
Вопрос или проблема Я пытаюсь понять разницу между феноменом двойного спуска и доброкачественным переобучением. Двойной спад возникает в модели, когда ошибка на тестах возрастает с увеличением сложности модели после определенной точки, а затем снова уменьшается
Data Science
Прогнозирование последовательности в наборе данных родитель-ребенок
00
Вопрос или проблема У нас есть большая коллекция документов (D), каждый из которых сопровождается набором метаданных (M). В этой коллекции некоторые документы являются родительскими и имеют несколько дочерних документов. Как родительские, так и дочерние
Data Science
Не удается подогнать ИНС к “простому” набору данных?
00
Вопрос или проблема Мне действительно трудно смоделировать набор данных, который я получил, проводя эксперименты. Конкретно это временные ряды (онлайн) данных измерений, а целевые параметры – это кинетические параметры, которые я подгонял под каждый