Data Science
Дифференцирование вектора с различными операциями над каждым элементом
00
Вопрос или проблема У меня есть некоторое представление о том, как будет работать обратное распространение для функции потерь, такой как: loss=summation(predicted-true)^2 Где predicted и true — векторы одинаковой длины и одна и та же операция применяется ко всем элементам.
Data Science
Полностью эндогенные модели для прогнозирования мультиизмерных временных рядов
00
Вопрос или проблема У меня формальное образование в области социальных наук, но я новый в области анализа данных. Меня интересует создание предсказательных моделей для применения в социальных науках, в основном (но не только) в экономике.
Data Science
IndexError: индекс списка вне диапазона
00
Вопрос или проблема Я реализую модель последовательность-в-последовательность с архитектурой RNN-VAE и использую механизм внимания. У меня проблема в части декодирования. Я сталкиваюсь с этой ошибкой: IndexError: list index out of range Когда я запускаю
Data Science
Сколько повторений стохастического алгоритма необходимо произвести, прежде чем результаты можно будет считать надежными?
00
Вопрос или проблема Я написал стохастический алгоритм машинного обучения. Каждый раз, когда я запускаю алгоритм на одних и тех же тестовых данных, я получаю разные результаты. Я определяю точность каждый раз в сравнении с истинным значением.
Data Science
Операции с рекомендационными встраиваниями
00
Вопрос или проблема Я обучил систему рекомендаций, чтобы рекомендовать игры Steam на основе тегов игр. Пример вывода показан ниже, где GAME — это игра, рекомендованная на основе similarity (показателя схожести). Игра для рекомендации: Total War: WARHAMMER
Data Science
Визуализация BERTopic
00
Вопрос или проблема Я новичок в моделировании тем и пытаюсь использовать BERTopic в PyCharm. Мне трудно заставить любую визуализацию работать в PyCharm с BERTopic. Вот мой текущий код: import pickle from umap import UMAP from hdbscan import HDBSCAN from
Data Science
Модели машинного обучения с обучением на масштабированных входах
00
Вопрос или проблема У меня есть входные данные, величины которых значительно варьируются между признаками. Я масштабировал их с помощью StandardScaler() из sklearn, а затем использовал keras для обучения нейронной сети на этих данных для предсказания моей целевой переменной.
Data Science
Нормализация данных с неравными группами?
00
Вопрос или проблема У меня есть набор данных с тремя независимыми переменными [город, отрасль, сумма], и я хотел бы нормализовать сумму. Но я хочу сделать это с учетом отрасли и города. Простая группировка по городу и отрасли дает мне множество очень
Data Science
Как я могу исправить фильтр и размер ядра CNN?
00
Вопрос или проблема Я создал 4 x 4 двумерные изображения из сигнала. Теперь я хочу подать эти данные в сверточную нейронную сеть. Как мне выбрать количество фильтров, размер ядра для такого небольшого, по форме и размеру набора данных (4 x 4, 320 изображений)?
Data Science
RandomizedSearchCV(n_iter=10) не останавливается после обучения 10 моделей.
00
Вопрос или проблема Я использую RandomizedSearchCV для оптимизации гиперпараметров. Когда я запускаю модель, она показывает оценки для каждой тренировки модели. Проблема в том, что она обучает гораздо больше 10 моделей, в то время как я ожидаю, что будет
Data Science
Пользовательская регуляризация для логистической регрессии
00
Вопрос или проблема Мое понимание l2 регуляризации: Весы модели считаются имеющими априорное гауссово распределение, центрированное вокруг 0. Затем оценка MAP по данным добавляет дополнительное наказание в функцию стоимости. Мое сформулированное заявление
Data Science
Основной рабочий процесс топологического анализа данных и глубокого обучения
00
Вопрос или проблема У меня есть определенная путаница относительно применения топологического анализа данных (TDA) и глубокого обучения к табличному набору данных. Согласно общепринятому стандарту, строки представляют собой точки, а столбцы — признаки.
Data Science
Как обработать временные ряды с перекрытием и различным числом признаков?
00
Вопрос или проблема У меня есть две машины, Машина А и Машина Б, собирающие временные ряды данных. Первая машина работает каждый день и собирает 5 характеристик, а вторая работает каждый пятницу и собирает 10 характеристик. Я пытаюсь применить это к модели
Data Science
Использование CNN или OCR для преобразования изображения в число
00
Вопрос или проблема На изображении ниже показан номер 18. С помощью компьютерного зрения как я могу распознать этот номер? Ответ или решение Для решения задачи распознавания числа на изображении с использованием свёрточной нейронной сети (CNN) или OCR
Data Science
Много классовая классификация с дискретными выходами: какую функцию потерь и активации выбрать?
00
Вопрос или проблема Я работаю над задачей многоклассовой классификации с использованием моделей Keras Sequential. В моем наборе данных выходной класс имеет одно из следующих значений: (1, 2, 3, 4, 5). Да, я уже пробовал использовать one-hot-кодирование
Data Science
Линейный дискриминантный анализ и PDF
01
Вопрос или проблема Я изучаю материал по LDA. Я не на 100% уверен, как интерпретировать PDF двух выборок в контексте LDA. Допустим, такая ситуация: Во-первых, почему форма розового PDF справа более узкая? Приоритет выше, но это не имеет ничего общего с формой PDF.
Data Science
Почему мое восстановленное изображение выглядит темнее оригинала?
00
Вопрос или проблема Я пытаюсь построить автокодировщик, который будет кодировать изображение в латентное пространство, а затем декодировать его обратно в оригинальное изображение без каких-либо изменений. В основном я пытаюсь реализовать эту статью Универсальная
Data Science
Почему цепочка классификаторов требует как минимум 2 класса, когда у меня есть?
00
Вопрос или проблема Я использую Classifier Chain с логистической регрессией, и когда пытаюсь использовать метод fit, получаю Этот решатель требует наличие образцов как минимум 2 классов в данных, но данные содержат только один класс: 1 Но я довольно уверен
Data Science
Обнаружение объектов или классификация изображений? Каждое изображение содержит 3 фигуры. Я хочу вернуть 1, если они все являются треугольниками, и 0 в противном случае.
00
Вопрос или проблема Вопрос в заголовке. У каждого изображения есть три формы, которые могут быть либо треугольниками, либо квадратами. Я хочу вернуть 1, если все формы – треугольники, и 0 в противном случае. Как вы думаете, что будет лучше для этой
Data Science
Высокая точность на тестовых и валидационных данных, но все еще не удается предсказать на реальных данных
00
Вопрос или проблема Здравствуйте, у меня классификация между двумя классами A и B, и я обучил модель CNN. У меня высокая точность на всех трех наборах данных: обучающем (98.7%), валидационном (99.3%) и тестовом (98%), но я все равно не могу предсказать на реальных данных.