Data Science
Data Science
Вопрос или проблема Я пытаюсь обучить простую нейронную сеть для многоклассовой классификации. У меня есть столбцы x1, x2, x3, x4 с 4 классами для предсказания. Если тренировать только на x1, x2, x3, x4, то я получаю точность 88% С некоторыми знаниями
Data Science
Вопрос или проблема У меня есть набор данных о разных людях с их страховыми расходами. Я обучил нейронную сеть для предсказания страховых расходов (столбец charges) на основе других признаков (возраст, индекс массы тела и т. д.
Data Science
Вопрос или проблема Я ищу алгоритмы извлечения признаков в литературе (либо в обычной компьютерной зрении, либо в нейронных сетях) или готовые движки индексации, подходящие для поиска оригинальных изображений в базе данных при условии, что воспроизведение
Data Science
Вопрос или проблема Я начинаю проект, в котором хочу извлекать ключевые слова из заданных сообщений. Ключевые слова, например, такие как: “жесткий диск”, “часы” или другие технические компоненты. Я работаю с набором данных, в котором
Data Science
Вопрос или проблема У меня есть многомерные временные ряды. Каждый образец имеет признаки от f0 до f100, с 24 временными шагами. Что-то вроде этого: По оси x находятся 24 временных шага, а по оси y – 100 признаков. Задача состоит в том, что у каждого
Data Science
Вопрос или проблема Я видел множество уроков и статей о том или ином модели, которые демонстрируют отличные показатели точности. В данном случае, скажем, 85%. Но я никогда не вижу, что делать с оставшимися 15%? Я предполагаю, что большинство из тех людей
Data Science
Вопрос или проблема Я использую AgglomerativeClustering из scikit-learn на большом наборе данных. Я хотел бы изменить distance_threshold после того, как модель уже была вычислена. Вычисление модели выполняется медленно (квадратичное время), но переобчисление
Data Science
Вопрос или проблема У меня есть финансовый временной ряд, и я хочу вычислить корреляцию между прошлыми и будущими доходностями. Сначала я выбираю интервалы, скажем, l и h. Затем я вычисляю прошлые доходности, что равно текущему значению, деленному на
Data Science
Вопрос или проблема У меня есть некоторое представление о том, как будет работать обратное распространение для функции потерь, такой как: loss=summation(predicted-true)^2 Где predicted и true — векторы одинаковой длины и одна и та же операция применяется ко всем элементам.
Data Science
Вопрос или проблема У меня формальное образование в области социальных наук, но я новый в области анализа данных. Меня интересует создание предсказательных моделей для применения в социальных науках, в основном (но не только) в экономике.
Data Science
Вопрос или проблема Я реализую модель последовательность-в-последовательность с архитектурой RNN-VAE и использую механизм внимания. У меня проблема в части декодирования. Я сталкиваюсь с этой ошибкой: IndexError: list index out of range Когда я запускаю
Data Science
Вопрос или проблема Я написал стохастический алгоритм машинного обучения. Каждый раз, когда я запускаю алгоритм на одних и тех же тестовых данных, я получаю разные результаты. Я определяю точность каждый раз в сравнении с истинным значением.
Data Science
Вопрос или проблема Я обучил систему рекомендаций, чтобы рекомендовать игры Steam на основе тегов игр. Пример вывода показан ниже, где GAME — это игра, рекомендованная на основе similarity (показателя схожести). Игра для рекомендации: Total War: WARHAMMER
Data Science
Вопрос или проблема Я новичок в моделировании тем и пытаюсь использовать BERTopic в PyCharm. Мне трудно заставить любую визуализацию работать в PyCharm с BERTopic. Вот мой текущий код: import pickle from umap import UMAP from hdbscan import HDBSCAN from
Data Science
Вопрос или проблема У меня есть входные данные, величины которых значительно варьируются между признаками. Я масштабировал их с помощью StandardScaler() из sklearn, а затем использовал keras для обучения нейронной сети на этих данных для предсказания моей целевой переменной.
Data Science
Вопрос или проблема У меня есть набор данных с тремя независимыми переменными [город, отрасль, сумма], и я хотел бы нормализовать сумму. Но я хочу сделать это с учетом отрасли и города. Простая группировка по городу и отрасли дает мне множество очень
Data Science
Вопрос или проблема Я создал 4 x 4 двумерные изображения из сигнала. Теперь я хочу подать эти данные в сверточную нейронную сеть. Как мне выбрать количество фильтров, размер ядра для такого небольшого, по форме и размеру набора данных (4 x 4, 320 изображений)?
Data Science
Вопрос или проблема Я использую RandomizedSearchCV для оптимизации гиперпараметров. Когда я запускаю модель, она показывает оценки для каждой тренировки модели. Проблема в том, что она обучает гораздо больше 10 моделей, в то время как я ожидаю, что будет
Data Science
Вопрос или проблема Мое понимание l2 регуляризации: Весы модели считаются имеющими априорное гауссово распределение, центрированное вокруг 0. Затем оценка MAP по данным добавляет дополнительное наказание в функцию стоимости. Мое сформулированное заявление
Data Science
Вопрос или проблема У меня есть определенная путаница относительно применения топологического анализа данных (TDA) и глубокого обучения к табличному набору данных. Согласно общепринятому стандарту, строки представляют собой точки, а столбцы — признаки.