Data Science

Кто-нибудь может порекомендуать хорошие книги или статьи по работе с временными рядами?

00

Вопрос или проблема Я прочитал несколько руководств, таких как эта ссылка. У меня большие трудности с пониманием того, как эффективно использовать временные ряды. Буду благодарен за любую помощь в понимании, желательно с примерами из практики.

Data Science

Регрессия – Модель в целом выглядит хорошо, но R2 неожиданно отрицательно высок.

00

Вопрос или проблема Я строил модель линейной регрессии с около 150 строками данных. Я проверил корреляцию параметров с целевой переменной и попытался оставить только их, так как у меня меньше данных, и я хотел получить простую линейную модель.

Data Science

Как обрезать признаки с помощью рекурсивного исключения признаков?

00

Вопрос или проблема У меня есть некоторые пространственные данные для почти 1000 мест, и в каждом месте около 5000 признаков. Я провожу анализ соседства, чтобы определить, какие признаки преобладают в местном окружении. Я читал, что с помощью рекурсивного

Data Science

Проблема с иммутацией внутри пайплайна в Sklearn [закрыто]

00

Вопрос или проблема Закрыто. Этот вопрос требует подробностей или пояснений. В данный момент он не принимает ответы. Хотите улучшить этот вопрос? Добавьте подробности и уточните проблему, отредактировав этот пост. Закрыто 4 часа назад.

Data Science

Плохое качество работы для двух классов в многоклассовой классификации.

00

Вопрос или проблема У меня есть многоклассовая классификация с 5 классами (табличные данные), я использовал модель xgboost, модель хорошо работает для 3 классов, но плохо для оставшихся классов (2 класса). Я пробовал увеличение выборки и веса классов

Data Science

Ошибка загрузки tidyverse в R Studio – отсутствует пакет broom

01

Вопрос или проблема При попытке установить пакеты, а именно tidyverse и ggplot, я получаю множество ошибок. Ошибки всегда имеют следующую форму: > library(tidyverse) Ошибка в loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]])

Data Science

Есть ли больше в несбалансированной классификации с XGBoost, чем просто перераспределение функции потерь?

00

Вопрос или проблема Я работаю над набором данных для обнаружения мошенничества, который, по естественным причинам, сильно несбалансирован. Мой классификатор – это XGBoost с весами классов. Другими словами, я просто увеличиваю вес положительного

Data Science

Какие алгоритмы я должен использовать для определения схожих характеристик между данными (пересечения)?

00

Вопрос или проблема Я работаю с набором данных, который был закодирован и категоризирован, так что каждая точка данных имеет набор закодированных характеристик. Примером точки данных может быть что-то вроде следующего: Пример точки данных: Качество Обслуживание

Data Science

извлекать признаки из низкого разрешения

00

Вопрос или проблема У меня есть медицинские изображения, и мне нужно извлечь признаки из слоя, предшествующего слою классификации, используя VGG, например, но разрешение изображений неэффективно… Будут ли признаки без улучшения этого разрешения

Data Science

Способы увеличения полноты в SVM

00

Вопрос или проблема Я обучаю SVM на Наборе данных о банковском маркетинге от UCI, файле bank additional-full.csv. Поскольку данные смещены, я также интересуюсь полнотой. Я получаю точность около 87.95%, но моя полнота составляет примерно 51%.

Data Science

Какова основная концепция использования лексического, лингвистического, семантического или синтаксического подхода в обработке естественного языка для борьбы с кибербуллингом?

00

Вопрос или проблема Мне действительно нужно объяснение, я работаю над инструментом обнаружения кибербуллинга на основе обработки естественного языка (NLP), который я разверну в Интернете с использованием фреймворка Django, однако застрял на какой-то идее

Data Science

Преобразование признаков для адаптации по домену: Модификация аномальных данных для соответствия нормальным распределениям признаков.

00

Вопрос или проблема Пусть $X$ представляет собой набор данных, состоящий из $N$ экземпляров, где каждый экземпляр описывается набором признаков $\text{feat}_0, \ldots, \text{feat}_m$, а $Y$ обозначает соответствующие целевые значения.

Data Science

Создайте кластеры на основе конкретных ключевых слов.

00

Вопрос или проблема Я работаю с сырыми текстовыми данными. Я использую кластеризацию, чтобы объединить общие слова в документах. Моя задача заключается в том, чтобы создать кластеры на основе конкретного списка слов, т.е. я хочу получить группу слов

Data Science

Стабильность кластеров в неконтролируемом обучении машин.

00

Вопрос или проблема Я новичок в обучении без учителя. Я работаю с данными сегментации клиентов (без меток). Я сделал K-Means и также вычислил силуэтный коэффициент для модели. Теперь я хочу изучить, хороша ли модель или нет (сходство или стабильность

Data Science

Процесс анализа данных

00

Вопрос или проблема Как вы передаете данные из хранилища данных в Python для ад-хок анализа? Моя повседневная работа заключается в ответах на ад-хок вопросы, и 95% необходимых мне данных находится в нашем хранилище данных. Я часто запрашиваю данные из

Data Science

Почему я получаю неправильное предсказание, когда комбинирую два списка образцов, каждый из которых по отдельности дает правильное предсказание?

00

Вопрос или проблема Я программирую на Python. У меня есть два набора образцов. Набор1 содержит образцы класса A, а другой набор, Набор2, содержит образцы класса B. Эти образцы являются частью обучающего набора данных. Когда я предсказываю наборы 1 и 2

Data Science

Используя относительные или абсолютные частоты для оценки различий между группами в текстах

00

Вопрос или проблема Моя цель заключается в том, чтобы оценить различия в том, как пять политических партий используют моральные слова в своих твитах и речах. С этой целью я использую словарь, который применяю к каждому тексту твита / аудиотранскрипции

Data Science

Как начать работать с генерацией с использованием извлечения (RAG) для исследований

00

Вопрос или проблема Здравствуйте, StackExchanger’s, я программный инженер, интересующийся изучением Retrieval-Augmented Generation (RAG) для моего исследования. Однако я новичок в этой области и не имею практического опыта в NLP, NLU или Deep Learning.

Data Science

Группировка числовых данных в эффективные группы/пулы

00

Вопрос или проблема У меня есть устройства, подключенные к разным тарифным планам. Но исходя из поведения устройства, объем данных, используемых устройством, изменяется в течение месяца. Мне нужно поместить устройство в подходящий тарифный план на основе

Data Science

Как исследовать влияние переменной, не используемой в обучении нейронной сети

00

Вопрос или проблема В настоящее время я использую tensorflow для создания нейронной сети, которая выполняет базовую бинарную классификацию, и я хотел бы проанализировать смещение модели после обучения. У меня есть набор данных из примерно 300 000 образцов