Data Science
Data Science
Вопрос или проблема Я прочитал несколько руководств, таких как эта ссылка. У меня большие трудности с пониманием того, как эффективно использовать временные ряды. Буду благодарен за любую помощь в понимании, желательно с примерами из практики.
Data Science
Вопрос или проблема Я строил модель линейной регрессии с около 150 строками данных. Я проверил корреляцию параметров с целевой переменной и попытался оставить только их, так как у меня меньше данных, и я хотел получить простую линейную модель.
Data Science
Вопрос или проблема У меня есть некоторые пространственные данные для почти 1000 мест, и в каждом месте около 5000 признаков. Я провожу анализ соседства, чтобы определить, какие признаки преобладают в местном окружении. Я читал, что с помощью рекурсивного
Data Science
Вопрос или проблема Закрыто. Этот вопрос требует подробностей или пояснений. В данный момент он не принимает ответы. Хотите улучшить этот вопрос? Добавьте подробности и уточните проблему, отредактировав этот пост. Закрыто 4 часа назад.
Data Science
Вопрос или проблема У меня есть многоклассовая классификация с 5 классами (табличные данные), я использовал модель xgboost, модель хорошо работает для 3 классов, но плохо для оставшихся классов (2 класса). Я пробовал увеличение выборки и веса классов
Data Science
Вопрос или проблема При попытке установить пакеты, а именно tidyverse и ggplot, я получаю множество ошибок. Ошибки всегда имеют следующую форму: > library(tidyverse) Ошибка в loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]])
Data Science
Вопрос или проблема Я работаю над набором данных для обнаружения мошенничества, который, по естественным причинам, сильно несбалансирован. Мой классификатор – это XGBoost с весами классов. Другими словами, я просто увеличиваю вес положительного
Data Science
Вопрос или проблема Я работаю с набором данных, который был закодирован и категоризирован, так что каждая точка данных имеет набор закодированных характеристик. Примером точки данных может быть что-то вроде следующего: Пример точки данных: Качество Обслуживание
Data Science
Вопрос или проблема У меня есть медицинские изображения, и мне нужно извлечь признаки из слоя, предшествующего слою классификации, используя VGG, например, но разрешение изображений неэффективно… Будут ли признаки без улучшения этого разрешения
Data Science
Вопрос или проблема Я обучаю SVM на Наборе данных о банковском маркетинге от UCI, файле bank additional-full.csv. Поскольку данные смещены, я также интересуюсь полнотой. Я получаю точность около 87.95%, но моя полнота составляет примерно 51%.
Data Science
Вопрос или проблема Мне действительно нужно объяснение, я работаю над инструментом обнаружения кибербуллинга на основе обработки естественного языка (NLP), который я разверну в Интернете с использованием фреймворка Django, однако застрял на какой-то идее
Data Science
Вопрос или проблема Пусть $X$ представляет собой набор данных, состоящий из $N$ экземпляров, где каждый экземпляр описывается набором признаков $\text{feat}_0, \ldots, \text{feat}_m$, а $Y$ обозначает соответствующие целевые значения.
Data Science
Вопрос или проблема Я работаю с сырыми текстовыми данными. Я использую кластеризацию, чтобы объединить общие слова в документах. Моя задача заключается в том, чтобы создать кластеры на основе конкретного списка слов, т.е. я хочу получить группу слов
Data Science
Вопрос или проблема Я новичок в обучении без учителя. Я работаю с данными сегментации клиентов (без меток). Я сделал K-Means и также вычислил силуэтный коэффициент для модели. Теперь я хочу изучить, хороша ли модель или нет (сходство или стабильность
Data Science
Вопрос или проблема Как вы передаете данные из хранилища данных в Python для ад-хок анализа? Моя повседневная работа заключается в ответах на ад-хок вопросы, и 95% необходимых мне данных находится в нашем хранилище данных. Я часто запрашиваю данные из
Data Science
Вопрос или проблема Я программирую на Python. У меня есть два набора образцов. Набор1 содержит образцы класса A, а другой набор, Набор2, содержит образцы класса B. Эти образцы являются частью обучающего набора данных. Когда я предсказываю наборы 1 и 2
Data Science
Вопрос или проблема Моя цель заключается в том, чтобы оценить различия в том, как пять политических партий используют моральные слова в своих твитах и речах. С этой целью я использую словарь, который применяю к каждому тексту твита / аудиотранскрипции
Data Science
Вопрос или проблема Здравствуйте, StackExchanger’s, я программный инженер, интересующийся изучением Retrieval-Augmented Generation (RAG) для моего исследования. Однако я новичок в этой области и не имею практического опыта в NLP, NLU или Deep Learning.
Data Science
Вопрос или проблема У меня есть устройства, подключенные к разным тарифным планам. Но исходя из поведения устройства, объем данных, используемых устройством, изменяется в течение месяца. Мне нужно поместить устройство в подходящий тарифный план на основе
Data Science
Вопрос или проблема В настоящее время я использую tensorflow для создания нейронной сети, которая выполняет базовую бинарную классификацию, и я хотел бы проанализировать смещение модели после обучения. У меня есть набор данных из примерно 300 000 образцов