Data Science
Data Science
Вопрос или проблема Я использовал снижение размерности методом PCA на наборах данных, которые довольно линейны, и теперь мне поручили сделать то же самое на наборах данных, которые в значительной степени изогнуты в пространстве.
Data Science
Вопрос или проблема У меня есть временные ряды данных, содержащие действия пользователей в определенные интервалы времени, например, Дата UserId Директория операция Результат 01/01/2017 99:00 user1 dir1 created_file success 01/01/2017 99:00 user3 dir10
Data Science
Вопрос или проблема В сверточных нейронных сетях мы делаем свертки трех каналов (красный, зеленый, синий) с фильтром размером $k\times k\times 3$, как на картинке: Каждый фильтр состоит из настраиваемых весов и может научиться обнаруживать примитивные
Data Science
Вопрос или проблема У меня есть данные о продажах по клиентам (b2b) и по датам. Я хочу проверить, сохраняется ли распределение продаж по дням внутри недель от недели к неделе. Начальный набор данных Клиент Дата Продажи Alpha 2019-02-23 527 Beta 2019-02-23
Data Science
Вопрос или проблема Предположим, мы ранее использовали нейронную сеть или другой классификатор C с $N$ обучающими образцами $I:=\{I_1,…I_N\}$ (которые имеют последовательность или контекст, но игнорируются C), принадлежащими $K$ классам.
Data Science
Вопрос или проблема Я использую PyTorch для создания модели, которая обнаруживает определенные объекты на изображении. Я представил свою задачу как регрессию на ограничительные рамки, без какой-либо задачи классификации. Причина заключается в том, что
Data Science
Вопрос или проблема Для моего итогового проекта я работаю с Keras и пытаюсь создать разные модели ИИ. У меня возникают трудности с многослойным перцептроном (MLP). Сначала я обрабатываю набор данных UNSW-NB15, а затем использую его в нейронной сети.
Data Science
Вопрос или проблема Я работаю над существенно несбалансированным набором данных для обнаружения мошенничества (класс 0: 284315 экземпляров, класс 1: 492 экземпляра) и пытаюсь правильно реализовать случайную недовыборку во время перекрестной проверки в Orange.
Data Science
Вопрос или проблема Я ищу основные и фундаментальные академические статьи по атакам или защите от атак. Алгоритм атаки или защиты должен быть легким для понимания, а код должен быть доступен на Python. Где я могу найти такие статьи?
Data Science
Вопрос или проблема Как указано в заголовке, я пытаюсь кластеризовать огромный набор данных и делаю это с помощью sklearn.Birch, чтобы обучаться постепенно. Если бы это был небольшой набор данных, я мог бы просто использовать gridsearchcv.
Data Science
Вопрос или проблема Я использую sklearn Tfifdfvectorizer для извлечения признаков из текста для классификации текста. Я считаю, что нужная мне информация, как правило, находится в начале документа, поэтому я хотел бы каким-то образом зафиксировать смещение
Data Science
Вопрос или проблема Предположим, робот начинает с известной позиции, и у меня есть данные, получаемые от робота, когда он перемещается по сетке. Используя нюансы, зафиксированные в данных, например, намек на неравную скорость вращения колёс, указывающий
Data Science
Вопрос или проблема Я новичок в области Data Science. Я создал модель с использованием градиентного бустинга для прогнозирования цены на дом. Чтобы оценить свою модель, я разделил мой набор данных на тренировочный и тестовый (0.
Data Science
Вопрос или проблема Мы работаем с онлайн-рынком. Наша задача – предсказать, будут ли определенные продукты прибыльными для нашего рынка в ближайшем будущем (горизонт – один месяц). Например, рассмотрим 2 продукта: Игрушка Жираф (предсказана неприбыльной)
Data Science
Вопрос или проблема Предположим, у вас есть список из 10 чисел с плавающей точкой, и вы выбираете 5 чисел из этого списка и складываете их, чтобы сформировать новое число, генерируя все возможные комбинации, теперь у вас есть новый список размером C(10, 5).
Data Science
Вопрос или проблема Я хочу узнать, в чем разница между этими двумя. Для меня они выполняют одну и ту же функцию, поэтому я не вижу причины для существования двух одинаковых функций. В TensorFlow 2 они принимают различные аргументы: tf.
Data Science
Вопрос или проблема Я пытался воспроизвести блокнот клиента Python Elasticsearch Eland, доступный в документации Eland. Вот первые строки кода для создания eland dataframe из моего локального индекса Elasticsearch под названием sensor_index: import eland
Data Science
Вопрос или проблема def CTDataSQ (name): name= cleanDF[[“PatientstudyId2″,”RATER”,”CT_3D”,name]] name= name.loc[name[‘CT_3D’] == 1] del name[“CT_3D”] name.to_excel(name, “
Data Science
Вопрос или проблема У меня есть pred_targets = self.model(images) pred_boxes = pred_container.data pred_scores = pred_container.conf pred_labels = pred_container.cls gt = (boxes.to(self.device), classes.to(self.device)) pred = (pred_boxes[:, :4], pred_scores
Data Science
Вопрос или проблема Я работаю над алгоритмом MedSAM (Segment Anything in Medical Images). Это тонко настроенная версия модели Segment Anything от Meta AI для медицинских изображений. В статье его функция потерь задается как невзвешенная сумма бинарной