Data Science
Существует ли какой-либо набор данных, содержащий список программного обеспечения для Windows и категорию, к которой относится каждое из них?
00
Вопрос или проблема Мне нужен был набор данных, который перечисляет множество программ для Windows в соответствии с их категориями для проекта. Например: anaconda: разработка программного обеспечения, roblox: игры, VLC: видеоплеер и т.
Data Science
Где я могу найти бесплатные многократные однопометочные наборы данных для обнаружения объектов?
00
Вопрос или проблема Я пытаюсь найти бесплатные датасеты с несколькими экземплярами и одной меткой для распознавания объектов в Интернете. Под “несколько экземпляров и одной меткой” я имею в виду, что каждое изображение содержит только объекты
Data Science
Предсказание данных счетов за 12 месяцев, используя только данные за 1 месяц.
00
Вопрос или проблема У меня есть только 1 месяц исторических данных по счетам, могу ли я предсказать следующие 12 месяцев данных с хорошей точностью, если да, то какую модель мне следует использовать для предсказания? Спасибо. Поскольку анализ счетов относится
Data Science
Что делать, если конкретная метка категории появляется только несколько раз?
00
Вопрос или проблема Допустим, я пытаюсь предсказать, будет ли автомобиль продан на аукционе или нет (это не то, чем я на самом деле занимаюсь, но это хорошо это иллюстрирует), используя табличные данные. У меня есть год выпуска автомобиля, его цвет, модель и т.
Data Science
Какой формат разметки имеет отрицательные значения Bbox в метках?
00
Вопрос или проблема У меня есть помеченный набор данных для обнаружения объектов несколько тысяч изображений с аннотацией в csv файле csv содержит следующие столбцы image_path, class, xmax, xmin, ymax, ymin похоже на Pascal voc формат меток, но когда
Data Science
Как обрабатывать идентификационные переменные при разделении данных для машинного обучения?
00
Вопрос или проблема Я новичок в машинном обучении и работаю с данными международных спортивных соревнований. Я использовал техники создания реляционных данных в tidyverse, чтобы объединить несколько источников данных и создать набор данных на основе событий
Data Science
Мне нужны источники вопросительных, восклицательных и повелительных предложений.
00
Вопрос или проблема Я работаю над накоплением большой базы данных размеченных предложений для нескольких проектов/экспериментов. В настоящее время я использую только Википедию и проект Гутенберг в качестве источников данных. Между этими двумя источниками
Data Science

Pytorch DataSet.__getitem__() вызван с index, большим чем __len__()

00
Вопрос или проблема У меня есть следующий набор данных torch (я заменил фактический код чтения данных из файлов на генерацию случайных чисел, чтобы сделать его минимально воспроизводимым): from torch.utils.data import Dataset import torch class TempDataset(Dataset)
Data Science
Ошибка ValueError при подгонке модели Tensorflow: Слой sequential ожидает 1 вход, но он получил 520 входных тензоров.
00
Вопрос или проблема Я пытаюсь обучить модель, используя Tensorflow. Я читаю огромный csv файл с помощью tf.data.experimental.make_csv_dataset Вот мой код: Импорт: import tensorflow as tf from tensorflow import keras from tensorflow.
Data Science
Как разработать JSON-схему для отображения данных опроса из файла CSV с сложными типами вопросов?
00
Вопрос или проблема Я работаю с большим набором данных, содержащим ответы на опросы, хранящиеся в CSV-файле с более чем 100 столбцами. Я хочу сопоставить эти данные с JSON-схемой для лучшей структуры и последующей обработки. Однако я не уверен в лучших
Data Science
Необходим обзор: Методология очистки данных для временных рядов CGM – первый реальный набор данных
00
Вопрос или проблема Я работаю над обработкой данных непрерывного мониторинга глюкозы (CGM) из XDrip+ и буду признателен за отзывы о моей методологии очистки данных. Это мой первый опыт работы с “грязными” медицинскими данными из реального
Data Science
Инкрементный алгоритм кластеризации
00
Вопрос или проблема Я ищу инкрементный алгоритм кластеризации. Под инкрементным я понимаю алгоритм, который строит кластеры, начиная с начального набора данных и который способен постепенно добавлять новые элементы/наблюдения, добавляя их к существующим или новым кластерам.
Data Science
Какой тип модели использовать и какая моя целевая переменная
00
Вопрос или проблема Я новичок в области Data Science, так что извините, если мой вопрос слишком базовый. Задача заключается в создании модели рекламных ставок для онлайн-маркетинга, которая позволяет доставлять целевую рекламу нужным людям.
Data Science
Может ли таблица фактов иметь отношение 1:1 с таблицей измерений?
00
Вопрос или проблема Я пытаюсь создать небольшую таблицу фактов в области здравоохранения с следующей информацией [patientid], [organid], [value] Каждый [patientid] уникален для этого пациента, но в системе доступно только 10 [organid] (сердце, левое легкое
Data Science
Как правильно проверить, что некоторые агрегированные результаты корректны?
00
Вопрос или проблема Мой проект данных основан на агрегации данных и демонстрации агрегированных расчетов для анализа. Агрегированные расчеты можно разделить и проанализировать по нескольким параметрам. Пока разработчики показывают мне, что конечная сумма
Data Science
Конвертация аннотаций VOC2012 .xml в сегментацию .png
00
Вопрос или проблема Кто-нибудь знает хороший способ конвертировать файлы annotations из xml в файлы SegmentationClass (аннотации классов) в png? Это скрипт на bash от Deeplab для предварительной обработки набора данных, который может помочь –
Data Science
Я должен использовать смешанные эффекты?
00
Вопрос или проблема Я провел регрессию с случайными эффектами GLS на данных НБА в Stata, и мне сказали, что это было неправильно, потому что я не использовал модель смешанных эффектов. Возможно, это действительно так, но объяснение меня сильно смутило.
Data Science
Модель с 2 наборами данных: объедините временные ряды и статистику.
00
Вопрос или проблема Я новичок в моделировании данных, поэтому заранее извиняюсь, если использую неправильную терминологию. У меня есть стандартный набор временных рядов исторических цен, который используется для обучения/тестирования простой модели классификатора
Data Science
Взвешенные функции потерь против взвешенной выборки?
00
Вопрос или проблема Есть ли практическое различие между использованием взвешенных функций потерь и взвешенной выборки в задачах классификации изображений? (Я был бы признателен за теоретические аргументы, опыт или опубликованные статьи, в общем, любой материал.
Data Science
Параметры изображения для SRGAN
00
Вопрос или проблема В некоторых реализациях SRGAN я заметил, что наборы данных состоят из изображений высокого разрешения, а изображения низкого разрешения создаются позже, например, путем изменения размера (уменьшения размера) hr-изображений.