dataset
Data Science
Вопрос или проблема У меня есть набор данных, который выглядит вот так: Меня попросили построить алгоритм $k$-ближайших соседей для этого, который я только что закончил строить. У меня есть вопрос по поводу данных, который я не понимаю: замечаете ли вы
Data Science
Вопрос или проблема Почему набор данных должен использовать X как атрибуты и y как метку? Почему не использовать один X для всего? Вы действительно могли бы использовать один X для всего. Однако ваши модели на следующем этапе ожидают, что признаки и метки
Data Science
Вопрос или проблема Я пытаюсь создать набор данных для распознавания речи, особенно для индийских акцентов. Я собираю данные от коллег для этого. Каждый день я отправляю ссылку на статью и прошу их записать и загрузить запись на Google Drive.
Data Science
Вопрос или проблема В современных методах для обнаружения сообществ в динамических сетях используется эталон LFR в качестве генератора динамических наборов данных, но я думал, что он предназначен для генерации статических данных о сообществах.
Data Science
Вопрос или проблема Я работаю с набором данных Yahoo! Webscope ydata-frontpage-todaymodule-clicks-v1_0 (в частности, с журналами кликов за первые десять дней мая 2009 года). Описание набора данных гласит, что каждый пользователь и статья имеют 6 признаков
Data Science
Вопрос или проблема Я пытаюсь понять, как читать диаграмму рассеяния на основе результатов моей матрицы ошибок. Это матрица ошибок: Я заметил высокую корреляцию между столбцом 5 и столбцом 6, низкую корреляцию со столбцом 11 и среднюю корреляцию со столбцом
Data Science
Вопрос или проблема Я новичок в анализе данных, и мне нужно выполнить проект по анализу данных, используя методы кластеризации, для курса на R. Я понятия не имею, с чего начать и как выбрать набор данных. Я ищу какие-то ресурсы.
Data Science
Вопрос или проблема Для моего итогового проекта я работаю с Keras и пытаюсь создать разные модели ИИ. У меня возникают трудности с многослойным перцептроном (MLP). Сначала я обрабатываю набор данных UNSW-NB15, а затем использую его в нейронной сети.
Data Science
Вопрос или проблема Я использую API keras для загрузки датасета MNIST. Моя проблема в том, что мне нужно использовать AlexNet в качестве алгоритма. Понимая модель AlexNet, мне необходимо начинать с изображений размером 227×
Data Science
Вопрос или проблема Я работаю над этой задачей уже несколько часов и не добился успеха в получении нужного результата. Я пробовал использовать несколько методов разбиения набора данных с помощью различных методов кластеризации и логистической регрессии, но безрезультатно.
Data Science
Вопрос или проблема Когда я создаю конвейер преобразования данных для набора данных, я постоянно получаю ошибку: “все размеры входного массива, за исключением оси конкатенации, должны точно совпадать, но по измерению 0, массив в индексе 0 имеет размер 1”
Data Science
Вопрос или проблема https://ibb.co/cyCzVgy Я хотел бы сравнить NEW_PRICE с LINE_TOTAL_ALLOWED на основе PROC_CODE. Идеально, если Pandas начнет с первой строки, сопоставит PROC_CODE и PROC_CODE_NEW, затем вычтет NEW_PRICE из LINE_TOTAL_ALLOWED и выведет
Data Science
Вопрос или проблема У меня есть набор данных, содержащий 42 экземпляра (X) и одну финальную Y, на которой я хочу выполнить регрессию LASSO. Все они непрерывные и числовые. Поскольку размер выборки небольшой, я хочу его увеличить.
Data Science
Вопрос или проблема У меня есть оригинальные изображения размером 1935×1481. Я использую labelme для аннотирования изображений. Я создаю полигоны на оригинальном изображении. Существует ли способ изменить размер изображения вместе с их маской?
Data Science
Вопрос или проблема Вопрос: возможно ли реализовать модель обучения с подкреплением на NodeJS сервере? Этот сервер будет получать бинарные формы данных (открыть/закрыть; да/нет) в режиме реального времени. Цель модели – учиться на входящих данных
Data Science
Вопрос или проблема Предположим, у меня есть такой набор данных, на котором я хочу провести классификацию: id feature class factor 1 … 1 A 2 … 1 B 3 … 2 A 4 … 2 B $\vdots$ Как я могу сравнить производительность модели, учитывая значения фактора?
Data Science
Вопрос или проблема Рассмотрим платформу для рекомендаций контента на основе истории пользователя. Контентом являются книги и статьи, а под историей я имею в виду, что пользователь читал, что он поделился и так далее. Я знаю, что существует много исследований
Data Science
Вопрос или проблема Я много раз использовал набор данных MNIST для обучения моделей распознавания цифр на основе оптического распознавания символов (OCR). Теперь я пытаюсь сделать то же самое, но с набором данных svg-путей. Я пытаюсь найти эквивалент
Data Science
Вопрос или проблема Я должен работать над своей дипломной работой о теннисе для выпускного, но у меня возникают трудности с поиском данных о теннисе. Друг порекомендовал воспользоваться теннисным API. Я нашел API под названием “
Data Science
Вопрос или проблема Моя цель — предсказать значение Y на основе нескольких значений X1 и X2 для каждого наблюдения Y. В моем примере я хочу предсказать, объявит ли клиент о банкротстве (таблица 1) на основе лимитов и балансов его кредитных карт (таблица 2).