Data Science
Метод k-ближайших соседей, временная тенденция в ошибке
00
Вопрос или проблема У меня есть набор данных, который выглядит вот так: Меня попросили построить алгоритм $k$-ближайших соседей для этого, который я только что закончил строить. У меня есть вопрос по поводу данных, который я не понимаю: замечаете ли вы
Data Science
вопрос о разделении набора данных по атрибутам и меткам
00
Вопрос или проблема Почему набор данных должен использовать X как атрибуты и y как метку? Почему не использовать один X для всего? Вы действительно могли бы использовать один X для всего. Однако ваши модели на следующем этапе ожидают, что признаки и метки
Data Science
Сегментируйте аудио длительностью 5-7 минут на аудиоклипы по предложениям для создания набора данных для распознавания речи.
00
Вопрос или проблема Я пытаюсь создать набор данных для распознавания речи, особенно для индийских акцентов. Я собираю данные от коллег для этого. Каждый день я отправляю ссылку на статью и прошу их записать и загрузить запись на Google Drive.
Data Science
LFR как синтезированные данные для методов обнаружения динамических сообществ
00
Вопрос или проблема В современных методах для обнаружения сообществ в динамических сетях используется эталон LFR в качестве генератора динамических наборов данных, но я думал, что он предназначен для генерации статических данных о сообществах.
Data Science
Неожиданный идентификатор функции в наборе данных Yahoo! Webscope ydata-frontpage-todaymodule-clicks-v1_0
00
Вопрос или проблема Я работаю с набором данных Yahoo! Webscope ydata-frontpage-todaymodule-clicks-v1_0 (в частности, с журналами кликов за первые десять дней мая 2009 года). Описание набора данных гласит, что каждый пользователь и статья имеют 6 признаков
Data Science
Лучше понимать диаграммы рассеяния
00
Вопрос или проблема Я пытаюсь понять, как читать диаграмму рассеяния на основе результатов моей матрицы ошибок. Это матрица ошибок: Я заметил высокую корреляцию между столбцом 5 и столбцом 6, низкую корреляцию со столбцом 11 и среднюю корреляцию со столбцом
Data Science
Руководство по изучению анализа данных
00
Вопрос или проблема Я новичок в анализе данных, и мне нужно выполнить проект по анализу данных, используя методы кластеризации, для курса на R. Я понятия не имею, с чего начать и как выбрать набор данных. Я ищу какие-то ресурсы.
Data Science
Keras MLP не работает
00
Вопрос или проблема Для моего итогового проекта я работаю с Keras и пытаюсь создать разные модели ИИ. У меня возникают трудности с многослойным перцептроном (MLP). Сначала я обрабатываю набор данных UNSW-NB15, а затем использую его в нейронной сети.
Data Science
Как изменить размер изображений MNIST, чтобы они соответствовали модели AlexNet
00
Вопрос или проблема Я использую API keras для загрузки датасета MNIST. Моя проблема в том, что мне нужно использовать AlexNet в качестве алгоритма. Понимая модель AlexNet, мне необходимо начинать с изображений размером 227×
Data Science
Верните градиент и y-перехват (m, b), чтобы создать две линии, наилучшим образом подходящие к данным.
00
Вопрос или проблема Я работаю над этой задачей уже несколько часов и не добился успеха в получении нужного результата. Я пробовал использовать несколько методов разбиения набора данных с помощью различных методов кластеризации и логистической регрессии, но безрезультатно.
Data Science
Ошибка конвейера преобразования данных
00
Вопрос или проблема Когда я создаю конвейер преобразования данных для набора данных, я постоянно получаю ошибку: “все размеры входного массива, за исключением оси конкатенации, должны точно совпадать, но по измерению 0, массив в индексе 0 имеет размер 1”
Data Science
Использование Python/Pandas для сравнения столбцов неравной длины
00
Вопрос или проблема https://ibb.co/cyCzVgy Я хотел бы сравнить NEW_PRICE с LINE_TOTAL_ALLOWED на основе PROC_CODE. Идеально, если Pandas начнет с первой строки, сопоставит PROC_CODE и PROC_CODE_NEW, затем вычтет NEW_PRICE из LINE_TOTAL_ALLOWED и выведет
Data Science
Генерация искусственных данных для расширения обучающего набора
00
Вопрос или проблема У меня есть набор данных, содержащий 42 экземпляра (X) и одну финальную Y, на которой я хочу выполнить регрессию LASSO. Все они непрерывные и числовые. Поскольку размер выборки небольшой, я хочу его увеличить.
Data Science
Как изменить размер изображения вместе с его маской?
00
Вопрос или проблема У меня есть оригинальные изображения размером 1935×1481. Я использую labelme для аннотирования изображений. Я создаю полигоны на оригинальном изображении. Существует ли способ изменить размер изображения вместе с их маской?
Data Science
Обучение с подкреплением на данных в реальном времени через веб-сервер.
00
Вопрос или проблема Вопрос: возможно ли реализовать модель обучения с подкреплением на NodeJS сервере? Этот сервер будет получать бинарные формы данных (открыть/закрыть; да/нет) в режиме реального времени. Цель модели – учиться на входящих данных
Data Science
Сравнить эффективность классификации подмножеств набора данных.
00
Вопрос или проблема Предположим, у меня есть такой набор данных, на котором я хочу провести классификацию: id feature class factor 1 … 1 A 2 … 1 B 3 … 2 A 4 … 2 B $\vdots$ Как я могу сравнить производительность модели, учитывая значения фактора?
Data Science
Инициализировать систему рекомендаций без набора данных.
00
Вопрос или проблема Рассмотрим платформу для рекомендаций контента на основе истории пользователя. Контентом являются книги и статьи, а под историей я имею в виду, что пользователь читал, что он поделился и так далее. Я знаю, что существует много исследований
Data Science
Набор данных векторов SVG путей для цифр
00
Вопрос или проблема Я много раз использовал набор данных MNIST для обучения моделей распознавания цифр на основе оптического распознавания символов (OCR). Теперь я пытаюсь сделать то же самое, но с набором данных svg-путей. Я пытаюсь найти эквивалент
Data Science
Теннис полные данные
00
Вопрос или проблема Я должен работать над своей дипломной работой о теннисе для выпускного, но у меня возникают трудности с поиском данных о теннисе. Друг порекомендовал воспользоваться теннисным API. Я нашел API под названием “
Data Science
Как подготовить данные, в которых каждая выходная строка зависит от нескольких входных строк?
00
Вопрос или проблема Моя цель — предсказать значение Y на основе нескольких значений X1 и X2 для каждого наблюдения Y. В моем примере я хочу предсказать, объявит ли клиент о банкротстве (таблица 1) на основе лимитов и балансов его кредитных карт (таблица 2).