Data Science
Сжатие категориальных данных в более чем 3 категории
00
Вопрос или проблема У меня есть множество категориальных данных, относящихся к частям речи, которые я хочу свести к меньшему числу категорий. np.where() не подойдет, потому что я хочу в итоге получить 6 категорий: существительное, глагол, прилагательное
Data Science
В чем разница между RNN и моделью CBOW?
00
Вопрос или проблема CBOW: Мы пытаемся предсказать следующее слово на основе контекста (определяемого как определенное окно слов вокруг целевого слова) RNN также может использоваться для предсказания следующего слова в последовательности, где каждый раз
Data Science
Список запущенных и ожидающих заданий в рабочем пространстве AzureML
00
Вопрос или проблема Документация по получению списка заданий с использованием AzureML REST API доступна здесь: https://learn.microsoft.com/en-us/rest/api/azureml/jobs/list?view=rest-azureml-2024-04-01&tabs=HTTP Однако этот запрос может вернуть сотни завершенных заданий.
Data Science
Как построить столбчатые диаграммы для точности, полноты и f-меры?
00
Вопрос или проблема Я использовал 4 модели машинного обучения для задачи, и теперь я испытываю трудности с построением их столбчатых диаграмм, как показано на изображении ниже. Я печатаю отчет о классификации, чтобы получить точность, полноту и т.
Data Science
Как создать сеть для многометочной классификации в Keras, если у меня есть обучающие данные с различной точностью?
00
Вопрос или проблема Я пытаюсь создать нейронную сеть, которая найдет наиболее эффективное лечение для каждого пациента. У меня есть медицинская база данных для обучения. Входными данными являются гистологические и патологические данные (в основном данные
Data Science
Как рассчитать стабильный/приростный рост?
00
Вопрос или проблема У меня есть данные по временным рядам для акций с интервалом в одну минуту. Как лучше всего рассчитать инкрементный рост, например, если у меня есть цена акции с 9 утра до 2 дня с интервалом в минуту, как я могу рассчитать инкрементный рост.
Data Science
Индексы строк должны быть целыми числами
00
Вопрос или проблема Я пытался закодировать строковые значения признака 'ProductCategory' в целые значения, но получил эту ошибку. Также мне хотелось бы спросить, приведет ли кодирование меток этого признака к тому, что моя модель будет неправильно интерпретировать целые значения как 0<
Data Science
Почему модель CNN не может хорошо выучить пик из данных
00
Вопрос или проблема Здесь у меня есть два различных набора данных. dataset1 — это данные с платформы силы, а dataset2 — данные о подошвенном давлении. dataset1 имеет размер (2050,2), а dataset2 имеет размер(2050,89). Перед обучением я нормализовал данные
Data Science
Выполнение 1D глубинной свертки с использованием 2D глубинной свертки Keras
00
Вопрос или проблема Я хотел бы выполнить 1D свертку по глубине (то есть первый шаг свертки с разделением по глубине) для модели машинного обучения, над которой я работаю. Это означает, что для входного активационного пространства h x w есть h кернелов
Data Science
Лучший способ сузить список и ранжировать по атрибутам?
00
Вопрос или проблема У меня есть набор данных по ипотечным кредитам, который содержит список клиентов (600 тысяч записей) и включает 100 колонок, включая общую информацию о клиентах (адрес, город, почтовый индекс и т.д.), доход, FICO-баллы, количество
Data Science
Как создать этот конвейер данных?
00
Вопрос или проблема У меня не так много опыта в области инженерии данных, поэтому я здесь, чтобы попросить совета. Я работаю над проектом, который заключается в создании панели управления для ИТ-отдела банка. Панель должна представлять информацию из логов.
Data Science
Как выполнить (модифицированный) t-тест для нескольких переменных и моделей в Python (машинное обучение)
00
Вопрос или проблема Я создал и проанализировал около 16 моделей машинного обучения, используя WEKA. В данный момент у меня есть CSV-файл, который показывает метрики моделей (такие как percent_correct, F-measure, recall, precision и т.
Data Science
ошибка при выполнении lasso.py
00
Вопрос или проблема Следующий код ошибки был сгенерирован при запуске lasso.py. Может кто-нибудь помочь в исправлении этой ошибки? Вот код: from cvxpy import * import numpy as np import cvxopt from multiprocessing import Pool # Данные задачи.
Data Science
Лучше иметь одну модель с большим количеством категорий или две модели с меньшим количеством для многоцелеой классификации?
00
Вопрос или проблема Для классификации текста на три категории вопрос, жалоба и дополнение, где каждый экземпляр может иметь несколько меток (вопрос и жалоба, вопрос и дополнения): лучше иметь одну модель для всех трех категорий?
Data Science
Python: Как построить график временного интервала из DataFrame в Pandas
00
Вопрос или проблема У меня есть датафрейм (df), который содержит данные о выполнении задания в разные временные интервалы. Он включает в себя следующие детали о выполнении задания: Время начала задания (START) Время окончания задания (END) Временной интервал (interval), т.
Data Science
Создание матрицы ошибок для классификации на 3 класса (Бактерии, Грибы и Вирусы) с использованием кросс-валидации.
01
Вопрос или проблема В моем проекте мне нужно сгенерировать матрицу путаницы для классификации фруктов, зараженных бактериями, грибами и вирусами, в рамках трехклассовой классификации. Для этого я использовал модель CNN. Для этой модели CNN я отправил
Data Science
Разница между аргументами class_weight и loss_weights в TensorFlow/Keras
00
Вопрос или проблема Я создаю нейронную сеть с использованием TensorFlow (v2.9.2) для несбалансированного набора изображений. При этом я заметил, что метод model.compile() имеет аргумент loss_weights, а model.fit() имеет аргумент class_weight.
Data Science
Выбор признаков на агрегированных целевых данных
00
Вопрос или проблема У меня есть вопрос о выборе признаков в наборе данных, где целевая переменная агрегируется по сумме различных данных. Я хочу предсказать количество продаж в зависимости от различных признаков, таких как: неделя цена за единицу страна
Data Science
Какое лучшее средство для прогнозирования спроса на товары с использованием нерегулярных временных рядов?
00
Вопрос или проблема Я работаю над проектом по контролируемому машинному обучению для прогнозирования будущего спроса на аптечные товары. Моя цель заключается в том, чтобы прогнозировать спрос на следующий день, неделю и месяц для конкретного товара на
Data Science
Потеря энтропии при слиянии двух категорий
00
Вопрос или проблема Предположим, я считаю количество случайных событий в последовательности. Для классического примера скажем, что я считаю, сколько различных моделей автомобилей проезжают по шоссе. После некоторых подсчетов я вижу, что моделей тысячами.