Data Science
Как обрабатывать столбец значений типа int, разделенных запятыми, как строку в наборе данных для обучения модели?
00
Вопрос или проблема Я работаю над проектом машинного обучения для прогнозирования победителя матчей по кабадди с использованием набора данных. Одной из важных характеристик является состав команды. У меня есть столбец в DataFrame, который содержит идентификаторы
Data Science
Как выполнить токенизацию для твитов в XLNet?
00
Вопрос или проблема X_train имеет только один столбец, который содержит все твиты. xlnet_model="xlnet-large-cased" xlnet_tokenizer = XLNetTokenizer.from_pretrained(xlnet_model) def get_inputs(tweets, tokenizer, max_len=120): """ Получает тензоры из текста
Data Science
Как извлечь и классифицировать данные из столбца в Excel?
00
Вопрос или проблема У меня есть столбец в Excel, который содержит много данных, разделенных разделителями ||. Данные можно классифицировать по некоторым классам, таким как сущности, коды IFSC, идентификаторы транзакций и т. д.
Data Science
Методы перебора признаков и кросс-валидация
00
Вопрос или проблема Существует существующий балл, состоящий из 10 параметров; каждый параметр имеет равный вес, и общий балл определяется путем суммирования баллов для каждого параметра. Я хочу попытаться уменьшить число параметров в этом балле, но сохранить их равный вес.
Data Science
MaskRCNN.train выдает ‘индекс списка вне диапазона’
00
Вопрос или проблема Я пытался использовать MaskRCNN с основной моделью Resnet на DeepFashion2 датасете для сегментации объектов. Настройки кастомизации следующие: class ClothDataset(utils.Dataset): # функция load_dataset используется для загрузки обучающего
Data Science
Прогнозирование цен на квартиры с использованием двух источников цен
00
Вопрос или проблема Я прошу помощи по следующей проблеме. В наборе данных есть две подсборки – одна, где целевая переменная реальная (действительная), а другая, где она приблизительная (пока не знаю, чем они отличаются, в одной выборке реальная
Data Science
Возможно ли найти вероятность появления экстраполированной точки на линии наилучшего соответствия, учитывая другие точки?
00
Вопрос или проблема У меня есть несколько точек (x,y), и я экстраполировал точку после получения графика наилучшей аппроксимации. Могу ли я определить вероятность появления этой точки? Связано ли это как-то с коэффициентом детерминации графика или чем-то подобным?
Data Science
Получение вероятностей действий вместо уникального предсказания в Stable Baselines 3 SAC?
00
Вопрос или проблема Я пытаюсь понять, как получить таблицу вероятностей действий вместо уникального предсказания в stable baselines 3 SAC, чтобы переопределить метод ‘predict’ и отфильтровать недопустимые действия.
Data Science
Дискриминатор условной GAN с непрерывными метками
00
Вопрос или проблема Хорошо, предположим, у нас есть хорошо помеченные изображения с недискретными метками, такими как яркость или размер, и мы хотим генерировать изображения на их основе. Если бы это было сделано с дискретной меткой, это могло бы выглядеть
Data Science
Сегментация клиентов с несбалансированными данными
00
Вопрос или проблема Я пытаюсь провести сегментацию клиентов на основе своих транзакционных данных и у меня возникают некоторые трудности с выбором наилучшего подхода. Поскольку это несупервизированная модель, я могу использовать любой алгоритм и получить
Data Science
Ищу советы по быстрой и точной системе предсказания категории устройства с использованием ИИ/МЛ
00
Вопрос или проблема Контекст: Я работаю в индустрии ПЛК (программируемых логических контроллеров), где мы получаем схемы от клиентов, показывающие, как подключены различные устройства, и программируем ПЛК соответственно. Наша команда состоит из аналитика
Data Science
Отчет по метрикам SKLEARN: “Количество классов, 28, не соответствует размеру target_names, 35. Попробуйте указать параметр labels.”
00
Вопрос или проблема Как правильно определить метки или имена целевых классов для classification_report? У меня есть отчет, который выглядит так: print(metrics.classification_report(twenty_test.target[:n_samples], predicted, target_names=twenty_test.
Data Science
Могу ли я инициализировать веса nn.Linear с помощью ридж-регрессии, а затем обучить с использованием другой функции потерь?
00
Вопрос или проблема Я исследую стратегию, при которой я инициализирую веса nn.Linear с помощью ридж-регрессии, а затем обучаю модель с помощью контрастной потери. Идея состоит в том, чтобы использовать ридж-регрессию для получения лучшей инициализации
Data Science
Как обучить модель на данных, содержащих несколько данных внутри одной точки данных?
00
Вопрос или проблема Я пытаюсь предсказать значения в столбце ёмкости, однако каждая точка данных состоит из нескольких данных. Каждая точка данных представляет данные цикла. Каждый цикл имеет емкость. Каждый цикл работает в течение некоторого времени
Data Science
Как провести кросс-валидацию Leave One Out для систем рекомендаций Топ n?
00
Вопрос или проблема Я новичок в создании систем рекомендаций. Я использую библиотеку surpriselib для оценки своих рекомендаций. Все метрики точности хорошо поддерживаются в этой библиотеке. Но я также хочу вычислить коэффициент попаданий в своей топ n системе рекомендаций.
Data Science
Множественные функции активации с эстиматором DNNClassifier в TensorFlow
00
Вопрос или проблема Я просто хочу узнать, возможно ли использовать tf.estimator.DNNClassifier с несколькими разными функциями активации. Я имею в виду, могу ли я использовать оценщик DNNClassifier, который использует разные функции активации для разных слоев?
Data Science
Что определяет проблему обучения с подкреплением
00
Вопрос или проблема У меня только ограниченные знания о методах обучения с подкреплением, и я задаюсь вопросом, является ли это подходящим методом для решения проблемы черного ящика, с которой я столкнулся, и что на самом деле определяет задачу обучения с подкреплением.
Data Science
Предсказание слова из набора слов
00
Вопрос или проблема Моя задача заключается в том, чтобы предсказать релевантные слова на основе короткого описания идеи. Например, “SQL — это язык, специфичный для домена, используемый в программировании и предназначенный для управления данными
Data Science
Построение градиентного спуска в 3D – Контурные графики
00
Вопрос или проблема Я сгенерировал 3 параметра вместе с функцией стоимости. У меня есть списки $\theta$ и список стоимости из 100 значений за 100 итераций. Я хотел бы построить последние 2 параметра относительно стоимости в 3D, чтобы визуализировать уровень
Data Science
Является ли набор данных линейно разделимым, если его можно разделить только с помощью нескольких гиперпланов?
00
Вопрос или проблема Например, в статье Википедии о линейной разделимости приведен следующий пример: Говорится: “Следующий пример требует двух прямых линий и, следовательно, не является линейно разделимым”. С другой стороны, в книге Бишопа “