Data Science
Модель CNN недостаточно обучается. Точность остается на одном уровне.
00
Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь
Data Science
Как сгенерировать матрицу путаницы для классификации с тремя классами с использованием кросс-валидации?
00
Вопрос или проблема Мне нужно сгенерировать матрицу путаницы для классификации фруктов, зараженных бактериями, грибами и вирусами, как для трехклассовой классификации. Для этого я использовал модель CNN. Для этой модели CNN я отправил изображения R, G
Data Science
Модель (CNN) недостаточно обучается, или, по крайней мере, я считаю, что это так. Точность остается неизменной.
00
Вопрос или проблема В настоящее время я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивки голосов. В процессе предварительной обработки данных я выполнил все в соответствии с опубликованными статьями.
Data Science
Индексы строк должны быть целыми числами
00
Вопрос или проблема Я пытался закодировать строковые значения признака 'ProductCategory' в целые значения, но получил эту ошибку. Также мне хотелось бы спросить, приведет ли кодирование меток этого признака к тому, что моя модель будет неправильно интерпретировать целые значения как 0<
Data Science
Лучший способ сузить список и ранжировать по атрибутам?
00
Вопрос или проблема У меня есть набор данных по ипотечным кредитам, который содержит список клиентов (600 тысяч записей) и включает 100 колонок, включая общую информацию о клиентах (адрес, город, почтовый индекс и т.д.), доход, FICO-баллы, количество
Data Science
ошибка при выполнении lasso.py
00
Вопрос или проблема Следующий код ошибки был сгенерирован при запуске lasso.py. Может кто-нибудь помочь в исправлении этой ошибки? Вот код: from cvxpy import * import numpy as np import cvxopt from multiprocessing import Pool # Данные задачи.
Data Science
Лучше иметь одну модель с большим количеством категорий или две модели с меньшим количеством для многоцелеой классификации?
00
Вопрос или проблема Для классификации текста на три категории вопрос, жалоба и дополнение, где каждый экземпляр может иметь несколько меток (вопрос и жалоба, вопрос и дополнения): лучше иметь одну модель для всех трех категорий?
Data Science
Создание матрицы ошибок для классификации на 3 класса (Бактерии, Грибы и Вирусы) с использованием кросс-валидации.
01
Вопрос или проблема В моем проекте мне нужно сгенерировать матрицу путаницы для классификации фруктов, зараженных бактериями, грибами и вирусами, в рамках трехклассовой классификации. Для этого я использовал модель CNN. Для этой модели CNN я отправил
Data Science
Прогноз на конкретный месяц
00
Вопрос или проблема Я пытаюсь построить предсказательную модель на основе прошлых исторических данных. У меня есть информация о конкретных сбоях машин на основе данных за прошлый год. У меня есть данные за некоторые месяцы 2016 года и с января по ноябрь 2017 года.
Data Science
Классификация с множеством классов
00
Вопрос или проблема Я пытаюсь создать модель, которая будет классифицировать текст примерно на 500 разных классов. Я думаю, что мне нужно настроить архитектуру Pooling Classifier, которая сейчас выглядит следующим образом: (1): PoolingLinearClassifier(
Data Science
Как улучшить классификацию документов между двумя похожими документами
00
Вопрос или проблема У меня есть задача классификации документов, где мне нужно определить, связан ли определённый документ с недвижимостью или нет. Я получаю URL веб-страницы, из которой извлекаю весь текст, а затем с помощью своей обученной модели, основанной
Data Science
Лучший способ решения проблемы с займом
00
Вопрос или проблема У меня есть данные о кредитах, которые мне нужно классифицировать в зависимости от причин получения кредитов, и использовать их для прогнозирования причин, по которым люди всегда обращаются за кредитом. Есть ли у вас предложения?
Вопросы и ответы
Можно ли получить важность признаков для каждой предсказанной строки?
00
Вопрос или проблема Я работаю над анализом кредитных рисков. Я хочу предсказать риск каждой компании, развивающей долг с вымышленной компанией. Я получил важность признаков от модели, но я хочу узнать, возможно ли определить, какие индикаторы влияют на
Data Science
Как определить выбросы на основе регрессии с логарифмическим масштабом?
00
Вопрос или проблема Я сталкиваюсь с проблемой, когда мне нужно обнаружить выбросы в сборе данных. Цель состоит в том, чтобы выявлять выбросы по переменной Y на основе ее связи с переменной X. Для этого я сделал следующее: Построил график в логарифмическом
Data Science
Почему мой классификатор случайного леса предсказывает один класс чаще остальных?
00
Вопрос или проблема У меня есть классификатор случайного леса, который предсказывает класс 0 примерно в два раза чаще, чем класс 1. Он также предсказывает класс 0 с более высокой вероятностью, чем класс 1. Это не несбалансированный набор данных.
Data Science
Как создать классификатор на основе данных с сенсоров?
00
Вопрос или проблема Я работаю над локализацией в помещении на основе магнитометра. У меня есть 9 отдельных наборов временных рядов с показаниями датчиков, взятыми с координат 00, 01, 02, 10, 11 и так далее до 22. В основном я использую свою собственную
Data Science
Случайное начальное значение в сравнении моделей машинного обучения
00
Вопрос или проблема Я хотел бы задать вопрос о случайной генерации популяции и разделении датасета в моделях классификации машинного обучения. Например, я использовал seed = 1 и получил точность 0.7, seed = 5 и получил точность 0.
Data Science
Найти повторяющиеся даты в небольшом наборе (и избавиться от неповторяющихся)
00
Вопрос или проблема Мне нужна помощь в анализе проблемы категоризации. Дан набор дат (небольшой набор: максимум 20 элементов), я хотел бы сгруппировать даты, которые равномерно распределены (с учетом допустимой погрешности). Это могут быть, например
Data Science
Нестированная кросс-валидация: ошибка обобщения для нескольких моделей
00
Вопрос или проблема Я имею в виду этот вопрос: Вложенная кросс-валидация и выбор лучшей модели регрессии – является ли это правильным процессом SKLearn? В ответах говорится, что вложенная кросс-валидация может оценивать ошибку обобщения оптимизации
Data Science
Реализация LDA (Скрытое распределение Дирихле) для задач классификации
00
Вопрос или проблема До сих пор я использовал LDA только для моделирования тем. Мне хотелось бы узнать, какая самая простая реализация алгоритма LDA для задач классификации. Вы можете использовать LDA на ваших обучающих данных, чтобы построить их темпредставление