classification
Data Science
Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь
Data Science
Вопрос или проблема Мне нужно сгенерировать матрицу путаницы для классификации фруктов, зараженных бактериями, грибами и вирусами, как для трехклассовой классификации. Для этого я использовал модель CNN. Для этой модели CNN я отправил изображения R, G
Data Science
Вопрос или проблема В настоящее время я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивки голосов. В процессе предварительной обработки данных я выполнил все в соответствии с опубликованными статьями.
Data Science
Вопрос или проблема Я пытался закодировать строковые значения признака 'ProductCategory' в целые значения, но получил эту ошибку. Также мне хотелось бы спросить, приведет ли кодирование меток этого признака к тому, что моя модель будет неправильно интерпретировать целые значения как 0<
Data Science
Вопрос или проблема У меня есть набор данных по ипотечным кредитам, который содержит список клиентов (600 тысяч записей) и включает 100 колонок, включая общую информацию о клиентах (адрес, город, почтовый индекс и т.д.), доход, FICO-баллы, количество
Data Science
Вопрос или проблема Следующий код ошибки был сгенерирован при запуске lasso.py. Может кто-нибудь помочь в исправлении этой ошибки? Вот код: from cvxpy import * import numpy as np import cvxopt from multiprocessing import Pool # Данные задачи.
Data Science
Вопрос или проблема Для классификации текста на три категории вопрос, жалоба и дополнение, где каждый экземпляр может иметь несколько меток (вопрос и жалоба, вопрос и дополнения): лучше иметь одну модель для всех трех категорий?
Data Science
Вопрос или проблема В моем проекте мне нужно сгенерировать матрицу путаницы для классификации фруктов, зараженных бактериями, грибами и вирусами, в рамках трехклассовой классификации. Для этого я использовал модель CNN. Для этой модели CNN я отправил
Data Science
Вопрос или проблема Я пытаюсь построить предсказательную модель на основе прошлых исторических данных. У меня есть информация о конкретных сбоях машин на основе данных за прошлый год. У меня есть данные за некоторые месяцы 2016 года и с января по ноябрь 2017 года.
Data Science
Вопрос или проблема Я пытаюсь создать модель, которая будет классифицировать текст примерно на 500 разных классов. Я думаю, что мне нужно настроить архитектуру Pooling Classifier, которая сейчас выглядит следующим образом: (1): PoolingLinearClassifier(
Data Science
Вопрос или проблема У меня есть задача классификации документов, где мне нужно определить, связан ли определённый документ с недвижимостью или нет. Я получаю URL веб-страницы, из которой извлекаю весь текст, а затем с помощью своей обученной модели, основанной
Data Science
Вопрос или проблема У меня есть данные о кредитах, которые мне нужно классифицировать в зависимости от причин получения кредитов, и использовать их для прогнозирования причин, по которым люди всегда обращаются за кредитом. Есть ли у вас предложения?
Вопросы и ответы
Вопрос или проблема Я работаю над анализом кредитных рисков. Я хочу предсказать риск каждой компании, развивающей долг с вымышленной компанией. Я получил важность признаков от модели, но я хочу узнать, возможно ли определить, какие индикаторы влияют на
Data Science
Вопрос или проблема Я сталкиваюсь с проблемой, когда мне нужно обнаружить выбросы в сборе данных. Цель состоит в том, чтобы выявлять выбросы по переменной Y на основе ее связи с переменной X. Для этого я сделал следующее: Построил график в логарифмическом
Data Science
Вопрос или проблема У меня есть классификатор случайного леса, который предсказывает класс 0 примерно в два раза чаще, чем класс 1. Он также предсказывает класс 0 с более высокой вероятностью, чем класс 1. Это не несбалансированный набор данных.
Data Science
Вопрос или проблема Я работаю над локализацией в помещении на основе магнитометра. У меня есть 9 отдельных наборов временных рядов с показаниями датчиков, взятыми с координат 00, 01, 02, 10, 11 и так далее до 22. В основном я использую свою собственную
Data Science
Вопрос или проблема Я хотел бы задать вопрос о случайной генерации популяции и разделении датасета в моделях классификации машинного обучения. Например, я использовал seed = 1 и получил точность 0.7, seed = 5 и получил точность 0.
Data Science
Вопрос или проблема Мне нужна помощь в анализе проблемы категоризации. Дан набор дат (небольшой набор: максимум 20 элементов), я хотел бы сгруппировать даты, которые равномерно распределены (с учетом допустимой погрешности). Это могут быть, например
Data Science
Вопрос или проблема Я имею в виду этот вопрос: Вложенная кросс-валидация и выбор лучшей модели регрессии – является ли это правильным процессом SKLearn? В ответах говорится, что вложенная кросс-валидация может оценивать ошибку обобщения оптимизации
Data Science
Вопрос или проблема До сих пор я использовал LDA только для моделирования тем. Мне хотелось бы узнать, какая самая простая реализация алгоритма LDA для задач классификации. Вы можете использовать LDA на ваших обучающих данных, чтобы построить их темпредставление