Data Science
Data Science
Вопрос или проблема У меня есть 200 уникальных файлов *.txt для каждой папки: Каждый файл содержит первоначальный текст иска, разделенный по юридическим областям (папкам) общественной защиты. Я хотел бы создать обучающие данные для прогнозирования новых
Data Science
Вопрос или проблема Прямой вопрос: Какие альтернативные методы существуют для прогнозирования категориальных данных? Детали: Я регулярно обрабатываю данные, которые на 100% категориальные. Почти всегда это номинальные данные (хотя иногда могут включаться
Data Science
Вопрос или проблема Я довольно нов в области глубокого обучения и действительно надеюсь, что вы сможете мне помочь. Я хочу написать программу на Python, которая позволит мне выбрать область на эталонном изображении. Этот подизображение переменного размера
Data Science
Вопрос или проблема У меня есть модель Keras, и я хочу сделать с ней крутые визуализации. Это сеть для распознавания объектов. Я подумал, было бы здорово ввести пустое изображение в сеть и рассматривать его как переменную, а не как веса, а затем обучить
Data Science
Вопрос или проблема Я новичок как в области науки о данных, так и в Python. У меня есть набор данных временных образцов, для которых я хочу провести агломеративную иерархическую кластеризацию. Я обнаружил, что метод динамического выравнивания по времени
Data Science
Вопрос или проблема Я пытаюсь самостоятельно реализовать алгоритм логистической регрессии для самообучения, но у меня возникают некоторые проблемы с достижением аналогичной точности, как у логистической регрессии из sklearn. Вот код, который я использую
Data Science
Вопрос или проблема У меня есть несколько групп признаков, которые я хотел бы протестировать в отношении независимых переменных. Идея заключается в том, чтобы выяснить, с какими группами в большей степени ассоциируется конкретное значение независимой переменной.
Data Science
Вопрос или проблема Я хочу настроить параметры классификатора MLP из sklearn, но не знаю, какие из них настраивать и сколько вариантов предложить? Например, это скорость обучения. Должен ли я указать значения [.0001, .001, .01, .1, .2, .3]?
Data Science
Вопрос или проблема У меня есть набор данных с 580 образцами и 7 признаками. Я сравнил время работы трех ядер: линейного, квадратичного и гауссовского, используя RandomizedSearchCV следующим образом: from sklearn.model_selection import RandomizedSearchCV from sklearn.
Data Science
Вопрос или проблема Я работаю над рекомендательной системой, которая будет рекомендовать фильмы пользователям. Оценки фильмов Фильм Пользователь Оценка 100 201 5 105 256 8 … … … Теги фильмов Фильм Тег 100 1 100 2 100 8 105 2 105 5 …
Data Science
Вопрос или проблема Я пока только знакомлюсь с основами машинного обучения и хочу сравнить результаты контролируемого алгоритма (KNN) и неконтролируемого алгоритма (k-means) в контексте выявления сетевых атак типа DOS. Я застрял на том, как мои данные
Data Science
Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь
Data Science
Вопрос или проблема Мне нужно сгенерировать матрицу путаницы для классификации фруктов, зараженных бактериями, грибами и вирусами, как для трехклассовой классификации. Для этого я использовал модель CNN. Для этой модели CNN я отправил изображения R, G
Data Science
Вопрос или проблема Я создал биологический набор данных, который состоит из микробных данных с 15 географически близких местоположений, и для каждого из них у меня есть 100 временных точек, всего 1500 точек данных. Для этого я пытаюсь предсказать присутствие
Data Science
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью Gridsearch, следующие. Как вы думаете, есть ли у этой модели серьезная переобученность? Среднее значение целевых показателей составляет 850. R2: 0.
Data Science
Вопрос или проблема Я изучаю объяснимый искусственный интеллект, в частности локальные и глобальные методы глубокого обучения. Я тщательно изучил Kernel SHAP. Однако концепция Grad-SHAP очень слабо представлена в литературе. Меня постоянно отправляют
Data Science
Вопрос или проблема Я получил 100% точности на своем тестовом наборе, используя алгоритм дерева решений, но только 85% точности с использованием случайного леса. Есть ли что-то не так с моей моделью или дерево решений наиболее подходит для предоставленного набора данных?
Data Science
Вопрос или проблема Я создаю бинарную модель и использую TensorBoard для визуализации графиков точности и потерь. Однако я заметил, что графики точности и потерь моей модели не гладкие. Почему это происходит? Вот графики точности и потерь моей модели
Data Science
Вопрос или проблема У меня есть набор данных, в котором входные данные представляют собой данные для пациентов в отделении интенсивной терапии, где каждая госпитализация имеет 40 признаков (20 жизненных показателей, 20 лабораторных значений) и несколько
Data Science
Вопрос или проблема from sklearn.svm import SVR from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score scaler = StandardScaler() X_train_scaled = scaler.fit_transform(X_train) X_test_scaled = scaler.