Data Science
Кривые val_loss и loss в Keras после тренировки модели
00
Вопрос или проблема Кто-нибудь может мне помочь, моя модель переобучается или недообучается? Я хочу убедиться, что модель хорошо подготовлена, прежде чем начинать развертывание Также я использую категориальную кросс-энтропию в качестве функции потерь
Data Science
Сгенерировать аналогичный текст на основе категории или похожих текстов.
00
Вопрос или проблема Я пытаюсь создать аналогичный текст на основе категории или сгенерировать текст, комбинируя схожие тексты в новый текст. Я проверял несколько задач в области обработки естественного языка, таких как генерация вопросов, но они не подходят для моей задачи.
Data Science
Как увеличить точность и уменьшить потери в модели CNN.
00
Вопрос или проблема Я использую этот набор данных для обучения своей модели: https://www.kaggle.com/datasets/sankalpsrivastava26/capital-alphabets-28×28 Я хочу предсказать цифры, строчную и заглавную рукопись, поэтому после изменения формы и нормализации
Data Science
Лучшая библиотека Python для обучения с использованием скрытой модели Маркова с гауссовской смесью.
00
Вопрос или проблема Я хотел бы обучить свои данные с использованием HMM-GMM (метод Баум-Уэлча с гауссовской смесью), чтобы найти лучшие параметры, подходящие для моих данных. Примечание : Мои данные непрерывные, а не дискретные.
Data Science
Обработка очень коротких и очень длинных последовательностей с помощью нейронной сети
00
Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.
Data Science
Возможно ли обучить один вход->нейрон->relu->нейрон->relu для входа > 0.5?
00
Вопрос или проблема Нейронная сеть выглядит следующим образом: y=max(max(x*w+b,0)*v+d,0) w,b – это вес и смещение первого нейрона. v,d – это вес и смещение второго нейрона. Если данные, например: x = tensor([[1.0], [0.9], [0.8], [0.
Data Science
Как создать DataFrame, который будет суммировать столбцы на основе столбца группировки?
00
Вопрос или проблема страна год пол мера значение0 ... значение12 A 2000 1 вакцинирован_в_месяце 2 ... 1 B 2000 1 вакцинирован_в_месяце 13 ... 12 A 2000 0 вакцинирован_в_месяце 4 ... 3 A 2000 9 вакцинирован_в_месяце 5 ... 4 B 2000 0 гулял_в_месяце 3 .
Data Science
Несоответствие между предсказаниями кросс-валидации и предсказаниями для unseen данных.
00
Вопрос или проблема У меня возникла проблема с несбалансированным набором данных. Набор данных содержит 20% целей и 80% нецелевых. Я ожидаю, что матрица ошибок будет выглядеть так, когда я передам невидимые данные обученной модели.
Data Science
SKLearn decisionTreeClassifier не обрабатывает разряженные правила в качестве входных данных.
00
Вопрос или проблема Существует ли способ обучения decisionTreeClassifier в SKLearn на разреженных кортежах? Данные, которые у меня есть, основаны примерно на 100 характеристиках, но только несколько из них используются для принятия решения.
Data Science
Разные методы масштабирования различных признаков приводят к ложной зависимости между ними.
01
Вопрос или проблема Мой набор данных содержит следующие две характеристики: “длительность фильма” (минуты) и “длительность телешоу” (сезоны). Если определенный пример имеет тип “фильм”, его длительность будет отображаться в характеристике “
Data Science
Значимость признаков в алгоритме PCA + k-means
00
Вопрос или проблема Работая с набором данных Всемирного отчета о счастье, у меня есть N стран с M признаками и баллом счастья. Это параметр, по которому я выделил 3 класса: счастливые, средние, несчастные (числовые интервалы баллов счастья).
Data Science
Модель не обучается при использовании Keras ‘flow_from_directory’, но обучается нормально с ‘image_dataset_from_directory’?
00
Вопрос или проблема При классификации изображений с использованием Keras я могу достичь точности валидации около 90-95%, однако я пытаюсь улучшить результат с помощью аугментации, поэтому перешел от image_dataset_from_directory к flow_from_directory
Data Science
SKLearn decisionTreeClassifier не обрабатывает разреженные или категориальные данные.
00
Вопрос или проблема Существует ли способ в фите decisionTreeClassifier в SKLearn для разреженных кортежей? Данные, которые я имею, основаны на примерно 100 признаках, но лишь некоторые из них используются для принятия решения.
Data Science
Лог-преобразование и выбросы
00
Вопрос или проблема Я применяю логарифмическое преобразование ко всем переменным, которые, кажется, имеют выбросы (на основе боксплотов). Мой вопрос: если у меня есть переменная, например, ‘Возраст’, где есть значения выше 100, и я выполняю
Data Science
Примите любое предложение по созданию тренировочных данных из корреляционной матрицы, чтобы найти исключение и определить разницу в вариации.
00
Вопрос или проблема У меня есть N временных векторных признаков, полученных путём записи различных параметров с течением времени. Это приводит к матрице схожести размера N*N, которая содержит значения корреляции один к одному для каждого признака.
Data Science
Подходит ли набор данных для линейной и логистической регрессии?
00
Вопрос или проблема Я работаю с набором данных о качестве красного вина по этой ссылке. Я пытаюсь проверить корреляцию с помощью точечной диаграммы, но, похоже, она не является линейной. Я применил этапы предобработки ниже: Стандартизатор, так как диапазон
Data Science
Я получаю отрицательный убыток, используя PyCharm, и положительный, используя Google Colab или Kaggle.
00
Вопрос или проблема У меня есть данные в виде изображений и 2 столбца: один содержит значения тангенса, а второй – для указания, являются ли мои значения отрицательными или положительными. У меня есть два выхода: классификация и регрессия.
Data Science
Оранжевая гео-карта не показывает фоновой карты.
00
Вопрос или проблема Мы используем Orange с нашими студентами, и у большинства из них возникают проблемы с запуском виджета Geo Map. Он не показывает никакой фоновый слой карты. Внизу отображается сообщение об ошибке: "Не удается загрузить карту из Интернета.
Data Science
Выбор количества хешей для мин-генерации? Работа с очень разреженными данными и желание получить больше коллизий.
00
Вопрос или проблема Я пытаюсь использовать minhash для генерации кластеров и определения сходств, и в основном полагаюсь на идеи из этих источников. http://www2007.org/papers/paper570.pdf https://chrisjmccormick.wordpress.com/2015/06/12/minhash-tutorial-with-python-code/
Data Science
Предварительная обработка изображений данных перед обучением OneClassSVM и уменьшение количества признаков.
00
Вопрос или проблема Я хочу обучить OneClassSVM() с помощью sklearn, и у меня есть набор из около 800 изображений в тренировочном наборе. Я использую opencv для чтения изображений и изменения их размера до постоянных размеров (960×