Data Science
Почему пакетная нормализация не ‘зануляет’ пакет размера один?
00
Вопрос или проблема Я использую Tensorflow. Рассмотрим следующий пример: >>> x <tf.Tensor: shape=(1,), dtype=float32, numpy=array([-0.22630838], dtype=float32)> >>> tf.keras.layers.BatchNormalization()(x) <
Data Science
В чем разница между оценкой GridSearchCrossValidation и оценкой на тестовом наборе данных?
00
Вопрос или проблема Я занимаюсь классификацией с использованием Python. Я использую класс GridSearchCV, этот класс имеет атрибут best_score_, определяемый как “Средняя кросс-валидиционная оценка лучшего оценщика”. С этим классом я также могу
Data Science
Python 3.11 | Как заставить Python собирать значения определенной ячейки в читаемом файле Excel, ЕСЛИ строка этой ячейки имеет определенное значение в другом столбце.
00
Вопрос или проблема Я совсем новичок в этой части кодирования, связанной со сбором данных, просто пытаюсь немного автоматизировать процесс. В настоящее время у меня есть этот excel файл, который Python читает нормально, однако, я пытаюсь выяснить, как
Data Science
Заполните отсутствующие значения (NA) в различных столбцах (независимо друг от друга), используя пакет imputeTS (в частности, функцию na_kalman).
00
Вопрос или проблема У моего друга недавно началась работа с R-studio, и он интересуется заполнением значений NA в разных столбцах, используя вышеупомянутую функцию. Также, так как он собирается проводить анализ временных рядов для каждого столбца, какой
Data Science
PCA для коррелированных переменных
00
Вопрос или проблема У меня есть вопрос о методе главных компонент (PCA). Я знаю, что если у вас есть коррелированные переменные (x1, x2, x3, x4), то хорошо провести PCA, чтобы получить новые некоррелированные переменные (pc1, pc2), которые используются
Data Science
Как получить выход скрытого слоя однослойной LSTM
00
Вопрос или проблема Как получить выходы скрытого слоя в простой однослойной LSTM? cat("Строим модель\n") model <- keras_model_sequential() %>% layer_lstm(units = 64, dropout = 0.2, input_shape = c(seqlength, length(chars))) %>
Data Science
Машинное обучение: Сравнение моделей классификации
00
Вопрос или проблема Дан набор данных, который мне нужно использовать для классификации, и я хочу сравнить эффективность различных моделей классификации. Предположим, я хочу рассмотреть логистическую регрессию (с разными точками отсечения) и KNN.
Data Science
Деревья решений – C4.5 против CART – наборы правил
00
Вопрос или проблема Когда я читал руководство пользователя scikit-learn о деревьях решений, они упомянули, что CART (деревья классификации и регрессии) очень похож на C4.5, но отличается тем, что поддерживает числовые целевые переменные (регрессию) и
Data Science
Изучение моделей для немутуально исключающих событий/меток, кроме многометочной классификации.
00
Вопрос или проблема У меня есть следующий датафрейм (в широком формате), который фиксирует IQ, Hours (количество часов учебы) и Score (оценки на прошлом экзамене для студентов 1,2,3,4 в разных классах (Class_ID), и я хотел бы использовать эти характеристики
Data Science
Выбор правильного алгоритма для генерации текстов на основе шаблонов
00
Вопрос или проблема Я занимаюсь проектом по генерации текста — задача заключается в том, чтобы представить статистические данные в читаемом виде. Я решил подойти к этому на основе шаблонов: для каждого типа данных есть шаблон того, как должно быть сформировано
Data Science
Нахождение наиболее статистически значимой переменной(ых) в наборе данных – логистическая регрессия/выбор признаков.
00
Вопрос или проблема В настоящее время я работаю над проектом, в котором у меня есть набор данных, состоящий из ряда образцов крови и количества различных биологических соединений в каждом образце. Образцы разделены на три группы — тяжелое заболевание
Data Science
Вычисление значимости признаков временных рядов
00
Вопрос или проблема Я новичок в моделировании временных рядов, и мне интересно, какой стандартный способ количественной оценки значимости признаков в контексте временных рядов? Какие типы моделей позволяют наилучшую интерпретацию пространства признаков?
Data Science
Как называется моя проблема – распределение количества элементов, обладающих определённым атрибутом?
00
Вопрос или проблема У меня следующая проблема: Есть большой набор записей. У каждой записи в наборе есть атрибут. Для некоторых значений атрибута существует только одна запись, для других значений есть много записей с этим значением.
Data Science
Как нейронные сети комбинируются для формирования интеллектуальных систем?
00
Вопрос или проблема Автомобили с автопилотом, манипуляторы, которые могут учиться поднимать предметы, машины, которые могут вести беседы и так далее. Я понимаю, как работают нейронные сети. Но я действительно не знаю, как нейронные сети объединяются для
Data Science
Прогноз временных рядов с использованием ARIMA и нелинейного тренда и слишком много остатков
00
Вопрос или проблема Я работаю над прогнозированием финансового индекса, попробовал разложить временной ряд, используя: from matplotlib import pyplot from statsmodels.tsa.seasonal import seasonal_decompose result = seasonal_decompose(dataset, model="multiplicative", freq=12) result.
Data Science
Лучше понимать диаграммы рассеяния
00
Вопрос или проблема Я пытаюсь понять, как читать диаграмму рассеяния на основе результатов моей матрицы ошибок. Это матрица ошибок: Я заметил высокую корреляцию между столбцом 5 и столбцом 6, низкую корреляцию со столбцом 11 и среднюю корреляцию со столбцом
Data Science
Возникает ошибка ‘ValueError: setting an array element with a sequence.’ при попытке обработать данные смешанного типа.
00
Вопрос или проблема Я уже видел это, это и это вопрос, но ни одно из предложений не помогло решить мою проблему (поэтому я отменил их). У меня есть следующий код: nlp = spacy.load('en_core_web_sm') parser = English() class CleanTextTransformer(TransformerMixin)
Data Science
Нужно ли мне считывать всю базу данных для рекомендательной системы?
00
Вопрос или проблема Допустим, у меня есть база данных примерно со 100000 строк. Я хочу создать систему рекомендаций на основе контента. Нужно ли мне действительно считывать всю базу данных для вычисления схожести? Это было бы очень дорого делать в облачных
Data Science
Агрегация низкоуровневых признаков для классификатора
00
Вопрос или проблема Цель заключается в прогнозировании отказа/неотказа маршрутизатора (1/0) в будущем временном окне с использованием всех данных, собранных за последний час (т.е. бинарная цель). Данные получаются на двух уровнях: Метрики маршрутизатора
Data Science
Как работать с «Ergänzungsstrichen» и «Bindestrichen» в немецкой обработке естественного языка?
00
Вопрос или проблема Проблема Во фразе на немецком языке “Haupt- und Nebensatz” в точности такое же значение, как и у “Hauptsatz und Nebensatz”. Однако при преобразовании обеих фраз с использованием, например, конвейера de_core_news_sm