Data Science
Data Science
Вопрос или проблема Я использую Tensorflow. Рассмотрим следующий пример: >>> x <tf.Tensor: shape=(1,), dtype=float32, numpy=array([-0.22630838], dtype=float32)> >>> tf.keras.layers.BatchNormalization()(x) <
Data Science
Вопрос или проблема Я занимаюсь классификацией с использованием Python. Я использую класс GridSearchCV, этот класс имеет атрибут best_score_, определяемый как “Средняя кросс-валидиционная оценка лучшего оценщика”. С этим классом я также могу
Data Science
Вопрос или проблема Я совсем новичок в этой части кодирования, связанной со сбором данных, просто пытаюсь немного автоматизировать процесс. В настоящее время у меня есть этот excel файл, который Python читает нормально, однако, я пытаюсь выяснить, как
Data Science
Вопрос или проблема У моего друга недавно началась работа с R-studio, и он интересуется заполнением значений NA в разных столбцах, используя вышеупомянутую функцию. Также, так как он собирается проводить анализ временных рядов для каждого столбца, какой
Data Science
Вопрос или проблема У меня есть вопрос о методе главных компонент (PCA). Я знаю, что если у вас есть коррелированные переменные (x1, x2, x3, x4), то хорошо провести PCA, чтобы получить новые некоррелированные переменные (pc1, pc2), которые используются
Data Science
Вопрос или проблема Как получить выходы скрытого слоя в простой однослойной LSTM? cat("Строим модель\n") model <- keras_model_sequential() %>% layer_lstm(units = 64, dropout = 0.2, input_shape = c(seqlength, length(chars))) %>
Data Science
Вопрос или проблема Дан набор данных, который мне нужно использовать для классификации, и я хочу сравнить эффективность различных моделей классификации. Предположим, я хочу рассмотреть логистическую регрессию (с разными точками отсечения) и KNN.
Data Science
Вопрос или проблема Когда я читал руководство пользователя scikit-learn о деревьях решений, они упомянули, что CART (деревья классификации и регрессии) очень похож на C4.5, но отличается тем, что поддерживает числовые целевые переменные (регрессию) и
Data Science
Вопрос или проблема У меня есть следующий датафрейм (в широком формате), который фиксирует IQ, Hours (количество часов учебы) и Score (оценки на прошлом экзамене для студентов 1,2,3,4 в разных классах (Class_ID), и я хотел бы использовать эти характеристики
Data Science
Вопрос или проблема Я занимаюсь проектом по генерации текста — задача заключается в том, чтобы представить статистические данные в читаемом виде. Я решил подойти к этому на основе шаблонов: для каждого типа данных есть шаблон того, как должно быть сформировано
Data Science
Вопрос или проблема В настоящее время я работаю над проектом, в котором у меня есть набор данных, состоящий из ряда образцов крови и количества различных биологических соединений в каждом образце. Образцы разделены на три группы — тяжелое заболевание
Data Science
Вопрос или проблема Я новичок в моделировании временных рядов, и мне интересно, какой стандартный способ количественной оценки значимости признаков в контексте временных рядов? Какие типы моделей позволяют наилучшую интерпретацию пространства признаков?
Data Science
Как называется моя проблема – распределение количества элементов, обладающих определённым атрибутом?
Вопрос или проблема У меня следующая проблема: Есть большой набор записей. У каждой записи в наборе есть атрибут. Для некоторых значений атрибута существует только одна запись, для других значений есть много записей с этим значением.
Data Science
Вопрос или проблема Автомобили с автопилотом, манипуляторы, которые могут учиться поднимать предметы, машины, которые могут вести беседы и так далее. Я понимаю, как работают нейронные сети. Но я действительно не знаю, как нейронные сети объединяются для
Data Science
Вопрос или проблема Я работаю над прогнозированием финансового индекса, попробовал разложить временной ряд, используя: from matplotlib import pyplot from statsmodels.tsa.seasonal import seasonal_decompose result = seasonal_decompose(dataset, model="multiplicative", freq=12) result.
Data Science
Вопрос или проблема Я пытаюсь понять, как читать диаграмму рассеяния на основе результатов моей матрицы ошибок. Это матрица ошибок: Я заметил высокую корреляцию между столбцом 5 и столбцом 6, низкую корреляцию со столбцом 11 и среднюю корреляцию со столбцом
Data Science
Вопрос или проблема Я уже видел это, это и это вопрос, но ни одно из предложений не помогло решить мою проблему (поэтому я отменил их). У меня есть следующий код: nlp = spacy.load('en_core_web_sm') parser = English() class CleanTextTransformer(TransformerMixin)
Data Science
Вопрос или проблема Допустим, у меня есть база данных примерно со 100000 строк. Я хочу создать систему рекомендаций на основе контента. Нужно ли мне действительно считывать всю базу данных для вычисления схожести? Это было бы очень дорого делать в облачных
Data Science
Вопрос или проблема Цель заключается в прогнозировании отказа/неотказа маршрутизатора (1/0) в будущем временном окне с использованием всех данных, собранных за последний час (т.е. бинарная цель). Данные получаются на двух уровнях: Метрики маршрутизатора
Data Science
Вопрос или проблема Проблема Во фразе на немецком языке “Haupt- und Nebensatz” в точности такое же значение, как и у “Hauptsatz und Nebensatz”. Однако при преобразовании обеих фраз с использованием, например, конвейера de_core_news_sm