Data Science
Имеет ли смысл интерполировать изображение сразу перед CNN?
00
Вопрос или проблема Я обучаю CNN на изображениях, которые имеют много горизонтальных черных линий (из-за особенностей сенсора). Я думаю о том, чтобы удалить эти артефакты с помощью какой-то предподготовки (интерполяция, медианные фильтры…
Data Science
Вопрос о изменении размера массива для классификаторов KNN
00
Вопрос или проблема Я продолжаю пытаться запустить новый набор данных через свой классификатор KNN, но получаю сообщение: ValueError: размерность данных запроса должна совпадать с размерностью обучающих данных Затем я использовал: x_new = pd.
Data Science
Использование оперативной памяти модели продолжает увеличиваться при обучении на ранее обученной модели.
00
Вопрос или проблема Обновление Увеличивается, когда я загружаю сохраненную модель таким образом. return tf.keras.models.load_model("models/min__1576172002.model") И я сохраняю модель, используя agent.model.save(f'models/min__{int(time.
Data Science
Какой алгоритм используется в sklearn SGDClassifier, когда используется модифицированная потеря Хубера?
00
Вопрос или проблема Документация говорит: Функция потерь, которая будет использоваться. По умолчанию – ‘hinge’, что дает линейный SVM. Функция потерь ‘log’ дает логистическую регрессию, вероятностный классификатор. ‘
Data Science
Вычислите среднее/дисперсию сумм случайно выбранных чисел из массива.
00
Вопрос или проблема Давайте скажем, что есть массив, содержащий числа с плавающей запятой, и его размер n. Теперь m чисел будут выбраны из этого массива, и сумма этих m чисел будет генерировать новое число. Таким образом, все возможные комбинации суммы
Data Science
Модель временных рядов едва подходит.
00
Вопрос или проблема Я пытаюсь спрогнозировать цены акций Google. Я создал две модели: одну с LSTM и другую с двунаправленным LSTM, но прогнозируемые значения не очень хорошо совпадают с тестовыми значениями. Я пробовал разные параметры, но почти не увидел улучшения.
Data Science
Найдите изменения в переменных в двух состояниях.
00
Вопрос или проблема У меня есть такой датафрейм: dframe <- structure(list(c(60, 91, 377, 419, 893, 905), c(-0.6647, -0.0275000000000001, -0.6311, 0.1328, -0.4559, -1.0208), c(-1.6964, -1.3851, -1.1428, -1.4191, -1.2979, -1.
Data Science
Проблемы с объединением вложенных категориальных и числовых переменных для использования в LSTM
00
Вопрос или проблема Я новичок здесь и в глубоких обучения, поэтому заранее прошу прощения за неправильно форматированный код или формулировки. У меня есть набор данных, где я отслеживаю 4 переменные с 2 категориальными и 3 числовыми полями на 4 временных этапах.
Data Science
Какой подходящий алгоритм машинного обучения для этой задачи?
00
Вопрос или проблема У меня есть набор данных, в котором каждая выборка содержит идентификатор пользователя, дату и статус, связанный с этим пользователем (активный, истекший и деактивированный). Набор данных содержит записи за полный год, но несколько
Data Science
Кластеризация картезианских координат, связанных с одной категориальной характеристикой
00
Вопрос или проблема У меня есть серия 2D координат X = {x, y}. Каждая из них связана с одной категориальной переменной W, которая может принимать 7 различных значений. Например: coord W X1 3 X2 5 X3 7 X4 3 X5 2 X6 3 X7 2 ... X2000 5 ... Я хотел бы получить все кластеры, […
Data Science
Субсетирование датафрейма по подсетке датафрейма и по серии
00
Вопрос или проблема Я изучаю Data Science на Datacamp, и у меня возник вопрос: если у нас есть DataFrame cars, структурированный следующим образом cars_per_cap country drives_right US 809 United States True AUS 731 Australia False JPN 588 Japan False
Data Science
Как предсказать, когда будет назначена встреча?
00
Вопрос или проблема У меня есть набор данных с десятками тысяч записей. Записи имеют дату создания и запланированную дату. Что-то вроде этого: ID Создано Запланировано 1 01/08/2020 05/08/2020 2 01/08/2020 07/08/2020 3 02/08/2020 04/08/2020 .
Data Science
Неконтролируемый анализ настроений в R
00
Вопрос или проблема Как бы вы оценили несупервизированный сентиментальный анализ? Я читаю о том, как оценивать сентиментальный анализ, и узнаю, что во многих классификационных моделях, которые используются, у данных есть целевые/метки переменные.
Data Science
Прогноз модели LSTM почти постоянен.
00
Вопрос или проблема Я новичок в RNN и LSTM и сейчас экспериментирую с различными настройками. При попытке смоделировать данные временных рядов в абсолютных величинах (предсказанная цена закрытия) я столкнулся со следующими проблемами: Потеря на валидации
Data Science
Обнаружение аномалий в данных временных рядов только с положительными образцами?
00
Вопрос или проблема У меня есть набор данных ЭКГ временных рядов. Я хочу заняться обнаружением аномалий (все, что отличается от нормальной ЭКГ, должно считаться аномальным). Дело в том, что у меня есть только положительные образцы и очень немного отрицательных образцов.
Data Science
Как подойти к выбору пиков с различными формами, размерами, варьирующим уровнем шума и иногда смещающимся базовым уровнем?
00
Вопрос или проблема Я пытаюсь написать программу, которая постоянно отслеживает местоположение пика. Для этого мне нужен очень хороший алгоритм обнаружения пиков. Он должен не только определять местоположение пика, но и отсутствие его.
Data Science
Как определить сходство между узлами в исходном графе?
00
Вопрос или проблема Хотя разговоров о том, как определить схожесть между узлами в пространстве эмбеддингов, было много, мне не встречалось обсуждений определения схожести между узлами в исходном, неэмбедированном графе. Есть ли предложения о том, как это объяснить?
Data Science
Есть ли способ выполнить отбор признаков в наборе данных, в котором только случаи?
00
Вопрос или проблема У меня есть датасет, который содержит только случаи и не имеет контролей. Возможно ли сделать выбор характеристик в таких датасетах? В конечном итоге я хочу создать предсказательную модель, которая предсказывает случай.
Data Science
Как правильно использовать вейвлет-преобразование для извлечения признаков?
00
Вопрос или проблема Я пытаюсь классифицировать слова на основе сигналов ЭМГ, используя машину опорных векторов в качестве модели. Мой набор данных включает 15 классов (слов) с 230 повторами и 1000 признаками каждое. Я уже объединил все файлы вместе, чтобы упростить задачу.
Data Science
Интерпретация логарифмических шансов в случае нескольких предсказательных переменных
00
Вопрос или проблема Интерпретация логарифмических шансов с одной переменной предсказания –> 0.8=2.5(Гипертензия) Шансы человека с гипертензией заболеть сердечными заболеваниями составляют 0.8. Логарифмические шансы с несколькими переменными предсказания –