Data Science
Разделение временных данных
00
Вопрос или проблема У меня есть проект, в котором требуется вычислить (с помощью регрессии), сколько времени займет задача. Из определения бизнес-проблемы ясно, что в данных существует некоторая временная зависимость, поэтому мне нужно разделить данные
Data Science
должен ли я изменить набор данных, чтобы использовать его для регрессии временных рядов с RNN/LSTM?
00
Вопрос или проблема Я вижу этот учебник, чтобы узнать, как использовать LSTM для прогнозирования временных рядов, и заметил, что он сдвинул целевую/метки вверх, чтобы все признаки были на момент времени t, а целевая величина –
Data Science
Запуск LSTM с музыкальными данными
00
Вопрос или проблема Я работаю над проектом для класса, в котором пытаюсь создать алгоритм, который изучает музыку и создает свою собственную музыку. У меня есть проблемы с тем, как организовать данные для ввода в LSTM. Один пример для обучения состоит
Data Science
Смысленная предсказательная аналитика для небольшого (n=114) набора данных с всего лишь 1 объясняющей переменной и 1 ответной переменной?
00
Вопрос или проблема Мне дана сводная таблица Excel, которая агрегирует данные из довольно большого источника данных (таблица базы данных с 1,9 миллиона записей и другая с около 490 тысяч). Данные внутри файла Excel состоят из 3 колонок: даты понедельников
Data Science
Основное отличие между Amazon SageMaker Feature Store и Tecton для ML-сервиса.
00
Вопрос или проблема Этот вопрос был перемещен из Operations Research Stack Exchange, потому что на него можно ответить на Data Science Stack Exchange. Перемещен 6 часов назад. У меня есть модель машинного обучения, но возникают ошибки при попытке работы
Data Science
Как посчитать количество слов в датафрейме?
00
Вопрос или проблема Я хотел бы посчитать, сколько мужчин и женщин ответили (например, Велосипед / Велоспорт). Ниже приведены примерные данные: Метод Series.str.contains вернет True для строковых элементов в серии, которые содержат подстроку.
Data Science
Основное различие между Amazon SageMaker Feature Store и Tecton для сервиса машинного обучения
00
Вопрос или проблема Этот вопрос был перенесен из Operations Research Stack Exchange, потому что на него можно ответить на Data Science Stack Exchange. Перенесен 16 минут назад. У меня есть модель машинного обучения, но возникают ошибки при попытке использовать
Data Science
Некоторые методы увеличения данных мешают модели Unet обучаться.
00
Вопрос или проблема Я тренирую модель Unet для сегментации клеток на изображениях микроскопии. Чтобы помочь модели лучше обобщать данные с разных микроскопов, я попытался применить увеличение яркости к обучающим данным, случайным образом умножая изображения
Data Science
Можем ли мы предсказать признаки из меток в машинном обучении?
00
Вопрос или проблема Учитывая набор данных с 100 наблюдениями и 3 признаками плюс одна метка (регрессия), мы обучаем модель на данных 100 * 4 (3 признака + 1 метка). Теперь можем ли мы предсказать признаки, когда метка задана в качестве входных данных.
Data Science
Как дискретизировать метку
00
Вопрос или проблема У меня есть несколько меток, которые указывают на различия между прогнозами и истиной. Если различия малы, то они будут помечены как xDiff, а в противном случае — как Diff. Однако на самом деле трудно определить, что считается малым
Data Science
Скрытые переменные с порогами
00
Вопрос или проблема Существует множество техник машинного обучения для оценки скрытых переменных, таких как алгоритм EM. Есть ли техника, которая позволяет устанавливать пороговые значения для каждой из скрытых переменных? У меня есть пространство признаков
Data Science
Очень высокий F1 балл после использования Random Forest на этом наборе данных — это признак переобучения? Как решить эту проблему?
00
Вопрос или проблема Я работал над проектом по обнаружению фишинга в качестве учебного упражнения. После очистки данных, создания новых признаков, масштабирования не бинарных и обучения модели случайного леса, я достиг F1-метрики 0.
Data Science
Поиск последовательностей комбинаций, которые наиболее сильно влияют на целевую переменную.
00
Вопрос или проблема Можно создать модель временного ряда для прогнозирования целевой переменной. Мне нужно найти комбинации и последовательности входных данных, которые оказывают наибольшее влияние на целевую переменную. В данном случае входные данные
Data Science
Заставьте модель машинного обучения пройти нагрузочное тестирование.
00
Вопрос или проблема Я создал модель для предсказания некоторых значений. В реальном времени она работает совершенно отлично и дает прогноз за доли секунды. Алгоритм, который я использую, — это PassiveAggresiveClassifier для прогнозирования по нескольким классам.
Data Science
Заменить пропущенные значения на наиболее частое число при условии
00
Вопрос или проблема Я пытаюсь заменить недостающие значения в столбце “Age”, но с учетом других столбцов в этих данных Titanic – Машинное обучение на основе катастрофы df.Age[(df['Sex'] == 0) & (df['Pclass'] == 1)] Я пытался сделать
Data Science
как использовать графики tensorflow в многопоточности? ошибка значений: тензор a должен принадлежать тому же графику, что и тензор b!
00
Вопрос или проблема Я выполняю задачу обнаружения экземпляров и извлечения изображений с помощью Keras и Tensorflow в качестве бэкенда. Я планирую использовать многопоточность для загрузки двух моделей, загружая maskrcnn в одном потоке и mobile net в другом.
Data Science
Обратное распространение: Значение сигнала ошибки нейрона
00
Вопрос или проблема Во время моего стремления понять обратное распространение ошибки более строго я наткнулся на определение сигнала ошибки нейрона, которое определяется следующим образом для $j^{\text{th}}$ нейрона в $l^{\text{th}}$ слое: \begin{eqnarray}
Программное обеспечение
Библиотека Python, совместимая с Tensorflow, которая предоставляет производную второго порядка для функции потерь CTC.
00
Вопрос или проблема Мне нужна библиотека Python, совместимая с TensorFlow, которая предоставляет производную второго порядка для функции потерь CTC (Connectionist Temporal Classification) в машинном обучении. А именно, библиотека, которая предоставляет
Data Science
Как обрабатывать неопределенные или нулевые данные в нейронной сети
00
Вопрос или проблема Позвольте мне начать этот пост с того, что я невероятно нов в области машинного обучения/нейронных сетей. В настоящее время я работаю над классификационной нейронной сетью, использующей TensorFlow, где входные данные представляют собой
Data Science
Как мне сгруппировать похожие виды навыков вместе?
00
Вопрос или проблема Предположим, что у меня есть файл, в котором содержатся тысячи навыков от A до Z. Теперь я хотел бы создать модель, которая сможет группировать похожие навыки вместе (например, нейронная сеть и SVM могут группировать вместе).