machine-learning
Data Science
Вопрос или проблема У меня есть модель движения, для которой я могу моделировать данные. Она имеет два параметра, а выходными данными являются широта и долгота в N равномерно распределенных временных точках. Моя цель – использовать сверточную нейронную
Data Science
Вопрос или проблема У меня есть временные ряды данных (доходность акций), и я обучаю на них регрессию случайного леса. Общее количество наблюдений = 2499. Чтобы лучше оценить производительность, я реализовал тестирование с прокатными окнами с размерами
Data Science
Вопрос или проблема Я занимаюсь проектом по генерации текста — задача заключается в том, чтобы представить статистические данные в читаемом виде. Я решил подойти к этому на основе шаблонов: для каждого типа данных есть шаблон того, как должно быть сформировано
Data Science
Вопрос или проблема Я уже видел это, это и это вопрос, но ни одно из предложений не помогло решить мою проблему (поэтому я отменил их). У меня есть следующий код: nlp = spacy.load('en_core_web_sm') parser = English() class CleanTextTransformer(TransformerMixin)
Data Science
Вопрос или проблема Цель заключается в прогнозировании отказа/неотказа маршрутизатора (1/0) в будущем временном окне с использованием всех данных, собранных за последний час (т.е. бинарная цель). Данные получаются на двух уровнях: Метрики маршрутизатора
Data Science
Вопрос или проблема Мне нужно решить два вопроса по следующему набору данных: 1. Разделить клиентов на взаимно исключающие группы. Объяснить кластеры. 2. Определить правила ассоциации 1-1 для каждой категории продукта в каждом кластере, то есть если клиент
Data Science
Вопрос или проблема Я использую метод классификации CART, разделяя набор данных на обучающую и тестовую выборки. Я использовал ошибку классификации, KS по ранговой сортировке, AUC и Gini в качестве MPM (меры производительности модели).
Data Science
Вопрос или проблема Итак, у меня есть набор данных, в котором почти все столбцы являются категориальными переменными. Проблема в том, что большинство категориальных переменных имеют много различных значений. Например, в одном столбце более миллиона уникальных
Data Science
Вопрос или проблема У меня есть временные ряды данных, содержащие действия пользователей в определенные интервалы времени, например, Дата UserId Директория операция Результат 01/01/2017 99:00 user1 dir1 created_file success 01/01/2017 99:00 user3 dir10
Data Science
Вопрос или проблема Предположим, мы ранее использовали нейронную сеть или другой классификатор C с $N$ обучающими образцами $I:=\{I_1,…I_N\}$ (которые имеют последовательность или контекст, но игнорируются C), принадлежащими $K$ классам.
Data Science
Вопрос или проблема Я работаю над существенно несбалансированным набором данных для обнаружения мошенничества (класс 0: 284315 экземпляров, класс 1: 492 экземпляра) и пытаюсь правильно реализовать случайную недовыборку во время перекрестной проверки в Orange.
Data Science
Вопрос или проблема Как указано в заголовке, я пытаюсь кластеризовать огромный набор данных и делаю это с помощью sklearn.Birch, чтобы обучаться постепенно. Если бы это был небольшой набор данных, я мог бы просто использовать gridsearchcv.
Data Science
Вопрос или проблема Предположим, робот начинает с известной позиции, и у меня есть данные, получаемые от робота, когда он перемещается по сетке. Используя нюансы, зафиксированные в данных, например, намек на неравную скорость вращения колёс, указывающий
Data Science
Вопрос или проблема Я новичок в области Data Science. Я создал модель с использованием градиентного бустинга для прогнозирования цены на дом. Чтобы оценить свою модель, я разделил мой набор данных на тренировочный и тестовый (0.
Data Science
Вопрос или проблема Мы работаем с онлайн-рынком. Наша задача – предсказать, будут ли определенные продукты прибыльными для нашего рынка в ближайшем будущем (горизонт – один месяц). Например, рассмотрим 2 продукта: Игрушка Жираф (предсказана неприбыльной)
Data Science
Вопрос или проблема Я хочу узнать, в чем разница между этими двумя. Для меня они выполняют одну и ту же функцию, поэтому я не вижу причины для существования двух одинаковых функций. В TensorFlow 2 они принимают различные аргументы: tf.
Data Science
Вопрос или проблема Я работаю над алгоритмом MedSAM (Segment Anything in Medical Images). Это тонко настроенная версия модели Segment Anything от Meta AI для медицинских изображений. В статье его функция потерь задается как невзвешенная сумма бинарной
Data Science
Вопрос или проблема Я хочу задать некоторую вероятностную модель кластеризации (например, смешанную модель или LDA) для слов, и вместо использования традиционного метода представления слов в виде вектора-индикатора я хочу использовать соответствующие
Data Science
Вопрос или проблема Создайте тензор Y формы (2,3) содержащий последовательность чисел 12,15,18,…, 150 Я попробовал использовать следующий код tf.constant(np.arange(12,153,3),dtype=tf.dtypes.float32,shape=[2,3]) Я получил ошибку о том, что тензор
Data Science
Вопрос или проблема Я выполняю обнаружение аномалий на различных наборах данных и подумал сначала кластеризовать набор данных и отправить каждый кластер в разные модели обнаружения аномалий. Я использую HDBSCAN, и в моем тестовом наборе данных я получаю