Data Science
не удается импортировать имя ‘LSHForest’ из ‘sklearn.neighbors’
00
Вопрос или проблема from sklearn.neighbors import NearestNeighbors, LSHForest ImportError: невозможно импортировать имя 'LSHForest' из 'sklearn.neighbors' Я узнал, что LSHForest устарел. Как я могу его использовать? Есть ли у нас другие альтернативы.
Data Science
Перцептрон – Какую ступенчатую функцию выбрать
00
Вопрос или проблема Я изучаю алгоритм Перцептрон. Некоторые книги используют следующую ступенчатую функцию: 1, если x>=0, иначе -1 где x — это скалярное произведение между весами w и образцом x. Другие книги используют: 1, если x>
Data Science
Значения потерь, похоже, колеблются, но веса верные.
00
Вопрос или проблема Я делаю свои первые шаги с tensorflow (и в машинном обучении в целом) и использую этот код для тренировки очень простой модели, которая пытается найти основное линейное соотношение: f(x,y) = 4x + 7y –
Data Science
Размер обучающего набора данных в контексте компьютерного зрения
00
Вопрос или проблема В общем, для обучения модели машинного обучения размер обучающей выборки должен быть больше количества предикторов. Для нейронной сети или даже модели глубокого обучения количество параметров обычно составляет десятки тысяч или даже миллионы.
Data Science
В какой степени чистая математика используется в анализе данных и машинном обучении?
00
Вопрос или проблема В какой мере чистая математика используется в области Data Science и машинного обучения? Я пришел из области чистой математики и недавно переключился на сферу Data Science. Однако я довольно разочарован, так как всё, что я делаю, –
Data Science
Расчет метрики важности в случайном лесе: Почему бы нам не удалить переменную, вместо того чтобы перетасовывать её значения?
00
Вопрос или проблема Метрика важности в случайных лесах – это способ определения значимости предикторной переменной в модели. Она делает это, случайным образом перемешивая значения одной предикторной переменной за раз и наблюдая, как это влияет на
Data Science
Как создать классификатор на основе данных с сенсоров?
00
Вопрос или проблема Я работаю над локализацией в помещении на основе магнитометра. У меня есть 9 отдельных наборов временных рядов с показаниями датчиков, взятыми с координат 00, 01, 02, 10, 11 и так далее до 22. В основном я использую свою собственную
Data Science
Разница в производительности Sigmoid vs. Softmax
00
Вопрос или проблема Для той же задачи бинарной классификации изображений, если на последнем слое я использую 1 узел с Sigmoid активацией и binary_crossentropy функцией потерь, процесс обучения проходит довольно гладко (92% точности после 3 эпох на валидационных данных).
Data Science
Использование различных метрик для обучения и валидации
00
Вопрос или проблема Существует ли теоретическое обоснование для использования другой метрики на валидационном наборе для выбора модели, чем та, которая использовалась для обучения? Например, можно обучить модель, используя какой-либо тип дифференцируемой потери (т.
Data Science
Кластеризация без информации об идентификаторе
00
Вопрос или проблема У меня есть набор данных с различными продуктами и бинарным значением, было ли оно продано в магазине или нет. Он выглядит следующим образом: product_id store_1 store_2 store_3 store_4 store_5 store_6 A 1 0 0 1 0 1 B 1 1 0 0 1 0 Существует
Data Science
Как использовать scikit-learn для извлечения признаков из текста, если у меня есть только положительные и неразмеченные данные?
00
Вопрос или проблема Я ищу что-то похожее на это https://scikit-learn.org/stable/auto_examples/text/plot_document_classification_20newsgroups.html#sphx-glr-auto-examples-text-plot-document-classification-20newsgroups-py Но вместо положительных и отрицательных
Data Science
Почему в Keras только три типа слоёв внимания?
00
Вопрос или проблема Библиотека Keras содержит всего 3 типа внимания – слои внимания Keras, а именно: Слой MultiHeadAttention Слой Attention Слой AdditiveAttention Тем не менее, в теории существует множество типов внимания, например (некоторые из
Data Science
Насколько важен поиск с предвосхищением в деревьях решений?
00
Вопрос или проблема Я использую случайные леса, и в моих данных существует много ситуаций, когда $X_1$ является плохим предиктором, $X_2$ является плохим предиктором, но совместное распределение может быть хорошим предиктором.
Data Science
Существует ли база данных текстового сходства для фраз?
00
Вопрос или проблема Я хочу обучить свое приложение для оценки схожести фраз. Я хочу, чтобы моя модель предсказывала коэффициент схожести для фраз, как показано в приведенных ниже примерах. пример- International Business Machines = I.
Data Science
IDE для рабочего процесса машинного обучения – AWS SageMaker
00
Вопрос или проблема Похоже, что мы на самом деле не используем IDE на любом этапе рабочего процесса машинного обучения, если используем AWS SageMaker. Вся работа выполняется в Jupyter Notebook. Это так? Jupyter Notebook можно рассматривать как интегрированную среду разработки (IDE).
Data Science
Хранить данные в хранилище или нет?
00
Вопрос или проблема Мне было интересно, не будете ли вы так любезны помочь мне с быстрым вопросом (с удовольствием объясню больше, если вы пожелаете…). Я исследую и настраиваю систему для выполнения задачи машинного обучения (обучения), чтобы выявить
Data Science
Как предотвратить обновление предобученной модели, если модель оптимизирована с помощью обратного распространения в Pytorch?
00
Вопрос или проблема Я использую Pytorch исключительно для разработки своей модели, и вот составные части моей модели и как она работает: Генератор Кодировщик: предобученный, его обновление не должно производиться. Функция потерь.
Data Science
Существует ли модель, которая может предсказывать непрерывные данные, одновременно предоставляя уровень доверия к прогнозу?
00
Вопрос или проблема Проблема с байесовской нейронной сетью, похоже, заключается в том, что она в основном работает для задач классификации. Возможно ли адаптировать эту нейронную сеть или даже использовать другую модель, если таковая существует, для прогнозирования
Data Science
Метрика регрессии для набора данных с широким диапазоном значений целевой переменной.
00
Вопрос или проблема У меня есть набор данных из около 100 изображений. Каждое изображение имеет метку, которая является числовым значением. Модели должны учиться на изображениях, чтобы предсказывать числовые метки. Однако проблема в том, что я не знаю
Data Science
Создание дендрограмм онлайн с импортированным файлом CSV
00
Вопрос или проблема Существует ли сайт, который выполняет иерархическую кластеризацию на импортированном файле, таком как CSV, для генерации дендрограмм или матриц сходства? Бесплатные или платные — не имеет значения. Пока я нашел heatmapper.