Data Science
Data Science
Вопрос или проблема Я обучаю классификационную сверточную нейронную сеть (CNN) на размеченном наборе данных $\langle x,y\rangle$. Сеть достигает 0.92% точности на тестовых и валидационных наборах. После этого процесса я предварительно обрабатываю данные
Data Science
Вопрос или проблема Я создаю OCR для считывания текста со счетчиков воды. Я сталкиваюсь с указанной выше ошибкой, когда пытаюсь подогнать модель машинного обучения. Я использую библиотеку Python segmentation_models. BACKBONE = 'resnet34' preprocess_input = sm.
Data Science
Вопрос или проблема Как указано в заголовке, мне интересно, существует ли работа по достижению отбора признаков на основе кластера, к которому принадлежит точка данных (например, каждый кластер имеет свой набор выбранных признаков).
Data Science
Вопрос или проблема Может ли кто-нибудь объяснить мне разницу между Индексом Стабильности Популяции (PSI) и Индексом Точности Популяции (PAI)? Стабильность популяции относится к тому, изменяется ли распределение объясняющих переменных со временем.
Data Science
Вопрос или проблема Предположим, я хочу определить вероятности победы в категории лучший фильм на Оскарах. Я знаю следующие правила: В каждом году есть только 1 победитель. Логически, сумма предсказанных вероятностей для каждого года должна составлять 1.
Data Science
Вопрос или проблема Я обучаю нелинейный классификатор для многослойной задачи классификации. Я подготавливаю обучающие данные в виде отображения пар целых координат (x1, x2) в целое число от нуля до трех. Для каждой пары координат x1/x2 я генерирую 5000
Data Science
Вопрос или проблема Один из вопросов недавнего онлайн-теста, на который я не смог ответить, выглядит следующим образом (я не смог скопировать точный вопрос, поэтому это полностью из памяти. Прошу прощения за возможные неточности в формулировке.
Data Science
Вопрос или проблема В задаче регрессии нам может потребоваться функция потерь для измерения относительной точности ранжирования между целевыми значениями $y$ и предсказанными значениями $y_{pred}$. Очевидно, что простая MSE не учитывает такие ранговые отношения.
Data Science
Вопрос или проблема В случайном лесу Scikit-learn вы можете установить bootstrap=True, и каждое дерево выберет подмножество образцов для обучения. Есть ли способ увидеть, какие образцы используются в каждом дереве? Я ознакомился с документацией о деревьях-оценках
Data Science
Вопрос или проблема По моему пониманию, VAE, в отличие от автокодировщиков, не дает вам непосредственно дискретное кодирование (латентные векторы кодов n-мерности); вместо этого он предоставляет и mu, и sigma (n-мерные вектора средних и n-мерные вектора стандартных отклонений).
Data Science
Вопрос или проблема Я использую набор данных CelebA для обучения своей модели CNN для обнаружения ключевых точек на лицах. Вот моя модель class LandmarkModel: def __init__(self, inp_shape): self.model = models.Sequential() self.
Data Science
Вопрос или проблема Я пытаюсь построить простую регрессионную модель для начала, но моя переменная Y сильно смещена вправо. Моя Y представляет собой количество просмотров в день для веб-страницы, и все значения выше 0. У меня есть 4 крупных выброса со
Data Science
Вопрос или проблема Я часто читаю рекомендации использовать StandardScaler для нормально распределенных данных, в противном случае – MinMax Scaling. Например, ответы здесь. Интересно узнать причины/математику, стоящую за этим.
Data Science
Вопрос или проблема Имея изображение плана этажа, существует ли известный алгоритм, который я могу использовать для определения размеров всех квартир? (например, это означает, что на приложенной картинке я должен понять, что есть 4 квартиры, и считать
Data Science
Вопрос или проблема У меня есть данные о машине, которая включает в себя различные компоненты. Все детали взаимодействуют, данные отслеживаются для этих частей, учитывается потребление энергии и множество других измерений, связанных с их характеристиками.
Data Science
Вопрос или проблема Я новичок в машинном обучении и работаю над проектом, где мне дана последовательность целых чисел, все из которых находятся в диапазоне от 0 до 70. Моя цель — предсказать следующее целое число в последовательности, зная предыдущие
Data Science
Вопрос или проблема Я ищу набор данных, связанный с банковской промышленностью, который включает следующую информацию: жалобы, управление счетами, переводы денег и ответы клиентов на акции. Я пытался найти такой набор данных на Kaggle, но не нашел ни
Data Science
Вопрос или проблема Какие существуют хорошие способы расширить модель машинного обучения новой классом без переобучения всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время supervised обучения Предположим
Data Science
Вопрос или проблема В рамках группового проекта в университете нам предоставлены серии видео с культурами клеток за 24-часовой период. У ряда этих клеток (клетки “нокаут”) был удален определенный ген, который часто отсутствует или мутирован при злокачественности.
Data Science
Вопрос или проблема Здравствуйте, Спасибо, что нашли время помочь мне с этим. Я работаю с необработанным набором данных и нуждаюсь в руководстве по агрегации данных для построения модели, которая предсказывает значение столбца “