Data Science

Как справляться с ухудшением производительности из-за передачи доменов в данных

00

Вопрос или проблема Я обучаю классификационную сверточную нейронную сеть (CNN) на размеченном наборе данных $\langle x,y\rangle$. Сеть достигает 0.92% точности на тестовых и валидационных наборах. После этого процесса я предварительно обрабатываю данные

Data Science

Ошибка значения: неопределенность кардинальности данных: (Jupyter Notebook)

00

Вопрос или проблема Я создаю OCR для считывания текста со счетчиков воды. Я сталкиваюсь с указанной выше ошибкой, когда пытаюсь подогнать модель машинного обучения. Я использую библиотеку Python segmentation_models. BACKBONE = 'resnet34' preprocess_input = sm.

Data Science

Глубокий выбор признаков, специфичных для кластеров

00

Вопрос или проблема Как указано в заголовке, мне интересно, существует ли работа по достижению отбора признаков на основе кластера, к которому принадлежит точка данных (например, каждый кластер имеет свой набор выбранных признаков).

Data Science

Индекс стабильности населения против Индекса точности населения

00

Вопрос или проблема Может ли кто-нибудь объяснить мне разницу между Индексом Стабильности Популяции (PSI) и Индексом Точности Популяции (PAI)? Стабильность популяции относится к тому, изменяется ли распределение объясняющих переменных со временем.

Data Science

Классификатор с единственным значением 1 на год

00

Вопрос или проблема Предположим, я хочу определить вероятности победы в категории лучший фильм на Оскарах. Я знаю следующие правила: В каждом году есть только 1 победитель. Логически, сумма предсказанных вероятностей для каждого года должна составлять 1.

Data Science

Как улучшить мой классификатор?

00

Вопрос или проблема Я обучаю нелинейный классификатор для многослойной задачи классификации. Я подготавливаю обучающие данные в виде отображения пар целых координат (x1, x2) в целое число от нуля до трех. Для каждой пары координат x1/x2 я генерирую 5000

Data Science

Сколько нечестных пользователей будет заблокировано, чтобы остановить одно мошенничество, исходя из данной матрицы ошибок?

00

Вопрос или проблема Один из вопросов недавнего онлайн-теста, на который я не смог ответить, выглядит следующим образом (я не смог скопировать точный вопрос, поэтому это полностью из памяти. Прошу прощения за возможные неточности в формулировке.

Data Science

Дифференцируемая функция потерь для задачи ранжирования в регрессионной модели

00

Вопрос или проблема В задаче регрессии нам может потребоваться функция потерь для измерения относительной точности ранжирования между целевыми значениями $y$ и предсказанными значениями $y_{pred}$. Очевидно, что простая MSE не учитывает такие ранговые отношения.

Data Science

Список образцов, на которых обучается каждое дерево в случайном лесу в Scikit-Learn

00

Вопрос или проблема В случайном лесу Scikit-learn вы можете установить bootstrap=True, и каждое дерево выберет подмножество образцов для обучения. Есть ли способ увидеть, какие образцы используются в каждом дереве? Я ознакомился с документацией о деревьях-оценках

Data Science

Как использовать μ и σ вариационного автоэнкодера с созданным пользователем z?

00

Вопрос или проблема По моему пониманию, VAE, в отличие от автокодировщиков, не дает вам непосредственно дискретное кодирование (латентные векторы кодов n-мерности); вместо этого он предоставляет и mu, и sigma (n-мерные вектора средних и n-мерные вектора стандартных отклонений).

Data Science

CNN не может предсказать изображения за пределами набора данных.

00

Вопрос или проблема Я использую набор данных CelebA для обучения своей модели CNN для обнаружения ключевых точек на лицах. Вот моя модель class LandmarkModel: def __init__(self, inp_shape): self.model = models.Sequential() self.

Data Science

Регрессия в машинном обучении для скошенных данных

00

Вопрос или проблема Я пытаюсь построить простую регрессионную модель для начала, но моя переменная Y сильно смещена вправо. Моя Y представляет собой количество просмотров в день для веб-страницы, и все значения выше 0. У меня есть 4 крупных выброса со

Data Science

Почему Standard Scaler рекомендуется для нормально распределенных данных?

00

Вопрос или проблема Я часто читаю рекомендации использовать StandardScaler для нормально распределенных данных, в противном случае – MinMax Scaling. Например, ответы здесь. Интересно узнать причины/математику, стоящую за этим.

Data Science

Анализ планировки этажей

00

Вопрос или проблема Имея изображение плана этажа, существует ли известный алгоритм, который я могу использовать для определения размеров всех квартир? (например, это означает, что на приложенной картинке я должен понять, что есть 4 квартиры, и считать

Data Science

Работа с несколькими экземплярами конкретной целевой функции в большом наборе данных.

00

Вопрос или проблема У меня есть данные о машине, которая включает в себя различные компоненты. Все детали взаимодействуют, данные отслеживаются для этих частей, учитывается потребление энергии и множество других измерений, связанных с их характеристиками.

Data Science

Предсказание следующего числа в последовательности – анализ данных

00

Вопрос или проблема Я новичок в машинном обучении и работаю над проектом, где мне дана последовательность целых чисел, все из которых находятся в диапазоне от 0 до 70. Моя цель — предсказать следующее целое число в последовательности, зная предыдущие

Data Science

Проект по обработке русского языка: поиск релевантного набора данных

00

Вопрос или проблема Я ищу набор данных, связанный с банковской промышленностью, который включает следующую информацию: жалобы, управление счетами, переводы денег и ответы клиентов на акции. Я пытался найти такой набор данных на Kaggle, но не нашел ни

Data Science

Применение модели к невидимым данным (теоретический вопрос)

00

Вопрос или проблема Какие существуют хорошие способы расширить модель машинного обучения новой классом без переобучения всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время supervised обучения Предположим

Data Science

Правильный подход к использованию классовых меток в данных клеточной визуализации

00

Вопрос или проблема В рамках группового проекта в университете нам предоставлены серии видео с культурами клеток за 24-часовой период. У ряда этих клеток (клетки “нокаут”) был удален определенный ген, который часто отсутствует или мутирован при злокачественности.

Data Science

Как мне агрегировать данные для построения модели? Я боюсь вычислить среднее средних.

00

Вопрос или проблема Здравствуйте, Спасибо, что нашли время помочь мне с этим. Я работаю с необработанным набором данных и нуждаюсь в руководстве по агрегации данных для построения модели, которая предсказывает значение столбца “