Data Science
Как справляться с ухудшением производительности из-за передачи доменов в данных
00
Вопрос или проблема Я обучаю классификационную сверточную нейронную сеть (CNN) на размеченном наборе данных $\langle x,y\rangle$. Сеть достигает 0.92% точности на тестовых и валидационных наборах. После этого процесса я предварительно обрабатываю данные
Data Science
Ошибка значения: неопределенность кардинальности данных: (Jupyter Notebook)
00
Вопрос или проблема Я создаю OCR для считывания текста со счетчиков воды. Я сталкиваюсь с указанной выше ошибкой, когда пытаюсь подогнать модель машинного обучения. Я использую библиотеку Python segmentation_models. BACKBONE = 'resnet34' preprocess_input = sm.
Data Science
Глубокий выбор признаков, специфичных для кластеров
00
Вопрос или проблема Как указано в заголовке, мне интересно, существует ли работа по достижению отбора признаков на основе кластера, к которому принадлежит точка данных (например, каждый кластер имеет свой набор выбранных признаков).
Data Science
Индекс стабильности населения против Индекса точности населения
00
Вопрос или проблема Может ли кто-нибудь объяснить мне разницу между Индексом Стабильности Популяции (PSI) и Индексом Точности Популяции (PAI)? Стабильность популяции относится к тому, изменяется ли распределение объясняющих переменных со временем.
Data Science
Классификатор с единственным значением 1 на год
00
Вопрос или проблема Предположим, я хочу определить вероятности победы в категории лучший фильм на Оскарах. Я знаю следующие правила: В каждом году есть только 1 победитель. Логически, сумма предсказанных вероятностей для каждого года должна составлять 1.
Data Science
Как улучшить мой классификатор?
00
Вопрос или проблема Я обучаю нелинейный классификатор для многослойной задачи классификации. Я подготавливаю обучающие данные в виде отображения пар целых координат (x1, x2) в целое число от нуля до трех. Для каждой пары координат x1/x2 я генерирую 5000
Data Science
Сколько нечестных пользователей будет заблокировано, чтобы остановить одно мошенничество, исходя из данной матрицы ошибок?
00
Вопрос или проблема Один из вопросов недавнего онлайн-теста, на который я не смог ответить, выглядит следующим образом (я не смог скопировать точный вопрос, поэтому это полностью из памяти. Прошу прощения за возможные неточности в формулировке.
Data Science
Дифференцируемая функция потерь для задачи ранжирования в регрессионной модели
00
Вопрос или проблема В задаче регрессии нам может потребоваться функция потерь для измерения относительной точности ранжирования между целевыми значениями $y$ и предсказанными значениями $y_{pred}$. Очевидно, что простая MSE не учитывает такие ранговые отношения.
Data Science
Список образцов, на которых обучается каждое дерево в случайном лесу в Scikit-Learn
00
Вопрос или проблема В случайном лесу Scikit-learn вы можете установить bootstrap=True, и каждое дерево выберет подмножество образцов для обучения. Есть ли способ увидеть, какие образцы используются в каждом дереве? Я ознакомился с документацией о деревьях-оценках
Data Science
Как использовать μ и σ вариационного автоэнкодера с созданным пользователем z?
00
Вопрос или проблема По моему пониманию, VAE, в отличие от автокодировщиков, не дает вам непосредственно дискретное кодирование (латентные векторы кодов n-мерности); вместо этого он предоставляет и mu, и sigma (n-мерные вектора средних и n-мерные вектора стандартных отклонений).
Data Science
CNN не может предсказать изображения за пределами набора данных.
00
Вопрос или проблема Я использую набор данных CelebA для обучения своей модели CNN для обнаружения ключевых точек на лицах. Вот моя модель class LandmarkModel: def __init__(self, inp_shape): self.model = models.Sequential() self.
Data Science
Регрессия в машинном обучении для скошенных данных
00
Вопрос или проблема Я пытаюсь построить простую регрессионную модель для начала, но моя переменная Y сильно смещена вправо. Моя Y представляет собой количество просмотров в день для веб-страницы, и все значения выше 0. У меня есть 4 крупных выброса со
Data Science
Почему Standard Scaler рекомендуется для нормально распределенных данных?
00
Вопрос или проблема Я часто читаю рекомендации использовать StandardScaler для нормально распределенных данных, в противном случае – MinMax Scaling. Например, ответы здесь. Интересно узнать причины/математику, стоящую за этим.
Data Science
Анализ планировки этажей
00
Вопрос или проблема Имея изображение плана этажа, существует ли известный алгоритм, который я могу использовать для определения размеров всех квартир? (например, это означает, что на приложенной картинке я должен понять, что есть 4 квартиры, и считать
Data Science
Работа с несколькими экземплярами конкретной целевой функции в большом наборе данных.
00
Вопрос или проблема У меня есть данные о машине, которая включает в себя различные компоненты. Все детали взаимодействуют, данные отслеживаются для этих частей, учитывается потребление энергии и множество других измерений, связанных с их характеристиками.
Data Science
Предсказание следующего числа в последовательности – анализ данных
00
Вопрос или проблема Я новичок в машинном обучении и работаю над проектом, где мне дана последовательность целых чисел, все из которых находятся в диапазоне от 0 до 70. Моя цель — предсказать следующее целое число в последовательности, зная предыдущие
Data Science
Проект по обработке русского языка: поиск релевантного набора данных
00
Вопрос или проблема Я ищу набор данных, связанный с банковской промышленностью, который включает следующую информацию: жалобы, управление счетами, переводы денег и ответы клиентов на акции. Я пытался найти такой набор данных на Kaggle, но не нашел ни
Data Science
Применение модели к невидимым данным (теоретический вопрос)
00
Вопрос или проблема Какие существуют хорошие способы расширить модель машинного обучения новой классом без переобучения всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время supervised обучения Предположим
Data Science
Правильный подход к использованию классовых меток в данных клеточной визуализации
00
Вопрос или проблема В рамках группового проекта в университете нам предоставлены серии видео с культурами клеток за 24-часовой период. У ряда этих клеток (клетки “нокаут”) был удален определенный ген, который часто отсутствует или мутирован при злокачественности.
Data Science
Как мне агрегировать данные для построения модели? Я боюсь вычислить среднее средних.
00
Вопрос или проблема Здравствуйте, Спасибо, что нашли время помочь мне с этим. Я работаю с необработанным набором данных и нуждаюсь в руководстве по агрегации данных для построения модели, которая предсказывает значение столбца “