machine-learning - ответы на вопросы - Page 8 of 28

Data Science

Кривая MAP для оценки процесса обучения Mask RCNN на синтетических данных

00

Вопрос или проблема Является ли MAP (Средняя Средняя Точность) хорошей заменой для измерения точности обучения и валидации на различных этапах обучения модели машинного обучения для обнаружения объектов? Я повторно обучаю Mask RCNN (предварительно обученный

Data Science

Использование KerasClassifier для обучения нейронной сети

00

Вопрос или проблема Я создал простую нейронную сеть для бинарной классификации текста (спам/неспам) с использованием предобученного трансформера BERT. Текущая реализация на чистом Keras работает нормально. Однако я хотел построить график некоторых метрик

Вопросы и ответы

Промышленности RAG технологии

00

Вопрос или проблема Как технологии RAG могут улучшить уход за пациентами, извлекая актуальные медицинские исследования и генерируя индивидуализированные рекомендации по лечению? Как технологии RAG могут улучшить уход за пациентами, извлекая актуальные

Data Science

Нужно ли использовать AUPRC для отчетности о результатах классификации на несбалансированном наборе данных, если модель была обучена с использованием увеличения выборки и кросс-валидации?

00

Вопрос или проблема Я работаю над задачей бинарной классификации, в которой в датасете содержится около 5% положительных классов. Я разделил датасет на 70% для обучения и 30% для тестирования. Я использовал тестовые данные только один раз для оценки производительности модели.

Data Science

Как построить необbiased предсказательную модель машинного обучения, когда количество записей события меньше по сравнению с общим количеством записей?

00

Вопрос или проблема Я пытаюсь создать модель, которая будет предсказывать потерю связи беспроводного устройства. На данный момент я использую RandomForestClassifier, а также в качестве признаков – устройство и местоположение.

Data Science

Можно ли заменить категориальные данные на числа в задачах классификации?

00

Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.

Data Science

ValueError: Найдены входные переменные с несовпадающим количеством образцов: [6, 366]

00

Вопрос или проблема Я пытаюсь разделить свои x и y на обучающие и тестовые данные для моей модели машинного обучения, но получаю эту ошибку: ValueError: Найдены входные переменные с непоследовательным количеством образцов: [6, 366].

Data Science

Как использовать новый набор данных на предобученной модели нейронной сети?

00

Вопрос или проблема Я собрал набор данных, который хотел бы передать предобученной модели для выполнения некоторых прогнозов. Я ищу несколько шагов/процессов, которые могли бы направить меня в этом. Должен ли я дообучить? Если да, то что именно нужно дообучить?

Data Science

Сократите длину данных для эффективного обучения.

00

Вопрос или проблема У меня есть данные о покупках клиентов, в которых каждая строка указывает на товар, купленный клиентом. Проблема в том, что даже если клиент одновременно покупает пять товаров, то для этого будет пять разных строк, и в результате общее

Data Science

Будут ли особенности на изображении (края, цвет и т.д.) влиять на производительность сферических k-средних?

00

Вопрос или проблема Я совсем нов в машинном обучении, недавно я реализовал сферические k-средние, но в конечном итоге нашел интересный момент в результате. Я использовал четыре набора данных: MINST, CIFAR-10, Fashion-MNST и SVHN. Я следовал статье “

Data Science

AdaGrad: Интуиция

00

Вопрос или проблема Формула обновления для Adagrad следующая: \begin{equation} w^i(t)=w^i(t-1) -\frac{\eta}{\sqrt{\epsilon +\sum_{1}^t |\nabla_i\mathcal{L}|^2} } \nabla_i\mathcal{L} \end{equation} Это указывает на то, что если накопленный градиент велик

Вопросы и ответы

Какова новая библиотека вместо устаревшего tensorflow.keras.preprocessing.image.ImageDataGenerator?

00

Вопрос или проблема Библиотека ImageDataGenerator устарела. dataGen= ImageDataGenerator(width_shift_range=0.1, # 0.1 = 10% ЕСЛИ БОЛЬШЕ 1, НАПРИМЕР 10, ТО ЭТО ОТНОСИТСЯ К КОЛИЧЕСТВУ ПИКСЕЛЕЙ, НАПРИМЕР 10 ПИКСЕЛЕЙ height_shift_range=0.

Data Science

Низкая дисперсия против высоких валидационных оценок

00

Вопрос или проблема Итак, я пытаюсь сравнить две модели, скажем, модель(1) имеет точность на обучении 90% и точность на валидации 86%, в то время как модель(2) имеет точность на обучении 87% и точность на валидации 85%. Теперь модель(1) имеет лучший результат

Data Science

Снизьте переобучение модели на одном подмножестве данных.

00

Вопрос или проблема У меня есть набор данных о продажах продуктов. В этом наборе данных есть случаи, когда происходят markdown-скидки. Исторически, обычно в данных ранее было 30% скидок, когда продукты продавались лучше, а комбинации скидок 30% и 50%

Data Science

Как использовать иерархическую переменную в модели машинного обучения

00

Вопрос или проблема Я работаю над задачей бинарной классификации с 1000 строками и 20 переменными. У меня есть такие переменные, как product_id, city, state, country, product family, product type, product segment и так далее. Как видно, большинство моих

Data Science

Pytorch CrossEntropyLoss ожидал long, но получил float.

00

Вопрос или проблема Вы провели исследование перед тем, как задать вопрос? Да. Я провел много поисков в интернете, и другие сталкивались с похожими проблемами. Их решением было использовать .float() при передаче в функцию потерь.

Data Science

Агрегация нескольких закодированных категориальных значений

00

Вопрос или проблема Я пытаюсь найти общепринятые техники для работы с многоценностными категориальными переменными с высокой кардинальностью. В данный момент я использую набор данных с признаком CATEGORY, который имеет кардинальность около 20,000.

Data Science

несбалансированные данные в обучающей и тестовой выборках

00

Вопрос или проблема У меня уже есть 2 набора данных. Один для обучения и один для тестирования. Оба набора данных несбалансированы (с похожими процентами), с около 90% метки 1. Будет ли полезно сбалансировать данные, если тестовый набор в любом случае очень несбалансирован?

Data Science

Пожалуйста, прокомментируйте моё предложение для выпускной работы (нужны предложения!!!)

00

Вопрос или проблема 🎗 Название Проекта Space Vet: Ветеринарные услуги и уход за виртуальными питомцами с использованием ИИ 🔗 Область Интересов (AOI), Домен, Фокус Исследования (RF), Кейсовое Исследование (CS) AOI: Аналитика Данных/Текстов (Искусственный

Вопросы и ответы

Цифры LCD 7-сегментов не распознаются правильно (CNN / MNIST)

00

Вопрос или проблема Я новичок в области компьютерного зрения и выбрал считывание с 7-сегментного дисплея LCD своей системы отопления в качестве первой задачи для изучения CNN. Я могу правильно считывать большинство чисел, но цифра 6 чаще всего распознается как 5.