Data Science
Кривая MAP для оценки процесса обучения Mask RCNN на синтетических данных
00
Вопрос или проблема Является ли MAP (Средняя Средняя Точность) хорошей заменой для измерения точности обучения и валидации на различных этапах обучения модели машинного обучения для обнаружения объектов? Я повторно обучаю Mask RCNN (предварительно обученный
Data Science
Использование KerasClassifier для обучения нейронной сети
00
Вопрос или проблема Я создал простую нейронную сеть для бинарной классификации текста (спам/неспам) с использованием предобученного трансформера BERT. Текущая реализация на чистом Keras работает нормально. Однако я хотел построить график некоторых метрик
Вопросы и ответы
Промышленности RAG технологии
00
Вопрос или проблема Как технологии RAG могут улучшить уход за пациентами, извлекая актуальные медицинские исследования и генерируя индивидуализированные рекомендации по лечению? Как технологии RAG могут улучшить уход за пациентами, извлекая актуальные
Data Science
Нужно ли использовать AUPRC для отчетности о результатах классификации на несбалансированном наборе данных, если модель была обучена с использованием увеличения выборки и кросс-валидации?
00
Вопрос или проблема Я работаю над задачей бинарной классификации, в которой в датасете содержится около 5% положительных классов. Я разделил датасет на 70% для обучения и 30% для тестирования. Я использовал тестовые данные только один раз для оценки производительности модели.
Data Science
Как построить необbiased предсказательную модель машинного обучения, когда количество записей события меньше по сравнению с общим количеством записей?
00
Вопрос или проблема Я пытаюсь создать модель, которая будет предсказывать потерю связи беспроводного устройства. На данный момент я использую RandomForestClassifier, а также в качестве признаков – устройство и местоположение.
Data Science
Можно ли заменить категориальные данные на числа в задачах классификации?
00
Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.
Data Science
ValueError: Найдены входные переменные с несовпадающим количеством образцов: [6, 366]
00
Вопрос или проблема Я пытаюсь разделить свои x и y на обучающие и тестовые данные для моей модели машинного обучения, но получаю эту ошибку: ValueError: Найдены входные переменные с непоследовательным количеством образцов: [6, 366].
Data Science
Как использовать новый набор данных на предобученной модели нейронной сети?
00
Вопрос или проблема Я собрал набор данных, который хотел бы передать предобученной модели для выполнения некоторых прогнозов. Я ищу несколько шагов/процессов, которые могли бы направить меня в этом. Должен ли я дообучить? Если да, то что именно нужно дообучить?
Data Science
Сократите длину данных для эффективного обучения.
00
Вопрос или проблема У меня есть данные о покупках клиентов, в которых каждая строка указывает на товар, купленный клиентом. Проблема в том, что даже если клиент одновременно покупает пять товаров, то для этого будет пять разных строк, и в результате общее
Data Science
Будут ли особенности на изображении (края, цвет и т.д.) влиять на производительность сферических k-средних?
00
Вопрос или проблема Я совсем нов в машинном обучении, недавно я реализовал сферические k-средние, но в конечном итоге нашел интересный момент в результате. Я использовал четыре набора данных: MINST, CIFAR-10, Fashion-MNST и SVHN. Я следовал статье “
Data Science
AdaGrad: Интуиция
00
Вопрос или проблема Формула обновления для Adagrad следующая: \begin{equation} w^i(t)=w^i(t-1) -\frac{\eta}{\sqrt{\epsilon +\sum_{1}^t |\nabla_i\mathcal{L}|^2} } \nabla_i\mathcal{L} \end{equation} Это указывает на то, что если накопленный градиент велик
Вопросы и ответы
Какова новая библиотека вместо устаревшего tensorflow.keras.preprocessing.image.ImageDataGenerator?
00
Вопрос или проблема Библиотека ImageDataGenerator устарела. dataGen= ImageDataGenerator(width_shift_range=0.1, # 0.1 = 10% ЕСЛИ БОЛЬШЕ 1, НАПРИМЕР 10, ТО ЭТО ОТНОСИТСЯ К КОЛИЧЕСТВУ ПИКСЕЛЕЙ, НАПРИМЕР 10 ПИКСЕЛЕЙ height_shift_range=0.
Data Science
Низкая дисперсия против высоких валидационных оценок
00
Вопрос или проблема Итак, я пытаюсь сравнить две модели, скажем, модель(1) имеет точность на обучении 90% и точность на валидации 86%, в то время как модель(2) имеет точность на обучении 87% и точность на валидации 85%. Теперь модель(1) имеет лучший результат
Data Science
Снизьте переобучение модели на одном подмножестве данных.
00
Вопрос или проблема У меня есть набор данных о продажах продуктов. В этом наборе данных есть случаи, когда происходят markdown-скидки. Исторически, обычно в данных ранее было 30% скидок, когда продукты продавались лучше, а комбинации скидок 30% и 50%
Data Science
Как использовать иерархическую переменную в модели машинного обучения
00
Вопрос или проблема Я работаю над задачей бинарной классификации с 1000 строками и 20 переменными. У меня есть такие переменные, как product_id, city, state, country, product family, product type, product segment и так далее. Как видно, большинство моих
Data Science
Pytorch CrossEntropyLoss ожидал long, но получил float.
00
Вопрос или проблема Вы провели исследование перед тем, как задать вопрос? Да. Я провел много поисков в интернете, и другие сталкивались с похожими проблемами. Их решением было использовать .float() при передаче в функцию потерь.
Data Science
Агрегация нескольких закодированных категориальных значений
00
Вопрос или проблема Я пытаюсь найти общепринятые техники для работы с многоценностными категориальными переменными с высокой кардинальностью. В данный момент я использую набор данных с признаком CATEGORY, который имеет кардинальность около 20,000.
Data Science
несбалансированные данные в обучающей и тестовой выборках
00
Вопрос или проблема У меня уже есть 2 набора данных. Один для обучения и один для тестирования. Оба набора данных несбалансированы (с похожими процентами), с около 90% метки 1. Будет ли полезно сбалансировать данные, если тестовый набор в любом случае очень несбалансирован?
Data Science
Пожалуйста, прокомментируйте моё предложение для выпускной работы (нужны предложения!!!)
00
Вопрос или проблема 🎗 Название Проекта Space Vet: Ветеринарные услуги и уход за виртуальными питомцами с использованием ИИ 🔗 Область Интересов (AOI), Домен, Фокус Исследования (RF), Кейсовое Исследование (CS) AOI: Аналитика Данных/Текстов (Искусственный
Вопросы и ответы
Цифры LCD 7-сегментов не распознаются правильно (CNN / MNIST)
00
Вопрос или проблема Я новичок в области компьютерного зрения и выбрал считывание с 7-сегментного дисплея LCD своей системы отопления в качестве первой задачи для изучения CNN. Я могу правильно считывать большинство чисел, но цифра 6 чаще всего распознается как 5.