Data Science

Какова ожидаемая структура данных для pred и gt в model.loss(gt, pred) в модели YOLO?

00

Вопрос или проблема У меня есть pred_targets = self.model(images) pred_boxes = pred_container.data pred_scores = pred_container.conf pred_labels = pred_container.cls gt = (boxes.to(self.device), classes.to(self.device)) pred = (pred_boxes[:, :4], pred_scores

Data Science

Функция потерь в алгоритме MedSAM

00

Вопрос или проблема Я работаю над алгоритмом MedSAM (Segment Anything in Medical Images). Это тонко настроенная версия модели Segment Anything от Meta AI для медицинских изображений. В статье его функция потерь задается как невзвешенная сумма бинарной

Data Science

Важность признаков в CNN

00

Вопрос или проблема Я могу использовать shap для извлечения важных признаков для Dense NN. Однако для CNN я столкнулся с двумя проблемами: порядок признаков может быть изменен или объединен после фильтрации и пуллинга. Могу ли я все еще использовать shap

Data Science

Вопрос о бутстреп-выборке

00

Вопрос или проблема У меня есть корпус вручную аннотированных (так называемый “золотой стандарт”) документов и коллекция аннотаций систем обработки естественного языка (NLP) на тексте из корпуса. Я хочу провести выборку систем и золотого стандарта

Data Science

Обработка векторных представлений слов как многомерные гауссовские случайные величины

00

Вопрос или проблема Я хочу задать некоторую вероятностную модель кластеризации (например, смешанную модель или LDA) для слов, и вместо использования традиционного метода представления слов в виде вектора-индикатора я хочу использовать соответствующие

Data Science

Запуск model.fit несколько раз для LSTM?

00

Вопрос или проблема У меня есть данные гистограмм временных рядов от множества отдельных запусков машин (подробности см. в этом посте). Я работаю над обучением LSTM с целью предсказать финальную гистограмму в запуске машины, основываясь на прошлых данных гистограммы.

Data Science

Создайте тензор последовательности с заданной формой с использованием TensorFlow.

00

Вопрос или проблема Создайте тензор Y формы (2,3) содержащий последовательность чисел 12,15,18,…, 150 Я попробовал использовать следующий код tf.constant(np.arange(12,153,3),dtype=tf.dtypes.float32,shape=[2,3]) Я получил ошибку о том, что тензор

Data Science

Как дополнительно настроить трансформерную NLP-модель на специфическом для области наборе данных после общей настройки.

00

Вопрос или проблема Я хотел бы донастроить предварительно обученную модель типа BERT для задачи анализа семантического сходства в манере задачи SNLI/MNLI (т.е. классифицировать пары предложений на «заключение» или «противоречие»).

Data Science

Бинарная + Нейтральная Классификация

00

Вопрос или проблема У меня есть набор данных постов для анализа настроений, которые помечены как -1 (негативные), 1 (позитивные) или 0 (нейтральные). Я задумываюсь над тем, как с этим работать. Вот мои идеи: создать мультиклассовый классификатор: я пробовал

Data Science

Кластеризация временных рядов на основе монотонного сходства

00

Вопрос или проблема Контекст Я занимаюсь задачей кластеризации 1500 временных рядов из 500 наблюдений в несколько кластеров. Временные ряды обладают одинаковыми наблюдаемыми свойствами в разных пространственных положениях, но реагируют на одни и те же экзогенные переменные.

Data Science

Исследование воздействия аддитивного гауссового шума на классификацию сигналов ЭЭГ: анализ взаимосвязи между дополненными и оригинальными данными.

00

Вопрос или проблема Определение: Я проводил исследование по классификации сигналов ЭЭГ, сосредотачиваясь на различении двух разных классов с использованием сырых сигналов ЭЭГ. Недостаточная доступность данных представляет собой значительную проблему в

Data Science

Динамическая кластеризация

00

Вопрос или проблема Я выполняю обнаружение аномалий на различных наборах данных и подумал сначала кластеризовать набор данных и отправить каждый кластер в разные модели обнаружения аномалий. Я использую HDBSCAN, и в моем тестовом наборе данных я получаю

Data Science

Фиктивные переменные для невидимых данных в R

00

Вопрос или проблема У меня возникла следующая проблема: когда я обучал свою модель, я создал фиктивные переменные (до разделения на тренировочную и тестовую выборки) следующим образом: dummy <- dummyVars(formula = CLASS_INV ~ .

Data Science

Преобразовать задачу многоклассовой классификации в многометочную проблему.

00

Вопрос или проблема Я нашел этот вопрос, но мне нужен ответ в другом направлении. Пример: Предположим, мы хотим предсказать, захочет ли человек с определенным профилем купить продукт A и/или B. Итак, у нас есть 2 бинарных класса A и B, которые не исключают

Data Science

Как мы можем использовать временные ряды данных и данные без временной составляющей вместе в модели классификации машинного обучения?

00

Вопрос или проблема У меня есть набор данных (IoT носимый набор данных), состоящий из временных рядов и целочисленных данных; цель моей задачи — использовать набор данных для классификации. Хотя текущие библиотеки в sktime принимают многомерные временные

Data Science

Почему LinearRegressionWithSGD в Spark работает очень медленно локально?

00

Вопрос или проблема Я уже некоторое время пытаюсь запустить линейную регрессию с помощью SGD, которая находится в Spark mllib, и испытываю огромные проблемы с производительностью. Все примеры, которые я рассматривал, имеют число итераций, равное 100

Data Science

Машинное обучение с одним графом на запись

00

Вопрос или проблема У меня есть набор из 100k графов G, каждый граф имеет связанный результат y (вещественное число). Каждый граф содержит от 10 до 10000 узлов. Каждый узел имеет от 2 до 20 направленных ребер и 6 категориальных атрибутов.

Data Science

Кривые обучения – весь набор данных или только обучающий набор данных?

00

Вопрос или проблема Может ли кто-нибудь объяснить, следует ли строить кривые обучения, используя весь набор данных (все X и все y) или только учебный набор данных (X_train и y_train)? Предположим, это регрессионная задача: что вы отображаете, так это

Data Science

Как изменить размер изображений MNIST, чтобы они соответствовали модели AlexNet

00

Вопрос или проблема Я использую API keras для загрузки датасета MNIST. Моя проблема в том, что мне нужно использовать AlexNet в качестве алгоритма. Понимая модель AlexNet, мне необходимо начинать с изображений размером 227×

Data Science

Онлайн против мини-пакетного обучения для скорости

00

Вопрос или проблема Если я обучаюсь онлайн в условиях, где у меня есть ОГРОМНОЕ количество данных, будет ли это быстрее, чем минибатчевое обучение (даже если я оптимизирую размер батча для использования GPU, то есть использую кратное 32 количество примеров на минибатч)?