machine-learning - ответы на вопросы - Page 3 of 48

Data Science

00

Вопрос или проблема Я выполняю обнаружение аномалий на различных наборах данных и подумал сначала кластеризовать набор данных и отправить каждый кластер в разные модели обнаружения аномалий. Я использую HDBSCAN, и в моем тестовом наборе данных я получаю

Data Science

Фиктивные переменные для невидимых данных в R

00

Вопрос или проблема У меня возникла следующая проблема: когда я обучал свою модель, я создал фиктивные переменные (до разделения на тренировочную и тестовую выборки) следующим образом: dummy <- dummyVars(formula = CLASS_INV ~ .

Data Science

Преобразовать задачу многоклассовой классификации в многометочную проблему.

00

Вопрос или проблема Я нашел этот вопрос, но мне нужен ответ в другом направлении. Пример: Предположим, мы хотим предсказать, захочет ли человек с определенным профилем купить продукт A и/или B. Итак, у нас есть 2 бинарных класса A и B, которые не исключают

Data Science

Машинное обучение с одним графом на запись

00

Вопрос или проблема У меня есть набор из 100k графов G, каждый граф имеет связанный результат y (вещественное число). Каждый граф содержит от 10 до 10000 узлов. Каждый узел имеет от 2 до 20 направленных ребер и 6 категориальных атрибутов.

Data Science

Как изменить размер изображений MNIST, чтобы они соответствовали модели AlexNet

00

Вопрос или проблема Я использую API keras для загрузки датасета MNIST. Моя проблема в том, что мне нужно использовать AlexNet в качестве алгоритма. Понимая модель AlexNet, мне необходимо начинать с изображений размером 227×

Data Science

Онлайн против мини-пакетного обучения для скорости

00

Вопрос или проблема Если я обучаюсь онлайн в условиях, где у меня есть ОГРОМНОЕ количество данных, будет ли это быстрее, чем минибатчевое обучение (даже если я оптимизирую размер батча для использования GPU, то есть использую кратное 32 количество примеров на минибатч)?

Data Science

Обработка набора данных для ASR

00

Вопрос или проблема Я работаю над тонкой настройкой модели Whisper от OpenAI для преобразования речи на непальском языке в текст в рамках моего проекта, но столкнулся с несколькими препятствиями и был бы признателен за любые советы или рекомендации от этого сообщества!

Data Science

Для отбора признаков используем ли мы критерий хи-квадрат вместе с взаимной информацией?

00

Вопрос или проблема Или мы выбираем только один из двух для категориальных данных. Обычно отбор признаков осуществляется с использованием взаимной информации, корреляции или условной энтропии. Мне не известны статистические тесты, такие как хи-квадрат

Data Science

Метрики для представления результата RNN/LSTM

00

Вопрос или проблема Я работаю над двумя различными архитектурами на основе модели LSTM для прогнозирования следующего действия пользователя на основе предыдущих действий. Мне интересно, какой лучший способ представить результат?

Data Science

Извлечение информации с соответствующими полями.

00

Вопрос или проблема У меня есть большой объем отсканированных документов округа. Мне нужно извлечь информацию, такую как заголовок документа, имя и адрес заемщика, имя и адрес кредитора и т.д. Текст выглядит так: Пример: доверенность на имя, между abc

Data Science

Помогите! Обработка набора данных для ASR?

00

Вопрос или проблема Я работаю над тонкой настройкой модели Whisper от OpenAI для перевода речи на непальский текст в рамках моего проекта, но столкнулся с некоторыми трудностями и буду признателен за любые рекомендации или предложения от этого сообщества!

Data Science

Версия перцептрона

00

Вопрос или проблема Если мы изменим условие $ywx<0$ (для выполнения обновления) на $ywx<1$, как в SVM (но без добавления регуляризации для максимизации отступа), будет ли какая-либо разница по сравнению с базовым персептроном (тот самый с вышеупомянутым условием $ywx<

Data Science

Оптимизация дерева решений

00

Вопрос или проблема У меня есть вопрос относительно техники/технологии, которую можно применить для этой задачи: Предположим, у меня есть правило-базированное дерево или дерево решений, которое предсказывает переменную Y на основе переменных A, B, C.

Data Science

Генерация временных рядов – многомерные данные временных рядов

00

Вопрос или проблема Отказ от ответственности: Математики, пожалуйста, не сердитесь на меня за использование некоторых терминов в этом посте. Я инженер. 🙂 Предыстория: Итак, я в настоящее время работаю над задачей, где мне нужно сгенерировать последовательность

Data Science

Моделирование оптимизации расписания публикаций в социальных сетях

00

Вопрос или проблема Проблема: Я хочу максимизировать эффективность постов в социальных сетях, оптимизируя время их публикации. Текущая модель: X: publishing_datetime, post_attribute_1, ..., post_attribute_n y: performance Желаемая модель: X: post_attribute_1, .

Программное обеспечение

Какой самый простой, легковесный, но полный и на 100% с открытым исходным кодом набор инструментов для MLOps?

00

Вопрос или проблема Я знаю, что этот вопрос задавали много раз и в разных формах. Существует множество блогов, статей, видео и курсов, которые рассматривают его и сравнивают сотни инструментов, библиотек, фреймворков… И это часть моей проблемы

Data Science

Восстановление целочисленной функции с помощью *-обучения

00

Вопрос или проблема У меня следующая проблема. Из технической модели у нас есть функция $f(n,p)$, приближающая время выполнения. Функция $f$ отображает $$ f: \mathbb{N} \times \mathbb{P} \to \mathbb{R}_{+} $$ где $\mathbb{P} = \{1,\ldots,50\} \subset\mathbb{N}$.

Data Science

Насколько “нормальными” должны быть мои входные данные?

00

Вопрос или проблема Когда я обучаю нейронную сеть, я понимаю ценность нормализации входных данных до значения средней = 0 и стандартного отклонения = 1 (стандартизации данных). Но я часто вижу, что люди делают данные еще более “

Data Science

Расширяет ли knn обучающую выборку за счет тестовых значений во время предсказания?

00

Вопрос или проблема Допустим, у меня есть 100 значений в моем наборе данных, и я разделяю их: 80% для обучения и 20% для теста. Когда я предсказываю последнее значение, основан ли прогноз на предыдущих 99 (80 тестовых + 19 уже предсказанных значений)

Data Science

00

Вопрос или проблема Я пытаюсь понять статью о рекомендательной системе Youtube: https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf Однако в модели генерации кандидатов размер выхода softmax фиксирован.