machine-learning
Data Science
Вопрос или проблема Я выполняю обнаружение аномалий на различных наборах данных и подумал сначала кластеризовать набор данных и отправить каждый кластер в разные модели обнаружения аномалий. Я использую HDBSCAN, и в моем тестовом наборе данных я получаю
Data Science
Вопрос или проблема У меня возникла следующая проблема: когда я обучал свою модель, я создал фиктивные переменные (до разделения на тренировочную и тестовую выборки) следующим образом: dummy <- dummyVars(formula = CLASS_INV ~ .
Data Science
Вопрос или проблема Я нашел этот вопрос, но мне нужен ответ в другом направлении. Пример: Предположим, мы хотим предсказать, захочет ли человек с определенным профилем купить продукт A и/или B. Итак, у нас есть 2 бинарных класса A и B, которые не исключают
Data Science
Вопрос или проблема У меня есть набор из 100k графов G, каждый граф имеет связанный результат y (вещественное число). Каждый граф содержит от 10 до 10000 узлов. Каждый узел имеет от 2 до 20 направленных ребер и 6 категориальных атрибутов.
Data Science
Вопрос или проблема Я использую API keras для загрузки датасета MNIST. Моя проблема в том, что мне нужно использовать AlexNet в качестве алгоритма. Понимая модель AlexNet, мне необходимо начинать с изображений размером 227×
Data Science
Вопрос или проблема Если я обучаюсь онлайн в условиях, где у меня есть ОГРОМНОЕ количество данных, будет ли это быстрее, чем минибатчевое обучение (даже если я оптимизирую размер батча для использования GPU, то есть использую кратное 32 количество примеров на минибатч)?
Data Science
Вопрос или проблема Я работаю над тонкой настройкой модели Whisper от OpenAI для преобразования речи на непальском языке в текст в рамках моего проекта, но столкнулся с несколькими препятствиями и был бы признателен за любые советы или рекомендации от этого сообщества!
Data Science
Вопрос или проблема Или мы выбираем только один из двух для категориальных данных. Обычно отбор признаков осуществляется с использованием взаимной информации, корреляции или условной энтропии. Мне не известны статистические тесты, такие как хи-квадрат
Data Science
Вопрос или проблема Я работаю над двумя различными архитектурами на основе модели LSTM для прогнозирования следующего действия пользователя на основе предыдущих действий. Мне интересно, какой лучший способ представить результат?
Data Science
Вопрос или проблема У меня есть большой объем отсканированных документов округа. Мне нужно извлечь информацию, такую как заголовок документа, имя и адрес заемщика, имя и адрес кредитора и т.д. Текст выглядит так: Пример: доверенность на имя, между abc
Data Science
Вопрос или проблема Я работаю над тонкой настройкой модели Whisper от OpenAI для перевода речи на непальский текст в рамках моего проекта, но столкнулся с некоторыми трудностями и буду признателен за любые рекомендации или предложения от этого сообщества!
Data Science
Вопрос или проблема Если мы изменим условие $ywx<0$ (для выполнения обновления) на $ywx<1$, как в SVM (но без добавления регуляризации для максимизации отступа), будет ли какая-либо разница по сравнению с базовым персептроном (тот самый с вышеупомянутым условием $ywx<
Data Science
Вопрос или проблема У меня есть вопрос относительно техники/технологии, которую можно применить для этой задачи: Предположим, у меня есть правило-базированное дерево или дерево решений, которое предсказывает переменную Y на основе переменных A, B, C.
Data Science
Вопрос или проблема Отказ от ответственности: Математики, пожалуйста, не сердитесь на меня за использование некоторых терминов в этом посте. Я инженер. 🙂 Предыстория: Итак, я в настоящее время работаю над задачей, где мне нужно сгенерировать последовательность
Data Science
Вопрос или проблема Проблема: Я хочу максимизировать эффективность постов в социальных сетях, оптимизируя время их публикации. Текущая модель: X: publishing_datetime, post_attribute_1, ..., post_attribute_n y: performance Желаемая модель: X: post_attribute_1, .
Программное обеспечение
Вопрос или проблема Я знаю, что этот вопрос задавали много раз и в разных формах. Существует множество блогов, статей, видео и курсов, которые рассматривают его и сравнивают сотни инструментов, библиотек, фреймворков… И это часть моей проблемы
Data Science
Вопрос или проблема У меня следующая проблема. Из технической модели у нас есть функция $f(n,p)$, приближающая время выполнения. Функция $f$ отображает $$ f: \mathbb{N} \times \mathbb{P} \to \mathbb{R}_{+} $$ где $\mathbb{P} = \{1,\ldots,50\} \subset\mathbb{N}$.
Data Science
Вопрос или проблема Когда я обучаю нейронную сеть, я понимаю ценность нормализации входных данных до значения средней = 0 и стандартного отклонения = 1 (стандартизации данных). Но я часто вижу, что люди делают данные еще более “
Data Science
Вопрос или проблема Допустим, у меня есть 100 значений в моем наборе данных, и я разделяю их: 80% для обучения и 20% для теста. Когда я предсказываю последнее значение, основан ли прогноз на предыдущих 99 (80 тестовых + 19 уже предсказанных значений)
Data Science
Вопрос или проблема Я пытаюсь понять статью о рекомендательной системе Youtube: https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf Однако в модели генерации кандидатов размер выхода softmax фиксирован.