Data Science
реализация модели SIRD на Python
00
Вопрос или проблема Я делаю проект для своего класса, где пытаюсь реализовать модель SIRD с вакцинированным населением. Я написал свой код, опираясь на уравнения, которые у меня есть, но что-то не так на моем графике. Вакцинированное население практически
Data Science
Моя LSTM имеет действительно низкую точность, есть ли способ её улучшить?
00
Вопрос или проблема Я пытаюсь создать модель для классификации, могут ли эти пациенты быть диагностированы с деменцией по их 35 дням биометрических данных. Краткое резюме набора данных приведено ниже. В качестве входных данных X_train он имеет 51 признак
Data Science
Прогнозирование отсутствия активности клиентов
00
Вопрос или проблема Не могли бы вы помочь мне с следующим вопросом? У меня есть датафрейм с данными активности клиентов, который выглядит так: Он содержит как минимум 500.000 клиентов и “временной ряд” из 42 месяцев.
Data Science
Какая функция активации для многоклассовой классификации дает истинную вероятность (softmax против сигмоиды)
00
Вопрос или проблема Мне интересно, какая активационная функция для многоклассовой классификации дает истинную вероятность. Согласно: https://ai.stackexchange.com/questions/37889/are-softmax-outputs-of-classifiers-true-probabilities похоже, что выходная
Data Science
Нахождение уравнения для модели множественной и нелинейной регрессии?
00
Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует
Data Science
ИИ распознавание скрытого угла шахматной доски
00
Вопрос или проблема Мне нужно распознать 4 угла шахматной доски, но иногда один из углов скрыт фигурой. Должен ли я все равно обозначить его положение для тренировки или предпочтительнее не обучать ИИ делать выводы о его позиции в случае, если локальная
Data Science
Какой является наилучшей техникой извлечения признаков для обнаружения новизны / аномалий в текстовом домене?
00
Вопрос или проблема Я работаю с системой классификации текста. Здесь мой набор данных содержит около 30 намерений. Но проблема в том, что у меня нет системы, разработанной для обработки входных данных, которые не попадают ни под одно из намерений.
Data Science
Почему обучение с softmax более стабильное
00
Вопрос или проблема Мне интересно, какая активационная функция будет легче для обучения (даст лучшую точность / наименьшую потерю) – SoftMax или сигмоида (для задачи многоклассовой классификации) Согласно: https://www.quora.
Data Science
Как справиться с большим количеством пропущенных значений в категориальной переменной
00
Вопрос или проблема У меня есть набор данных из примерно 5500 наблюдений. Одна из переменных — Пол, для которой пропущено как минимум 25% наблюдений. Отказ от пропущенных значений кажется немного грубым, однако я не нашел хорошего способа интерполяции бинарных данных.
Data Science
Можем ли мы использовать как потери валидации, так и кросс-валидацию в CNN?
00
Вопрос или проблема Я вижу, что потери валидации используются для предотвращения переобучения обучающей выборки, а кросс-валидация используется для обобщения результатов моделей. Используются ли они для схожих целей или результатов?
Data Science
Как я могу понять несколько LSTM ячеек, развертывая их?
00
Вопрос или проблема Мне не понятно понятие нескольких ячеек в LSTM. Если у меня есть слой LSTM с 64 ячейками, как ячейки будут применяться к каждому временном шагу при разворачивании. Мое понимание состоит в том, что каждый временной шаг будет применяться
Data Science
Инкрементальное обучение на автоэнкодере для обнаружения аномалий
00
Вопрос или проблема Я хочу поэтапно обучать свою предобученную модель автокодировщика на данных, которые поступают каждую минуту. Основываясь на этой теме, последовательные вызовы model.fit будут поэтапно обучать модель. Однако ошибка восстановления и
Data Science
Могу ли я использовать GCN для получения структурных вложений узлов без обучения?
00
Вопрос или проблема Теперь я хочу получить структурное представление узлов, используя DeepWalk или Node2Vec, но не удается получить одинаковые векторы, даже если у них одна и та же структура. Затем я использую GCN, который может получить одинаковые векторы без обучения.
Data Science
Являются ли GNN/GCN жизнеспособными для графов без признаков узлов, только с уникальными идентификаторами узлов? Отличаются ли они от DeepWalk в этом случае?
00
Вопрос или проблема Я начал изучать GNN (графовые нейронные сети) впервые и у меня возникли трудности с пониманием их преимуществ по сравнению с методами эмбеддинга, вдохновленными NLP, такими как DeepWalk и node2vec. GNN действительно показывают лучшие
Data Science
Разница между Q-обучением и G-обучением в обучении с подкреплением?
00
Вопрос или проблема В чем разница между Q-обучением и G-обучением в обучении с подкреплением? Пожалуйста, объясните с помощью формул. Пример источника: Вместо того чтобы полагаться на полезность потребления, мы представляем G-Learner: алгоритм обучения
Data Science
Сглаживание ядром Эпанечникова и оценка ядра Пристли-Чао (PC)
00
Вопрос или проблема Я написал код на Python ниже, чтобы попытаться автоматизировать применение сглаживания ядром, используя ядро Эпанечникова с шириной окна h = 0.4, вычисляя оценку ядра Пристли-Чао функции f при x = 0.5. (Y_i, x_i) x_vals = [0, 1/3, 2/3, 1] y_vals = [2.
Data Science
Какой алгоритм машинного обучения лучше всего работает с текстовыми данными и почему? Также какие метрики используются для оценки производительности модели?
00
Вопрос или проблема Я работаю над проектом – «анализ настроений в твитах». Есть 5 различных настроений – крайнеNegative, негативное, нейтральное, положительное и крайне положительное. Так что это, в основном, задача обработки естественного
Data Science
В Orange Data Mining, как я могу использовать результаты кластеризации обучающего набора для тестирования и оценки тестового набора?
00
Вопрос или проблема Я проводил анализ известного набора данных ‘Adult’, доступного на UCI, с использованием Orange Data Mining. В своей диссертации Pelleg (2004; стр. 79) использует неконтролируемую кластеризацию заданного обучающего набора
Data Science
Метрики LGBM равны 0.0
00
Вопрос или проблема Я нов в этой области и работаю над простой задачей обнаружения мошенничества с следующим распределением классов: Метка 0: 142,900 образцов Метка 1: 16,530 образцов Я обучаю модель LightGBM, используя Optuna для подбора гиперпараметров.
Data Science
Как я могу загрузить пользовательские данные в загрузчик данных (pytorch)
00
Вопрос или проблема Примечание: Я извлек кадр для всех видео и сохранил его в папке с тем же именем, что и видео train_data, class, video —> Это папки img –> это jpg файлы, так что у каждого класса много видео, я извлек изображение для