Data Science
Data Science
Вопрос или проблема Я делаю проект для своего класса, где пытаюсь реализовать модель SIRD с вакцинированным населением. Я написал свой код, опираясь на уравнения, которые у меня есть, но что-то не так на моем графике. Вакцинированное население практически
Data Science
Вопрос или проблема Я пытаюсь создать модель для классификации, могут ли эти пациенты быть диагностированы с деменцией по их 35 дням биометрических данных. Краткое резюме набора данных приведено ниже. В качестве входных данных X_train он имеет 51 признак
Data Science
Вопрос или проблема Не могли бы вы помочь мне с следующим вопросом? У меня есть датафрейм с данными активности клиентов, который выглядит так: Он содержит как минимум 500.000 клиентов и “временной ряд” из 42 месяцев.
Data Science
Вопрос или проблема Мне интересно, какая активационная функция для многоклассовой классификации дает истинную вероятность. Согласно: https://ai.stackexchange.com/questions/37889/are-softmax-outputs-of-classifiers-true-probabilities похоже, что выходная
Data Science
Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует
Data Science
Вопрос или проблема Мне нужно распознать 4 угла шахматной доски, но иногда один из углов скрыт фигурой. Должен ли я все равно обозначить его положение для тренировки или предпочтительнее не обучать ИИ делать выводы о его позиции в случае, если локальная
Data Science
Вопрос или проблема Я работаю с системой классификации текста. Здесь мой набор данных содержит около 30 намерений. Но проблема в том, что у меня нет системы, разработанной для обработки входных данных, которые не попадают ни под одно из намерений.
Data Science
Вопрос или проблема Мне интересно, какая активационная функция будет легче для обучения (даст лучшую точность / наименьшую потерю) – SoftMax или сигмоида (для задачи многоклассовой классификации) Согласно: https://www.quora.
Data Science
Вопрос или проблема У меня есть набор данных из примерно 5500 наблюдений. Одна из переменных — Пол, для которой пропущено как минимум 25% наблюдений. Отказ от пропущенных значений кажется немного грубым, однако я не нашел хорошего способа интерполяции бинарных данных.
Data Science
Вопрос или проблема Я вижу, что потери валидации используются для предотвращения переобучения обучающей выборки, а кросс-валидация используется для обобщения результатов моделей. Используются ли они для схожих целей или результатов?
Data Science
Вопрос или проблема Мне не понятно понятие нескольких ячеек в LSTM. Если у меня есть слой LSTM с 64 ячейками, как ячейки будут применяться к каждому временном шагу при разворачивании. Мое понимание состоит в том, что каждый временной шаг будет применяться
Data Science
Вопрос или проблема Я хочу поэтапно обучать свою предобученную модель автокодировщика на данных, которые поступают каждую минуту. Основываясь на этой теме, последовательные вызовы model.fit будут поэтапно обучать модель. Однако ошибка восстановления и
Data Science
Вопрос или проблема Теперь я хочу получить структурное представление узлов, используя DeepWalk или Node2Vec, но не удается получить одинаковые векторы, даже если у них одна и та же структура. Затем я использую GCN, который может получить одинаковые векторы без обучения.
Data Science
Вопрос или проблема Я начал изучать GNN (графовые нейронные сети) впервые и у меня возникли трудности с пониманием их преимуществ по сравнению с методами эмбеддинга, вдохновленными NLP, такими как DeepWalk и node2vec. GNN действительно показывают лучшие
Data Science
Вопрос или проблема В чем разница между Q-обучением и G-обучением в обучении с подкреплением? Пожалуйста, объясните с помощью формул. Пример источника: Вместо того чтобы полагаться на полезность потребления, мы представляем G-Learner: алгоритм обучения
Data Science
Вопрос или проблема Я написал код на Python ниже, чтобы попытаться автоматизировать применение сглаживания ядром, используя ядро Эпанечникова с шириной окна h = 0.4, вычисляя оценку ядра Пристли-Чао функции f при x = 0.5. (Y_i, x_i) x_vals = [0, 1/3, 2/3, 1] y_vals = [2.
Data Science
Вопрос или проблема Я работаю над проектом – «анализ настроений в твитах». Есть 5 различных настроений – крайнеNegative, негативное, нейтральное, положительное и крайне положительное. Так что это, в основном, задача обработки естественного
Data Science
Вопрос или проблема Я проводил анализ известного набора данных ‘Adult’, доступного на UCI, с использованием Orange Data Mining. В своей диссертации Pelleg (2004; стр. 79) использует неконтролируемую кластеризацию заданного обучающего набора
Data Science
Вопрос или проблема Я нов в этой области и работаю над простой задачей обнаружения мошенничества с следующим распределением классов: Метка 0: 142,900 образцов Метка 1: 16,530 образцов Я обучаю модель LightGBM, используя Optuna для подбора гиперпараметров.
Data Science
Вопрос или проблема Примечание: Я извлек кадр для всех видео и сохранил его в папке с тем же именем, что и видео train_data, class, video —> Это папки img –> это jpg файлы, так что у каждого класса много видео, я извлек изображение для