Data Science
Почему графики точности и потерь моей бинарной модели Keras не являются гладкими?
00
Вопрос или проблема Я создаю бинарную модель и использую TensorBoard для визуализации графиков точности и потерь. Однако я заметил, что графики точности и потерь моей модели не гладкие. Почему это происходит? Вот графики точности и потерь моей модели
Data Science
Модель (CNN) недостаточно обучается, или, по крайней мере, я считаю, что это так. Точность остается неизменной.
00
Вопрос или проблема В настоящее время я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивки голосов. В процессе предварительной обработки данных я выполнил все в соответствии с опубликованными статьями.
Data Science
Почему модель CNN не может хорошо выучить пик из данных
00
Вопрос или проблема Здесь у меня есть два различных набора данных. dataset1 — это данные с платформы силы, а dataset2 — данные о подошвенном давлении. dataset1 имеет размер (2050,2), а dataset2 имеет размер(2050,89). Перед обучением я нормализовал данные
Data Science
Разница между аргументами class_weight и loss_weights в TensorFlow/Keras
00
Вопрос или проблема Я создаю нейронную сеть с использованием TensorFlow (v2.9.2) для несбалансированного набора изображений. При этом я заметил, что метод model.compile() имеет аргумент loss_weights, а model.fit() имеет аргумент class_weight.
Data Science
Как обучить миллионы встраиваний doc2vec с использованием GPU?
00
Вопрос или проблема Я пытаюсь обучить doc2vec на основе истории серфинга пользователей (URLs, привязанные к user_id). Я использую фреймворк глубокого обучения Chainer. Существует более 20 миллионов (user_id и URLs) векторов для инициализации, которые
Вопросы и ответы
Почему графики точности и потерь моей бинарной модели Keras не гладкие?
00
Вопрос или проблема Я создаю бинарную модель и использую TensorBoard для визуализации графиков точности и потерь. Однако я заметил, что графики точности и потерь моей модели не гладкие. Почему так? Вот графики точности и потерь моей модели: Точность
Data Science
Размерность целевой функции для обучения агента DQN
00
Вопрос или проблема Насколько я понимаю, агент DQN имеет столько выходов, сколько действий (для каждого состояния). Если мы рассматриваем скалярное состояние с 4 действиями, это будет означать, что DQN будет иметь 4-мерный выход.
Data Science
Ошибка в пользовательском RNN/LSTM с несколькими входными данными
00
Вопрос или проблема Я хочу реализовать собственную модель RNN/LSTM, подобную этой. Модель должна принимать два отдельных вектора в качестве входных данных и обрабатывать их. Я следовал учебнику Keras по созданию пользовательского слоя Keras и подавал
Data Science
Оценка приложения CNN
00
Вопрос или проблема Я был бы рад, если бы кто-то мог дать мне некоторые советы и оценки для следующего проекта. (Я относительно нов в области машинного обучения и глубокого обучения, и у меня есть только немного теоретических знаний.) Моя цель –
Data Science
Высокие потери и высокая точность на валидационном наборе данных на раннем этапе обучения бинарного классификатора
00
Вопрос или проблема Я обучаю сеть ResNet50 на симуляционных данных, а мой валидационный набор данных — это экспериментальные данные. Симуляционные данные не являются на 100% точным представлением экспериментальных данных. Цель этой сети — двойная классификация.
Data Science
Обучение с подкреплением, примененное к задаче оптимизации
00
Вопрос или проблема Устранение проблемы: Нам дана задача оптимизации; с производственными центрами, исходным аэропортом, аэропортами назначения, пунктами пересадки и, наконец, доставкой клиентам. Это лучше объясняется на следующем изображении.
Data Science
Количество капсул в первичном слое капсульных сетей
00
Вопрос или проблема Какое количество капсул в основной капсульной слой сети капсул? Во многих статьях написано, что количество капсул составляет 32, но в статье Хинтона – Динамическая маршрутизация между капсулами написано, что “
Data Science
Как квантование может замедлить модель?
00
Вопрос или проблема Я работаю с библиотекой SentenceTransformers с одной из их моделей встраивания. Производительность хорошая, но я хотел бы пожертвовать частью точности ради повышения производительности. Я пробовал квантизировать модель, с которой работаю
Data Science
Модель LSTM TensorFlow с меньшей потерей эпохи, но более высоким средним RMSE. Как/почему?
00
Вопрос или проблема Меня очень смущает меньшая потеря, но более высокий RMSE: Вот новая модель с лучшими показателями потерь на том же наборе данных и с большим числом предикторов: Сложение 3 из 3 Эпоха 1/10 170362/170362 [==============================]
Data Science
Как обучить нейронные векторные представления слов?
00
Вопрос или проблема Итак, я новичок в области глубокого обучения и обработки естественного языка (NLP). Я прочитал несколько блогов на Medium, Towards Data Science и статьи, где говорится о предварительном обучении векторных представлений слов в несупервизорном
Data Science
Повторное использование модели, обученной на 19 классах, для всего лишь одного из этих классов
00
Вопрос или проблема У меня есть предобученная нейросеть для семантической сегментации, которая была обучена на датасете Cityscapes и его 19 классах (Человек, автомобиль, дорожный знак и т.д.). Один из этих классов — “Человек”
Data Science
Использование извлеченного векторного признака для выполнения детекции без обучения на примерах.
00
Вопрос или проблема Я разработал модель глубокого обучения, обученную с нуля на фруктах и овощах. Однако, так как данные ограничены, я могу охватить только несколько различных типов фруктов и овощей с помощью этой модели. Тем не менее, точность по этим
Data Science
Преимущества использования инструментов оптимизации гиперпараметров, специфичных для глубокого обучения, по сравнению с sklearn.
00
Вопрос или проблема Существует довольно много библиотек для оптимизации гиперпараметров, которые специфичны для Keras или других библиотек глубокого обучения, таких как Hyperas или Talos. Мой вопрос: в чем основное преимущество использования этих библиотек
Data Science
Сдерживающие значения или сглаживание результатов при подгонке модели
00
Вопрос или проблема Я работаю над обучением сети для предсказания направления прихода, и у меня возникла проблема: независимо от того, какая у меня сеть (ResNet 18 – 101, CRNN, CNN и т. д.), мои результаты склоняются к одному небольшому диапазону
Data Science
Как пространство оптимизации связано с проблемой исчезающего/взрывного градиента в глубоком обучении?
00
Вопрос или проблема Я пытаюсь полностью понять, почему проблемы исчезающего и взрывающегося градиентов так вредны для обучения глубоких нейронных сетей. Я понимаю, что эти проблемы приводят к тому, что некоторые веса имеют очень маленькие градиенты (исчезающий