Data Science
Модель предсказывает узкий диапазон значений, но с многообещающими значениями MSE и RMSE; проблемы с нормализацией и метриками ошибок в задаче регрессии.
00
Вопрос или проблема Я работаю над проектом, основанным на обнаружении спектра, где мне нужно предсказывать значения SNR по изображениям спектрограмм. Чтобы обучить и оценить модель, я нормализовал истинные значения SNR и получил приличные значения MSE (0.
Data Science
Почему моя модель иногда плохо обучается на одних и тех же данных?
00
Вопрос или проблема У меня есть набор данных из 2 классов, каждый из которых содержит 2000 изображений. Я разделил его на 1500 изображений для обучения и 500 изображений для проверки. Это простая структура для целей тестирования, и каждое изображение
Data Science
ImageDataGenerator для многозадачного вывода в Keras с использованием flow_from_directory
00
Вопрос или проблема Я создаю многозадачную модель CNN и у меня есть два разных свойства классификации (одно с 10 классами, второе с 5 классами), и моя структура папок выглядит следующим образом: -Train - image1.jpg ... - imageN.
Data Science
Создание карты между N изображениями и N метками с использованием CNN
00
Вопрос или проблема Я видел классификационные CNN, которые обучаются на множестве изображений для подмножества меток (т.е. количество изображений >> количество меток), однако, возможно ли использовать CNN, когда количество изображений равно количеству меток?
Data Science
Градиенты CNN с разной величиной
00
Вопрос или проблема У меня есть архитектура CNN с двумя функциями кросс-энтропии потерь $\mathcal{L}_1$ и $\mathcal{L}_2$, которые суммируются в общую потерю $\mathcal{L} = \mathcal{L}_1 + \mathcal{L}_2$. Задача, которую я хочу решить, — это неконтролируемая адаптация домена.
Data Science
Патчевое обучение vs Полное сверточное обучение в семантической сегментации
00
Вопрос или проблема Как упоминается в заголовке, какими являются эти 2 метода? Я уже проверил этот вопрос: Patchwise and Full training, (и упомянутую статью), но я не могу действительно понять значение и процесс этих двух методов. В чем разница между ними?
Data Science
Почему нам нужны свертки по объему в сверточных нейронных сетях для распознавания изображений?
00
Вопрос или проблема В сверточных нейронных сетях мы делаем свертки трех каналов (красный, зеленый, синий) с фильтром размером $k\times k\times 3$, как на картинке: Каждый фильтр состоит из настраиваемых весов и может научиться обнаруживать примитивные
Data Science
Важность признаков в CNN
00
Вопрос или проблема Я могу использовать shap для извлечения важных признаков для Dense NN. Однако для CNN я столкнулся с двумя проблемами: порядок признаков может быть изменен или объединен после фильтрации и пуллинга. Могу ли я все еще использовать shap
Data Science
Правильный способ изменить форму изображения для обучения с использованием CNN
00
Вопрос или проблема Я новичок в Keras и сталкиваюсь с некоторыми проблемами, пытаясь правильно изменить форму входных данных изображения. У меня есть изображения $16 x 16$, каждое с тремя слоями, т.е. R, G и B. Данные изображения представлены в виде массива
Data Science
Как создать конвейер для набора данных видео для TensorFlow [Sequence Matters] и эффективно обучить модель на системе с малым объемом памяти.
00
Вопрос или проблема Я работаю над проектом Глубокого Обучения и сталкиваюсь с проблемой размера набора данных. Я хочу создать конвейер для видео набора данных [Sequence Matters]. Потому что, если я пытаюсь загрузить весь набор данных, то TensorFlow выдает
Data Science
Имеет ли это смысл или есть какие-либо другие исследования на эту тему? TextCNN извлеченные признаки + другие признаки (категориальные и числовые) > прогнозирование XGBoost.
00
Вопрос или проблема У меня есть набор данных для характеристик ресторанов. Я использовал CNN для извлечения текстов обзоров, затем объединил извлеченные признаки с другими категориальными и числовыми признаками. Затем я использую XGBoost для прогнозирования оценок ресторанов.
Data Science
Модель BERT + CNN недостаточно обучается для бинарной классификации текста: как улучшить?
00
Вопрос или проблема Я работаю над задачей бинарной классификации текстов, используя модель BERT + CNN. Однако, судя по графикам потерь и точности во время обучения, кажется, что модель недостаточно обучается, и я не вижу значительных улучшений в производительности.
Data Science
Может ли у меня быть нулевая потеря на наборе валидации и все же плохая точность?
00
Вопрос или проблема Я начинаю изучать мир глубоких нейронных сетей и провожу серию тестов с сверточной моделью, и вот что я обнаружил: Точность на обучающем наборе данных значительно выше (около 0.85), чем на валидационном наборе (около 0.
Data Science
Хорошие результаты CNN на обучении и тестировании, плохие результаты на реальных данных.
00
Вопрос или проблема Я пытаюсь создать нейронную сеть для задачи определения возраста. Вот некоторые детали: Набор данных: я использую набор данных “facial age” с Kaggle и набор данных “UTKFace”, всего около 35 тысяч изображений.
Data Science
Как операция сглаживания в AlexNet преобразует тензор размером 6x6x256 в вектор размером 4096?
00
Вопрос или проблема В модели Alexnet, после завершения шагов кодировщика, вы получаете тензор 6x6x256. Теперь его необходимо “развернуть” (flatten) перед переходом к части сети ANN. Однако разворачивание приводит к длине 4096. Как размер тензора уменьшился?
Data Science
Предварительно заданные 1x3x3 краевые фильтры для CNN
00
Вопрос или проблема Я читаю препринт от Linse et al., который предоставляет изображение заранее заданных фильтров краев размером 1x3x3, для которых различные ограничения $\sum_i w_i=0$ и $\sum_i |w_i|=1$. (авторы сообщают, что эти фильтры краев, когда
Data Science
Как настроить слой conv2D в Keras с использованием вычисленных значений
00
Вопрос или проблема Это мой первый вопрос, привет, мир, наверное. Мне нужно создать пользовательский слой conv2D (по крайней мере, я так думаю), который должен использовать мой пользовательский модуль для извлечения значений в первом слое.
Data Science
Можно ли использовать фотоколлажи в качестве набора данных вместо отдельных изображений для обучения модели обнаружения объектов SSD?
00
Вопрос или проблема Является ли нормальным/лучшим использование фото-коллажей (несколько фото в одном изображении) в качестве набора данных вместо одиночных изображений для обучения модели обнаружения объектов SSD? Я использую Tensorflow Object Detection
Data Science
Проверка правильности предсказанных значений нейронной сети CNN.
00
Вопрос или проблема Я обучил обычную свёрточную нейронную сеть для распознавания, есть ли у пациентов заболевание или нет. Я вывожу предсказанные значения для тестового набора и получаю вероятность того, что различные изображения принадлежат одному классу, а не другому…
Data Science
Настройка сверточной нейронной сети, размер выборки
00
Вопрос или проблема Я постоянно читаю, что свёрточные нейронные сети (CNN) работают лучше всего с огромным количеством данных (100 тысяч и более). Есть ли какие-либо эмпирические правила или нижний предел для объёма данных на этапе поиска по сетке?