deep-learning
Data Science
Вопрос или проблема Формула обновления для Adagrad следующая: \begin{equation} w^i(t)=w^i(t-1) -\frac{\eta}{\sqrt{\epsilon +\sum_{1}^t |\nabla_i\mathcal{L}|^2} } \nabla_i\mathcal{L} \end{equation} Это указывает на то, что если накопленный градиент велик
Data Science
Вопрос или проблема Я проводил десятки (или, вероятно, сотни) тестов, и лучший результат с меньшим количеством параметров (4 раза или меньше) был достигнут с архитектурой, использующей уменьшающий размер фильтров. Это свёрточная нейронная сеть (CNN) для
Data Science
Вопрос или проблема Я работаю над задачей бинарной классификации с 1000 строками и 20 переменными. У меня есть такие переменные, как product_id, city, state, country, product family, product type, product segment и так далее. Как видно, большинство моих
Data Science
Вопрос или проблема У меня есть набор данных размером (2600, 95), где первые 55 столбцов являются признаками, а 40 столбцов – метками. Метка – это бинарная матрица размером 10×4, которая была уплощена, а признаки –
Data Science
Вопрос или проблема Я хочу использовать выход 3-го слоя сети VGG16. Ошибка выглядит следующим образом: UserWarning: Входные данные модели должны поступать из `keras.layers.Input` (тем самым сохраняя метаданные предыдущего слоя), они не могут быть выходом
Data Science
Вопрос или проблема Я использую Medical Transformer (https://github.com/jeya-maria-jose/Medical-Transformer) для сегментации ран, но хотел бы адаптировать его для сегментации трех различных классов: раны, дополнительный маркер и фон.
Data Science
Вопрос или проблема Я новичок в tensorflow, и сейчас я пытаюсь найти лучший способ сбалансировать классы в наборе данных, который я загружаю с помощью image_dataset_from_directory. Но я не нашёл способ это сделать. Я видел из разных источников, что SMOTE
Data Science
Вопрос или проблема Я использую модель InceptionV3 для тренировки. Вот ссылка на код (https://github.com/maxmelnick/tensorflow/blob/no_random/tensorflow/examples/image_retraining/retrain.py) Изначально у меня есть набор данных небольшого размера.
Data Science
Вопрос или проблема Распознавание изображений использует глубокое обучение, а именно сверточные нейронные сети (CNN), для обучения и распознавания лиц. Обычно это подразумевает обучение на большом объеме данных. Однако в последнее время мы видим, как
Data Science
Вопрос или проблема Я создаю LSTM с keras, который имеет параметр activation в слое. Я читал, что масштабирование выходных данных должно соответствовать выходным значениям функции активации. Например, функция активации tanh выдает значения в диапазоне
Data Science
Вопрос или проблема Я знаю, что мы отслеживаем потери на валидации для изучения переобучения. Мне известна кривая валидации, которая сначала уменьшается, а затем снова увеличивается. Увеличивающаяся часть означает, что модель начинает переобучаться.
Data Science
Вопрос или проблема В алгоритме оптимизатора Adam обновления параметров вычисляются следующим образом: $\theta_t \leftarrow \theta_{t-1} – \alpha \frac{\hat{m}_t}{\sqrt{\hat{v}_t}+\epsilon}$ Где $\hat{m}_t$ является смещенно-скорректированным скользящим
Data Science
Вопрос или проблема Я пытаюсь понять суть концепций “проблема исчезающего градиента и взрывающегося градиента” с точки зрения реальных примеров ввода-вывода, а не относительно свойств выбора функции активации. Не может ли кто посоветовать
Data Science
Вопрос или проблема Я работаю над моделью CNN для прогнозирования финансовых временных рядов. Несмотря на сбалансированные данные и несколько настроек, моя модель продолжает предсказывать только один класс на протяжении обучения, независимо от того, какие изменения я вношу.
Data Science
Вопрос или проблема Я хотел бы узнать, есть ли у вас советы по улучшению индивидуального показателя IOU (для класса объектов №2 здесь). Вот что я попробовал до сих пор: Прежде всего, у меня много данных (тысячи изображений), хорошо аннотированных.
Data Science
Вопрос или проблема Я начинаю проект в области машинного обучения, который требует обширного набора данных о деталях автомобилей. Цель состоит в том, чтобы обучить модель, которая сможет идентифицировать и классифицировать различные автомобильные детали
Data Science
Вопрос или проблема Говоря о VAE (и рассматривая реализации VAE), выходы Кодировщика: μ, log(дисперсия) Когда мы обучаем модель (часть декодирующей модели), мы преобразуем log(дисперсия) в стандартное отклонение: std = exp(0.5 * logvar) (Я взял пример отсюда: https://github.
Data Science
Вопрос или проблема Я строю CNN с использованием Keras для задачи классификации. Я начал с простой модели в качестве отправной точки, и как это обычно бывает со всеми задачами машинного обучения, особенно если набор данных не очень большой, я столкнулся
Вопросы и ответы
Вопрос или проблема Закрыто. Этот вопрос требует деталей или прояснения. В данный момент ответы не принимаются. Хотите улучшить этот вопрос? Добавьте детали и проясните проблему, изменив этот пост. Закрыто 1 час назад. Улучшить этот вопрос Я не много
Data Science
Вопрос или проблема Я занимаюсь бинарным классификатором изображений. Я использую сверточную нейронную сеть (CNN), чтобы предсказать, является ли изображение положительным или отрицательным. Проблема в том, что положительный класс составляет только 2%