Data Science
Прогнозы нейронной регрессии вокруг среднего значения цели
00
Вопрос или проблема У меня есть регрессионная модель с трансформером и некоторые данные о последних транзакциях пользователей (категориальные и числовые). Моя целевая переменная имеет экспоненциальное распределение со средним около 10e4 и также имеет
Data Science
Ударенный с несколькими временными рядами, нуждаюсь в помощи.
00
Вопрос или проблема Ударил здесь более 4 недель В настоящее время я имею дело с данными о продажах, имеющими несколько временных рядов (сотни), требование состоит в том, чтобы построить одну модель, которая может быть использована для прогнозирования продаж.
Data Science
AdaGrad: Интуиция
00
Вопрос или проблема Формула обновления для Adagrad следующая: \begin{equation} w^i(t)=w^i(t-1) -\frac{\eta}{\sqrt{\epsilon +\sum_{1}^t |\nabla_i\mathcal{L}|^2} } \nabla_i\mathcal{L} \end{equation} Это указывает на то, что если накопленный градиент велик
Data Science
Почему сверточная нейронная сеть с уменьшающимся размером фильтров может показывать лучшие результаты, чем “обычная” сеть с увеличивающимися размерами?
00
Вопрос или проблема Я проводил десятки (или, вероятно, сотни) тестов, и лучший результат с меньшим количеством параметров (4 раза или меньше) был достигнут с архитектурой, использующей уменьшающий размер фильтров. Это свёрточная нейронная сеть (CNN) для
Data Science
Как использовать иерархическую переменную в модели машинного обучения
00
Вопрос или проблема Я работаю над задачей бинарной классификации с 1000 строками и 20 переменными. У меня есть такие переменные, как product_id, city, state, country, product family, product type, product segment и так далее. Как видно, большинство моих
Data Science
предсказать бинарный вектор размером 40
00
Вопрос или проблема У меня есть набор данных размером (2600, 95), где первые 55 столбцов являются признаками, а 40 столбцов – метками. Метка – это бинарная матрица размером 10×4, которая была уплощена, а признаки –
Data Science
Использование первых 3 слоев предобученной сети в Keras
00
Вопрос или проблема Я хочу использовать выход 3-го слоя сети VGG16. Ошибка выглядит следующим образом: UserWarning: Входные данные модели должны поступать из `keras.layers.Input` (тем самым сохраняя метаданные предыдущего слоя), они не могут быть выходом
Data Science
Адаптация медицинского трансформера для сегментации ран с несколькими классами
00
Вопрос или проблема Я использую Medical Transformer (https://github.com/jeya-maria-jose/Medical-Transformer) для сегментации ран, но хотел бы адаптировать его для сегментации трех различных классов: раны, дополнительный маркер и фон.
Data Science
Как сбалансировать набор данных, извлеченный с помощью image_dataset_from_directory
00
Вопрос или проблема Я новичок в tensorflow, и сейчас я пытаюсь найти лучший способ сбалансировать классы в наборе данных, который я загружаю с помощью image_dataset_from_directory. Но я не нашёл способ это сделать. Я видел из разных источников, что SMOTE
Data Science
Как увеличить точность тестирования модели?
00
Вопрос или проблема Я использую модель InceptionV3 для тренировки. Вот ссылка на код (https://github.com/maxmelnick/tensorflow/blob/no_random/tensorflow/examples/image_retraining/retrain.py) Изначально у меня есть набор данных небольшого размера.
Data Science
Архитектура распознавания лиц
00
Вопрос или проблема Распознавание изображений использует глубокое обучение, а именно сверточные нейронные сети (CNN), для обучения и распознавания лиц. Обычно это подразумевает обучение на большом объеме данных. Однако в последнее время мы видим, как
Data Science
Должен ли масштаб выходных данных соответствовать выходу функции активации?
00
Вопрос или проблема Я создаю LSTM с keras, который имеет параметр activation в слое. Я читал, что масштабирование выходных данных должно соответствовать выходным значениям функции активации. Например, функция активации tanh выдает значения в диапазоне
Data Science
В чем разница между сглаживающейся кривой валидации и такой, которая снова увеличивается?
00
Вопрос или проблема Я знаю, что мы отслеживаем потери на валидации для изучения переобучения. Мне известна кривая валидации, которая сначала уменьшается, а затем снова увеличивается. Увеличивающаяся часть означает, что модель начинает переобучаться.
Data Science
Почему обновления параметров уменьшаются на некорректированную дисперсию (вместо скорректированной дисперсии) в оптимизаторе Adam?
00
Вопрос или проблема В алгоритме оптимизатора Adam обновления параметров вычисляются следующим образом: $\theta_t \leftarrow \theta_{t-1} – \alpha \frac{\hat{m}_t}{\sqrt{\hat{v}_t}+\epsilon}$ Где $\hat{m}_t$ является смещенно-скорректированным скользящим
Data Science
Понимание концепции убывающего градиента и проблемы взрывающегося градиента в контексте обучающих данных.
00
Вопрос или проблема Я пытаюсь понять суть концепций “проблема исчезающего градиента и взрывающегося градиента” с точки зрения реальных примеров ввода-вывода, а не относительно свойств выбора функции активации. Не может ли кто посоветовать
Data Science
Моя модель CNN предсказывает только один класс – сбалансированные данные и не сходящаяся ошибка.
00
Вопрос или проблема Я работаю над моделью CNN для прогнозирования финансовых временных рядов. Несмотря на сбалансированные данные и несколько настроек, моя модель продолжает предсказывать только один класс на протяжении обучения, независимо от того, какие изменения я вношу.
Data Science
Мультих классовая сегментация улучшает IOU
00
Вопрос или проблема Я хотел бы узнать, есть ли у вас советы по улучшению индивидуального показателя IOU (для класса объектов №2 здесь). Вот что я попробовал до сих пор: Прежде всего, у меня много данных (тысячи изображений), хорошо аннотированных.
Data Science
Ищу наборы данных о информации об автомобилях для машинного обучения.
00
Вопрос или проблема Я начинаю проект в области машинного обучения, который требует обширного набора данных о деталях автомобилей. Цель состоит в том, чтобы обучить модель, которая сможет идентифицировать и классифицировать различные автомобильные детали
Data Science
Почему кодировщик VAE выдает логарифм дисперсии, а не стандартное отклонение?
00
Вопрос или проблема Говоря о VAE (и рассматривая реализации VAE), выходы Кодировщика: μ, log(дисперсия) Когда мы обучаем модель (часть декодирующей модели), мы преобразуем log(дисперсия) в стандартное отклонение: std = exp(0.5 * logvar) (Я взял пример отсюда: https://github.
Data Science
После преодоления переобучения, как увеличить точность обучения?
00
Вопрос или проблема Я строю CNN с использованием Keras для задачи классификации. Я начал с простой модели в качестве отправной точки, и как это обычно бывает со всеми задачами машинного обучения, особенно если набор данных не очень большой, я столкнулся