Data Science
Высокие потери и высокая точность на валидационном наборе данных на раннем этапе обучения бинарного классификатора
00
Вопрос или проблема Я обучаю сеть ResNet50 на симуляционных данных, а мой валидационный набор данных — это экспериментальные данные. Симуляционные данные не являются на 100% точным представлением экспериментальных данных. Цель этой сети — двойная классификация.
Data Science
Классификация с множеством классов
00
Вопрос или проблема Я пытаюсь создать модель, которая будет классифицировать текст примерно на 500 разных классов. Я думаю, что мне нужно настроить архитектуру Pooling Classifier, которая сейчас выглядит следующим образом: (1): PoolingLinearClassifier(
Data Science
Рекуррентные нейронные сети над несколькими документами во времени
00
Вопрос или проблема Так что в моей голове у меня есть идея о том, как должна выглядеть эта архитектура, или, по крайней мере, как она должна себя вести, но мне трудно ее реализовать. Позвольте мне описать проблему, и если кто-то имеет идеи о том, как
Data Science
Метод обратного распространения с функцией стоимости логарифмического правдоподобия и активацией softmax
00
Вопрос или проблема В онлайн-книге о нейронных сетях Майкла Нилсена, в главе 3, он вводит новую функцию стоимости, называемую функцией логарифмического правдоподобия, определенной следующим образом: $$ C = -ln(a_y^L) $$ Предположим, у нас есть 10 выходных
Data Science
Как улучшить модель предсказания видео в Keras?
00
Вопрос или проблема Я работаю над моделью прогнозирования преступлений. У меня есть изображения того, как преступления выглядят каждый день в городе в течение года, и я хочу использовать 30 дней преступности для прогнозирования 31-го дня (так же, как
Data Science
Как обучить нейронные векторные представления слов?
00
Вопрос или проблема Итак, я новичок в области глубокого обучения и обработки естественного языка (NLP). Я прочитал несколько блогов на Medium, Towards Data Science и статьи, где говорится о предварительном обучении векторных представлений слов в несупервизорном
Data Science
Состояние потерь и онлайн-регрессия
00
Вопрос или проблема Работая с tensorflow + keras, я пытаюсь определить пользовательскую функцию потерь. Примечание: меня больше интересует значение потерь, чем фактическое значение предсказаний (это будет использоваться для обнаружения аномалий).
Data Science
Измерение угла кабеля (вращение)
00
Вопрос или проблема Мне нужно определить вращение кабеля (градус) вокруг оси X с высокой точностью [0.2 (или более) градуса]. Подробное описание: У меня есть кабель, который установлен в своем исходном состоянии. Система повернула кабель вокруг оси X.
Data Science
Перцептрон – Какую ступенчатую функцию выбрать
00
Вопрос или проблема Я изучаю алгоритм Перцептрон. Некоторые книги используют следующую ступенчатую функцию: 1, если x>=0, иначе -1 где x — это скалярное произведение между весами w и образцом x. Другие книги используют: 1, если x>
Data Science
Размер обучающего набора данных в контексте компьютерного зрения
00
Вопрос или проблема В общем, для обучения модели машинного обучения размер обучающей выборки должен быть больше количества предикторов. Для нейронной сети или даже модели глубокого обучения количество параметров обычно составляет десятки тысяч или даже миллионы.
Data Science
Существует ли модель, которая может предсказывать непрерывные данные, одновременно предоставляя уровень доверия к прогнозу?
00
Вопрос или проблема Проблема с байесовской нейронной сетью, похоже, заключается в том, что она в основном работает для задач классификации. Возможно ли адаптировать эту нейронную сеть или даже использовать другую модель, если таковая существует, для прогнозирования
Data Science
Подход Train/val/test для настройки гиперпараметров
00
Вопрос или проблема Когда вы планируете обучать модель, имеет ли смысл разделение данных на 60-20-20 для обучения, валидации и тестирования, сначала настраивая гиперпараметры на обучающем наборе данных, используя валидационный набор, и выбирая лучшую модель.
Data Science
Формы mat1 и mat2 не могут быть перемножены (100×200 и 100×9922)
00
Вопрос или проблема Я пытаюсь создать языковую модель BiLSTM и испытываю некоторые проблемы. Модель class BiLSTM(nn.Module): def __init__(self, vocab_size, embedding_dim, hidden_dim, num_layers, dropout_rate, tie_weights): super().
Data Science
Как обучить ИИ распознавать принадлежность солдат по повязке?
00
Вопрос или проблема Если гипотетически я хочу обучить ИИ распознавать вражеских солдат по цвету их повязки на руке (например, зеленой повязке), нужно ли мне обучать ИИ только на солдатах с зелеными повязками или также показывать ему фотографии солдат
Data Science
Построение графика регрессии NN / аналогичный предсказанный вывод для всех входов.
00
Вопрос или проблема Может кто-то объяснить, почему линия Fit не соответствует истинной метке? Я не понимаю, что именно происходит и где у меня проблема в модели. Вот мой код: input=heat_y_noisy'; %входные данные 20000x100 input_normalized=input;
Data Science
Глубокое Q-обучение: как установить Q-значение для невыбранных действий?
00
Вопрос или проблема Я изучаю глубокое Q-обучение, применяя его к реальной проблеме. Я ознакомился с несколькими учебниками и статьями, доступными в интернете, но не смог найти решение для следующего задания. Предположим, у нас есть $N$ возможных действий в каждом состоянии.
Data Science
Когда это можно назвать трансферным обучением?
00
Вопрос или проблема Общее определение передачи обучения звучит так: «Передача обучения — это улучшение обучения в новой задаче посредством передачи знаний из связанной задачи, которая уже была изучена.» — Глава 11: Передача обучения, Справочник по исследованиям
Data Science
Как нарисовать диаграммы архитектуры нейронных сетей глубокого обучения?
00
Вопрос или проблема Я построил свою модель. Теперь я хочу нарисовать диаграмму архитектуры сети для своей исследовательской работы. Пример показан ниже: Недавно я нашел этот онлайн инструмент, который создает схемы архитектуры нейронных сетей, готовые к публикации.
Data Science
Как справляться с мягкими ограничениями веса в нейронных сетях
00
Вопрос или проблема Предположим, что у нас есть прямой нейронной сети с двумя слоями, и веса каждого слоя ограничены таким образом, что сумма весов является постоянным значением в каждом слое и их значения неотрицательны. Вы можете задаться вопросом
Data Science
Нормализация данных в классификации нестационарных данных с использованием Learn++.NSE на основе MLP
00
Вопрос или проблема Мне нужно предсказать техническое агрегированное состояние, используя данные мониторинга вибраций. Мы считаем эти данные нестационарными, т.е. параметры распределения и описательная статистика не постоянны.