deep-learning - ответы на вопросы - Page 5 of 24

Data Science

00

Вопрос или проблема Это, вероятно, базовый вопрос, так как я начинаю с компьютерного зрения. Я пытаюсь использовать resnet18 из pytorch и работать с набором данных CIFAR-100. Одно изображение имеет размер 3x32x32, и модель не может обработать это, выдавая ошибку.

Data Science

Потеря по каналу или Потеря по образцу

00

Вопрос или проблема В настоящее время я решаю задачу семантической сегментации, в которой для каждого образца моя цель — сегментировать две маски, соответствующие двум объектам. Примечательно, что второй объект обычно расположен внутри первого, а его

Data Science

Слишком много или очень мало обучающих примеров конкретной характеристики мешает модели нейронной сети?

00

Вопрос или проблема Я анализирую технику “Sherlock” – семантический метод обнаружения столбцов, при котором количество образцов конкретного типа в обучающем наборе данных ограничено 15K, а слишком мало встречающихся образцов менее 1K

Data Science

Действительно ли сгруппированные свертки улучшают обучение?

00

Вопрос или проблема Мое понимание сгруппированных сверток Допустим, у нас есть некоторые данные с размерами [100,100,32] (игнорируем размер пакета и предполагаем, что каналы последними) и мы хотим передать их в сверточный слой с 64 фильтрами.

Data Science

CNN+LSTM ValueError: Вход 0 слоя sequential_10 несовместим со слоем: ожидается ndim=5, найден ndim=4

00

Вопрос или проблема в настоящее время я занимаюсь распознанием человеческих действий для определения мошенничества на экзамене с помощью камер видеонаблюдения, используя AlexNet+LSTM Мои данные — это необработанные изображения в каждой папке класса, как

Data Science

Понимание слоев в рекуррентных нейронных сетях для обработки естественного языка

00

Вопрос или проблема В сверточных нейронных сетях у нас есть представление о том, что внутренние слои обучаются распознавать тонкие детали, такие как линии и края, в то время как внешние слои изучают более сложные формы. Есть ли у нас какое-либо аналогичное

Data Science

Какие существуют методы обработки мультиметочной классификации для длинных последовательностей текста?

00

Вопрос или проблема Я ищу решение проблемы мультиклассовой классификации с длинными последовательностями текста, где в некоторых строках содержится тысячи токенов. Некоторые современные методы, такие как BERT, имеют ограничение на количество токенов

Data Science

Нейронная сеть не обучается регрессии

00

Вопрос или проблема У меня следующая конфигурация: 2 входных нейрона (I1, I2) 2 выходных нейрона (O1, O2) 1 скрытый слой с 3 нейронами (H1, H2, H3) функция потерь = mse оптимизатор = Adam значения I1 варьируются от 0 до 100 значения I2 варьируются от

Data Science

Почему для двух одинаково обученных моделей разная точность?

00

Вопрос или проблема Обучал одну и ту же модель дважды с одним и тем же набором данных, теми же параметрами (эпохи, размер батча, скорость обучения и т. д.). Но обе обученные модели показывают разную точность как на обучающей, так и на тестовой выборке

Data Science

Подсчет вывода в архитектуре LSTM много-к-одному

00

Вопрос или проблема Я нов в области рекуррентных нейронных сетей, но я хочу обучить свои данные с помощью LSTM, и у меня возникают проблемы с пониманием архитектуры Many-to-One LSTM. Предположим, размер моих данных составляет time_step x num_features

Data Science

Потери уменьшаются, но нейронная сеть показывает постоянный выход.

00

Вопрос или проблема Я обучил нейронную сеть, и функция потерь уменьшается с каждой итерацией, но выходные данные всегда одни и те же. Кто-нибудь может помочь. def forward_prop(x,w1,b1,w2,b2,w3,b3): Z1 = np.dot(w1,x.T) + b1 A1 = sigmoid(Z1) Z2 = np.

Data Science

Как построить симметрию входных данных в глубокой нейронной сети?

00

Вопрос или проблема У меня есть глубокая нейронная сеть, которая принимает $n$ входов $X = [X_1, \ldots, X_n]^T$ и выдает $n$ выходов $Y = [Y_1, \ldots, Y_n]^T$. Обычно я могу просто создать стандартную глубокую нейронную сеть с несколькими полностью

Data Science

Статистический тест значимости в глубоких нейронных сетях для задач регрессии

00

Вопрос или проблема Я читал учебник “Тест на статистическую значимость для сравнения алгоритмов машинного обучения”, в котором предлагается использовать k-слой и применять соответствующий статистический тест. Предположим, что у меня есть обучающая

Data Science

Какую модель применить к панельным данным, где уникальный идентификатор имеет 6-8 записей, а общее количество записей составляет 2 000 000?

00

Вопрос или проблема Я новичок в таких панельных данных, где у меня есть несколько наблюдений для одного и того же идентификатора в разные кварталы, и я не уверен, какой машинный алгоритм обучения я могу применить. У меня есть данные с Q1-18 по Q4-2020

Data Science

Как инициализируется скрытое состояние GRU

01

Вопрос или проблема Это ГРУ. Теперь каково будет значение $h_t$ при $t$=$0$? То есть, каково будет значение скрытого состояния в самом начале? Если вы интуитивно подумаете, что должно представлять h_t (то есть h_t-1), очень свободно говоря, это должно

Data Science

Плотный слой: как преобразовать вектор высокой размерности в одномерный? (сигмоидная функция)

00

Вопрос или проблема У меня есть плотный слой, который преобразует вектор размерности 100 в объект размерности 1 с помощью сигмоидной функции. Я понимаю, как сигмоидная функция преобразует число в число между 0 и 1. Но я не понимаю, как она преобразует размерность векторов?

Data Science

Существуют ли пакеты R, которые поддерживают глубокие RNN?

00

Вопрос или проблема Недавно я нашел интересную статью о том, что на самом деле значит, что рекуррентная нейронная сеть (RNN) является глубокой здесь. Глубину можно добавлять несколькими способами (состояние к состоянию, вход к состоянию и т.

Data Science

Какой лучший способ выбрать подходящую модель для сравнения документов?

00

Вопрос или проблема У нас есть разные предобученные модели, такие как BERT, USE, ELMo, Word2Vec, FastText и т. д., у нас есть документы разных размеров (большие, средние, маленькие). Теперь мы хотим провести сравнение документов.

Data Science

Мне нужны источники вопросительных, восклицательных и повелительных предложений.

00

Вопрос или проблема Я работаю над накоплением большой базы данных размеченных предложений для нескольких проектов/экспериментов. В настоящее время я использую только Википедию и проект Гутенберг в качестве источников данных. Между этими двумя источниками

Data Science

как маркировать 3D модель для задачи сегментации

00

Вопрос или проблема Я работаю с набором данных 3d мешей, мне нужно пометить его, чтобы обучить свою модель глубокого обучения для задачи сегментации, как показано на картинке. Я провел дни в поисках инструмента для аннотации моих 3d данных, но, к сожалению, ничего не нашел.