Data Science
Может ли производительность CNN зависеть от случайного семени разделения на обучение, тестирование и валидацию?
00
Вопрос или проблема Я занимаюсь многоклассовой классификацией и сравниваю влияние двух техник улучшения изображений (IET). IET 1 работает лучше, чем IET 2 при случайном начальном значении x (для разделения на тренировочный, тестовый и валидационный наборы).
Data Science
Предобработка для дообученной модели CNN на основе предобученных моделей
00
Вопрос или проблема Необходимо ли предварительно обрабатывать изображения так же, как это было сделано во время обучения предобученных моделей в нашей дообученной модели для использования её в другой задаче классификации? Допустим, у меня есть предобученная
Data Science
Отрицательные примеры для нейронной сети классификации изображений “Да/Нет”
00
Вопрос или проблема Я пытаюсь переобучить нейронную сеть с использованием трансферного обучения, чтобы она могла классифицировать, есть ли на изображении определенный объект, скажем, автомобиль. Мой положительный набор данных довольно мал, всего 2500~ изображений.
Data Science
перенос весов из tensorflow в pytorch
00
Вопрос или проблема Существует модифицированная модель efficientnet TF, которую я пытаюсь смоделировать в pytorch. Я внес изменения в архитектуру модели в pytorch, выгрузил веса модели TF и загрузил их обратно в новую модель pytorch.
Data Science
Почему не использовать линейную регрессию для дообучения последнего слоя нейронной сети?
00
Вопрос или проблема В трансферном обучении часто лишь последний слой сети перенастраивается с использованием градиентного спуска. Однако последний слой обычной нейронной сети выполняет только линейное преобразование, так почему мы используем градиентный
Data Science
Замораживать или нет: батч-нормализация в ResNet при трансферном обучении
00
Вопрос или проблема Я использую модель ResNet50, предобученную на ImageNet, для выполнения трансферного обучения, адаптируя её для задачи классификации изображений. Простой способ сделать это — просто зафиксировать сверточные слои (или на самом деле все
Data Science
Возможно ли дообучение BERT на нескольких наборах данных? (Каждый набор данных имеет свою цель)
00
Вопрос или проблема BERT можно дообучить на наборе данных для конкретной задачи. Возможно ли дообучить его на всех этих наборах данных для различных задач, а затем использовать для этих задач вместо того, чтобы дообучать модель BERT, специфичную для каждой задачи?
Data Science
Речь в текст для неподдерживаемого языка
00
Вопрос или проблема Я работаю над проектом, чтобы интегрировать старую добрую распознавание речи в своем приложении. Однако я хочу сделать это на диалекте моей страны, который не поддерживается такими крупными API, как Azure, AWS и т.
Data Science
Существуют ли веса звука или аудио для VGG или Inception?
00
Вопрос или проблема Я хочу использовать VGG16 (или VGG19) для задачи кластеризации голосов. Я читал несколько статей, которые предлагают использовать VGG (16 или 19) для построения векторного встраивания для алгоритма кластеризации.
Data Science
Когда это можно назвать трансферным обучением?
00
Вопрос или проблема Общее определение передачи обучения звучит так: «Передача обучения — это улучшение обучения в новой задаче посредством передачи знаний из связанной задачи, которая уже была изучена.» — Глава 11: Передача обучения, Справочник по исследованиям
Data Science
Переходное обучение между языковой моделью и классификацией
00
Вопрос или проблема Следуя этой лекции fast.ai, я пытаюсь понять механизм переноса обучения (Transfer Learning) в обработке естественного языка (NLP) от общего языкового моделирования (LM) к задаче классификации. Что именно берется из обучения языковой модели?
Data Science
Переносное обучение: Плохая производительность при замене последнего слоя
00
Вопрос или проблема Я использую подход с transfer learning. Для этого я следовал уроку tensorflow для поэтов. Я использую заранее обученную архитектуру InceptionV3, натренированную на наборе данных Imagenet. Последний слой и классификация softmax были
Data Science
Обучение с переносом с использованием множества небольших наборов данных
00
Вопрос или проблема Контекст Я работаю над моделью обработки естественного языка (NLP), которая может классифицировать документы в одну из N категорий. У меня есть данные документов от нескольких различных клиентов. Темы документов схожи между клиентами