Каковы теоретические различия между многозадачным обучением и обучением с переносом через донастройку?

Question 1

Предположим, у меня есть следующие сценарии:

У меня есть куча фруктов, а именно яблоко, апельсин и банан. Я просто создал многозадачную модель, где моя сеть сначала говорит мне, какой это фрукт, а затем определяет его цвет. Предположим, если я дам своей сети яблоко, она скажет мне: (а) это яблоко, (б) оно красное. Проведя некоторое теоретическое исследование, я понял, что это один из типов индуктивного обучения переносу (TL) (исправьте меня, если я ошибаюсь). Таким образом, сеть одновременно учится выполнять 2 задачи.
У меня есть куча объектов, например, куб, шар и треугольник. Здесь я также хочу, чтобы моя сеть выполняла то же, что и в сценарии 1. То есть, она скажет мне: (а) является ли это кубом или нет, и (б) затем определяет цвет. Поэтому я перенёс обученные веса и параметры из сети сценария 1 в этот сценарий. Таким образом, я выполнил настройку на основе TL здесь.

Итак, с теоретической точки зрения у меня есть несколько сомнений. Мне нужно прояснить свою идею и получить несколько идей от экспертов.

Если я рассматриваю сценарий 2, по определению TL на основе тонкой настройки, задача сценария 1 (яблоко и красный) является моей источниковой задачей, а задача сценария 2 (куб и красный) – целевой задачей. Исходя из моего понимания, я считаю, что каждый подход индуктивного TL имеет источник и целевую задачу. Таким образом, для сценария 2 это соответствует моему пониманию.

[РЕАЛЬНЫЕ ВОПРОСЫ]
2. Теперь появляется путаница в моем теоретическом понимании. В сценарии 1 также есть 2 задачи – (а) определить фрукт, (б) определить цвет. Итак, что будет моей источниковой задачей, а что будет целевой задачей? Чтобы прояснить мое теоретическое описание или объяснить мое мышление словами, мне нужно это знать.

3. Поскольку я выполняю здесь 2 TL задачи, как определить весь сценарий?

Question 2

Согласно моему пониманию, в обоих изложенных выше сценариях, когда изучаются тип объекта и цвет, вы выполняете многозадачное обучение. То есть вы учите вашу модель одновременно выполнять две задачи: 1. Предсказание типа объекта (какой фрукт/форма) и 2. Предсказание цвета. Так что это не похоже на TL, а скорее на многозадачное обучение.

1.
TL действительно имеет некоторую источниковую задачу. Но все, что вы делаете в TL, это замораживаете всю модель, за исключением последних нескольких слоёв, и переобучаете их на вашем конкретном наборе данных (или добавляете несколько слоёв в конце и обучаете их). TL не обучает вашу модель с самого начала для новой задачи. Но вышеупомянутые сценарии не являются TL. Так что двусмысленно называть их источниковой и целевой задачей.

2.Как сказано выше, оба из них являются многозадачным обучением, а не TL. Поэтому двусмысленно называть их источниковой и целевой задачей.

3.Оба упомянутых сценария – это многозадачное обучение. Хотя вы можете использовать любой из них в качестве вашей источниковой задачи и провести TL, чтобы работать над другой. Например, вы можете обучать вашу модель фруктов и цветов в сценарии 1 и применить обучение переносу для второго сценария (чтобы изучить форму и цвет). Поскольку у них есть некоторые общие свойства, обучение переносу здесь является допустимым вариантом.

Каковы теоретические различия между многозадачным обучением и обучением с переносом через донастройку?

Вопрос или проблема

Ответ или решение

Теория

Пример

Применение и нюансы

Заключение