Data Science
Как использовать новый набор данных на предобученной модели нейронной сети?
00
Вопрос или проблема Я собрал набор данных, который хотел бы передать предобученной модели для выполнения некоторых прогнозов. Я ищу несколько шагов/процессов, которые могли бы направить меня в этом. Должен ли я дообучить? Если да, то что именно нужно дообучить?
Data Science
Проблемы в настройке моделей OCR с использованием пользовательских наборов данных
00
Вопрос или проблема Я экспериментировал с дообучением моделей OCR, используя собственный набор данных, в частности с фреймворками doctr и PaddleOCR. Моя цель – улучшить точность распознавания, особенно на документах, которые претерпели различные изменения.
Data Science
Понимание настройки параметра альфа в статье LORA
00
Вопрос или проблема Я читал статью о LORA https://arxiv.org/pdf/2106.09685.pdf, и одна вещь, которую я не понимаю, это раздел 4.1, где обновления изменяются с помощью альфа, где альфа – это константа в r. Говорится, что альфа устанавливается на
Data Science
Тренируйтесь на нескольких доменах, затем донастройтесь на конкретном домене.
00
Вопрос или проблема Имеет ли смысл сначала обучить модель на изображениях из нескольких доменов, а затем провести “тонкую настройку” на одном конкретном домене, чтобы улучшить ее производительность на этом домене? Например, можно обучить детектор
Data Science
Расчет стоимости модели Gemini 1.0 Pro
00
Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы
Data Science
Почему не использовать линейную регрессию для дообучения последнего слоя нейронной сети?
00
Вопрос или проблема В трансферном обучении часто лишь последний слой сети перенастраивается с использованием градиентного спуска. Однако последний слой обычной нейронной сети выполняет только линейное преобразование, так почему мы используем градиентный
Data Science
Возможно ли дообучение BERT на нескольких наборах данных? (Каждый набор данных имеет свою цель)
00
Вопрос или проблема BERT можно дообучить на наборе данных для конкретной задачи. Возможно ли дообучить его на всех этих наборах данных для различных задач, а затем использовать для этих задач вместо того, чтобы дообучать модель BERT, специфичную для каждой задачи?
Data Science
Помнит ли GPT-3 данные из подсказок, использованных для его дообучения?
00
Вопрос или проблема Я пытаюсь дообучить модель, используя API дообучения OpenAI. Я передаю тексты (например, статьи из газет) в качестве подсказок и данные, которые хочу получить, в качестве завершений. Рассмотрим следующее: если статья из газеты, которую