Тонкая настройка LLM с ограниченным количеством документов и иерархией

Вопрос или проблема

Привет, энтузиасты LLM.

Интересно, есть ли современные подходы к тонкой настройке модели в соседнем проекте, если:

область документов ограничена (но больше, чем просто несколько),
эти документы регулярно имеют взаимосвязи.

На самом деле все юристы должны сталкиваться с этой проблемой, связанной с п. 2.
Не должна ли тонкая настройка быть гораздо более эффективной, если бы с самого начала была чтото вроде модели отношений между документами для добавления детализации и весов?

В конце концов, для всех приложений, которые полагаются на минимум галлюцинаций, важно получать как можно большую точность, чтобы иметь возможность или разрешение использовать модель вообще.

(Как упоминалось, это должно касаться всех юридических сотрудников, но также и врачей.)

Спасибо за ваши идеи, не стесняйтесь поправлять меня без обиняков.

Или я просто использую неправильные слова, и на самом деле имею в виду “просто” граф знаний?

Что ж, теперь я могу ответить на это.

То, что я искал, это RAG – генерация с усовершенствованным извлечением информации.

На самом деле, интересно, как там уважаются иерархии, но в общем, да, это RAG.

🙂 вопрос закрыт.

Ответ или решение

В рамках обсуждения, которое обращается к специалистам в области больших языковых моделей (LLM), возникает вопрос о настройке моделей в условиях ограниченного объема документов и их иерархической структуры. Этот вопрос актуален для юристов и медицинских работников, которые часто работают с документами в сложных взаимосвязях. Рассмотрим подробное решение, основанное на данном контексте.

Контекст и Задача

Ограниченное количество документов. Когда у вас есть ограниченный набор данных для настройки LLM, важно найти стратегию, которая максимизирует эффективность с учетом имеющейся информации.
Иерархические и взаимосвязанные документы. Многие из привлекаемых документов связаны между собой, что предполагает наличие взаимосвязей и иерархии информации. Это становится особенно актуальным в таких областях, как правовая и медицинская, где документы могут представлять собой части более крупной системы знаний.

Решение: RAG (Retrieval-Augmented Generation)

RAG представляет собой гибридный подход, сочетающий генеративные модели с механизмами извлечения информации. Он используется для повышения точности генерации текста за счет включения внешних данных в процесс генерации. Это делает его идеальным решением для работы с ограниченными данными и документами, которые находятся в сложных взаимосвязях.

Извлечение информации (Retrieval): На первом этапе RAG использует поисковый движок для извлечения наиболее релевантных документов. Это позволяет модели фокусироваться на информации, которая наиболее важна для решаемой задачи.
Генерация текста (Generation): Далее, LLM использует извлеченные данные для генерации ответа или текстового содержимого. Это снижает уровень галлюцинаций — некорректных или неактуальных выводов.

Практические Вопросы и Иерархии

Когда речь идет о соблюдении иерархии в модели RAG, возможно несколько подходов:

Моделирование иерархий: Уточнение модели с учетом иерархии может включать создание документированной структуры (например, в виде графов знаний), где каждый документ занимает свое место в общей системе.
Навеска веса: Совмещение иерархии и веса документов может повысить адаптацию модели к специфике данных и их значимости.

Подход RAG позволяет использовать иерархические структуры, такие как графы знаний, для более точного представления связей между документами, что может быть критически важным в юридических и медицинских приложениях.

Заключение

Для представителей юриспруденции и медицинской сферы, которые нуждаются в высокой точности и минимальной генерации недостоверной информации, подход RAG, поддерживающий использование иерархии документов и их взаимосвязей, является наиболее перспективным.

При оптимизации текста для SEO следует учитывать включение таких ключевых фраз, как "модель больших языковых моделей", "генерация дополненной извлечением", и "граф знаний", чтобы достичь более широкой аудитории и предложить экспертное содержание, релевантное запросам и интересам профессионалов.