The Next Wave of Generative AI: Domain-Specific LLMs
Успех применения LLM в корпоративных use cases во многом зависит от узконаправленности модели. Компании встраивают LLM в собственные приложения и рабочие процессы, каждый из которых использует данные, специфичные для конкретной предметной области. Реализация LLM происходит одним из трех основных способов:
1. Создание LLM с нуляЭтот вариант предполагает сбор и подготовку совокупности источников текста, таких как документы, электронные письма и записи обслуживания клиентов. Затем, эксперты по работе с данными создают LLM и обучают ее интерпретировать, обобщать и генерировать контент на основе паттернов, идентифицируемых в основе данных. Создавая LLM с нуля, компания повышает вероятность того, что руководители будут делать
правильные решения на основе имеющихся данных.
Однако, для данного метода применения LLM существует ряд требований: обширные знания в области data science, большие объемы данных, и множество итераций и дорогостоящих вычислительных циклов.
2. Доработка существующей LLMНастройка предварительно обученной LLM под специфичные потребности компании позволит иметь выходные данные более точными, с меньшим количеством потребляемых моделью данными.
Данный вариант подойдет компаниям в сфере здравоохранения, юридических услуг или других отраслях, заинтересованные стороны которых используют
язык в зависимости от предметной области способами, которые предварительно обученные LLM не могут хорошо интерпретировать самостоятельно.
3. Обогащение промптов LLMКомпании могут обогащать вводный промпт, добавляя контент, относящийся к предметной области, такой как документация по продукту, отчеты об обслуживании клиентов, книги и научные статьи. Такой процесс называется поисковая дополненная генерация или RAG (Retrieval Augmented Generation). RAG просит LLM найти ответ в достоверном контенте, снижая риск галлюцинаций модели.
RAG известен как метод “заземления”, потому что он создает основу из фактов. RAG пользуется популярностью как
экономически эффективный метод уточнения фактов. Ожидается, что RAG станет стандартным подходом во всех секторах, часто дополняя вариант тонкой настройки.