检索增强微调（RAFT）简介

AI最新资讯3个月前发布 tree

42 0 0

今日应用

Reecho睿声

Reecho睿声是一款专注于5秒瞬时语音克隆和超拟真语音合成的创新产品，由自研尖端Reecho文生语音大模型驱动，可深入理解文本，瞬时克隆任意声音，并实现与真人无异的超拟真语音合成效果。

今日话题

检索增强微调（RAFT）简介

重点标签 RAFT、微调方法、大型语言模型、检索增强、领域特定

文章摘要

本文介绍了一种名为检索增强微调（RAFT）的方法，它是针对大型语言模型（LLMs）的微调方法，旨在提高模型在特定领域内以“开放书本”设置回答问题的性能。开放书本设置是指模型可以参考文档来回答问题的范式。RAFT通过训练模型忽略不对回答给定问题有贡献的检索到的文档，从而消除干扰。此外，RAFT使用思维链式响应进一步完善了模型的推理能力。当应用于领域特定的RAG时，RAFT在各种数据集上始终提高了性能。

RAFT建立在Retriever Aware Training (RAT)的基础上，并在RAG应用程序中推广超出API的范围。文章通过类比考试的方式，解释了封闭书本考试和开放书本考试的区别，并引入了特定领域的开放书本考试的概念。RAFT专注于特定领域的开放书本考试，旨在使预训练LLM适应这个特定领域。

在实验中，使用自然问答（NQ）、Trivia QA、Hotpot QA、HuggingFace、Torch Hub、TensorFlow Hub和PubMed QA等数据集来评估RAFT。评估结果显示，RAFT在医学（PubMed）、通用知识（HotPotQA）和API（Gorilla）基准上都取得了显著的性能提升。

文章还提供了一个关于如何为RAG应用程序训练您自己的RAFT模型的简短教程，包括数据集准备、模型微调和模型部署。通过使用Llama2-7B等基础模型进行微调，可以在各种设置中实现高性能的领域特定RAG任务。

结论：
RAFT是一种有效的微调方法，可以显著提高LLMs在特定领域内以“开放书本”设置回答问题的性能。通过训练模型忽略干扰文档并使用思维链式响应，RAFT增强了模型的推理能力。实验结果表明，RAFT在多个数据集上取得了显著的性能提升，证明了其在实际场景中的应用潜力。未来，领域内检索增强生成（RAG）将继续在工业和学术领域引起兴趣，为不同企业部署定制模型提供了便利。

文章来源

原文地址: 点我阅读全文
原文作者: AIGC最前线

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

检索增强微调（RAFT）简介

今日应用

今日话题

文章摘要

文章来源

OpenAI Sora最强竞争对手来了，Google DeepMind、TikTok等打造视频生成工具Haiper.ai，免费！

Zephyr 141B-A35B开源大模型发布，基于ORPO新技术

相关文章

暂无评论

热门网址

热门标签