Zephyr 141B-A35B开源大模型发布,基于ORPO新技术

AI最新资讯2个月前发布 tree
42 0 0

今日应用


今日话题


Zephyr 141B-A35B开源大模型发布,基于ORPO新技术
Zephyr 141B-A35B开源大模型发布,基于ORPO新技术
 

重点标签 Zephyr 141B-A35BORPOAI优化性能效率自然语言处理

文章摘要


近日,Zephyr 141B-A35B大模型发布,其性能和效率方面确立了新的标杆。该模型是Mixtral-8x22B的继任者,采用了创新的Odds Ratio Preference Optimization (ORPO)对齐算法。与传统的DPO和PPO等微调方法不同,ORPO标志着AI优化的范式转变。

与前身不同,ORPO消除了对监督微调(SFT)的需求,简化了计算过程。这一创新在增强性能的同时最小化了资源消耗,符合当今注重环境的技术景观。Zephyr 141B-A35B在“argilla/distilabel-capybara-dpo-7k-binarized”偏好数据集上训练,仅用1.3小时便完成了在配备有8个H100 GPU的四个节点上的严格处理。

性能评估结果显示,Zephyr 141B-A35B在多个基准测试中表现优异,如MT Bench和IFEval,以及LightEval评估套件中的稳健性测试。在实际应用中,该模型可用于增强客户服务互动、提供上下文感知的个人数字助手响应等,同时增强用户体验并为依赖AI的企业带来成本节约。

Zephyr 141B-A35B代表了AI性能和效率的一大飞跃,采用了新颖的ORPO算法,超越了传统的微调方法。在训练效率和性能指标方面表现出色的同时,该模型在一般聊天能力和真实世界模拟的稳健性方面也展现了优势。其应用范围广泛,从增强客户服务到改进个人数字助手,为依赖人工智能的企业带来成本降低的希望。

文章来源


原文地址: 点我阅读全文
原文作者: AIGC最前线

© 版权声明

相关文章

暂无评论

暂无评论...