今日应用
今日话题
文章摘要
张奇教授在科技慢半拍播客节目中,深入探讨了大规模语言模型和人工通用智能(AGI)的当前发展和未来前景。他强调了科研人员在变革时代中应持有的客观、理性态度,以及对于大模型和AGI的深入理解。张教授的新书《大规模语言模型:从理论到实践》旨在帮助读者系统掌握大语言模型的构建、应用和评测过程,面向自然语言处理和机器学习基础的读者。
在访谈中,张教授讨论了学术界和产业界在大模型领域面临的挑战,包括资源投入的巨大需求和商业模式的考量。他指出,目前大模型的研究主要集中在文本处理,而未来将发展多模态模型。张教授认为,学术界与企业的合作是推动大模型研发的有效模式。
关于国内外在大模型领域的差距,张教授表示,尽管技术差距看似在缩小,但实际上我们与OpenAI的整体距离难以评估,且可能比表面看起来更大。他强调,大模型的正确路径尚未明确,未来的发展充满不确定性和风险。
在讨论Scaling Law时,张教授表达了对该理论的怀疑,认为学术界对此尚无共识。他提出,大模型的“涌现”现象缺乏足够证据,且并非模型越大越好。此外,张教授还探讨了小模型的价值,特别是在嵌入式设备中的应用潜力。
针对大模型在企业中的应用难点,张教授指出,大模型通常无法达到企业对特定任务的高标准要求。他提出,AI原生应用的开发需要考虑特定场景,而不是简单替代人类工作。
最后,张教授分享了他领导的多模态理解模型眸思项目,以及针对盲人的“听见世界”公益项目。他认为,AGI的实现还需要大模型具备推理能力,而目前的大模型尚未达到这一水平。他强调,AGI的到来还有很长的路要走,需要更多的研究和探索。
核心观点:
– 科研人员应客观理性地对待大模型和AGI的发展。
– 大模型和AGI的研究需要巨大的资源投入,学术界与企业合作是有效模式。
– 国内外在大模型领域的差距难以评估,正确路径尚不明确。
– Scaling Law和“涌现”现象在学术界存在争议,大模型并非越大越好。
– 小模型在嵌入式设备中有特别价值,学术界将对其边界和能力有更明确认识。
– 大模型在企业应用中面临挑战,需要产品化并与具体应用场景结合。
– AGI的实现需要大模型具备推理能力,目前尚未达到这一水平。
文章来源
原文地址: 点我阅读全文
原文作者: AIGC开放社区