文章资讯

香港科技大学(广州)机器学习基础实验室招收多名2024Fall/2025Spring博士生、研究助理、博士后

步骤2:撰写摘要香港科技大学(广州)是亚洲乃至全球领先的研究学府之一,2023年QS世界大学排名第40位,泰晤士高等教育世界年轻大学排名第2位。该校重点发展...

专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法

摘要:最新的研究GlitchHunter针对大型语言模型(LLM)中偶尔出现的故障词元问题,通过收集和分类大量故障词元,显著提升了大模型的输出质量。这项研究由华中...

3D高斯场景补全新玩法!InFusion:扩散模型助力,效率提高20倍!

摘要总结:InFusion是一种创新的3D高斯补全方法,由中科大、港科大、蚂蚁和阿里巴巴的研究人员共同开发。该方法旨在为不完整的3D场景补充高斯,以实现更好的...

视觉prompt工程!无需微调、无需任何模型修改,让一个通用模型可以执行多种指定任务

摘要:本文探讨了如何将预训练的视觉模型适应新的下游任务,而无需进行特定任务的微调或模型修改。作者提出了一种视觉提示(Visual Prompting)的方法,该方...

MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜

摘要:AIxiv专栏是机器之心发布的一个专注于学术和技术内容的栏目,近年来已经报道了2000多篇内容,涵盖了全球各大高校和企业的顶级实验室,有效促进了学术交...

5亿个token之后,我们得出关于GPT的七条宝贵经验

摘要:OpenAI的ChatGPT和Whisper模型自2023年3月通过API集成以来,已过去一年。初创公司Truss的CTO Ken Kantzer在博客中分享了使用OpenAI模型处理5亿个token...

开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4

步骤2:撰写摘要Meta公司发布了备受期待的开源大模型Llama 3,这一消息在AI领域引起了广泛关注。公司创始人扎克伯格在Facebook上宣布了这一重大消息,并表示L...

下接万卡集群、上连AI原生应用,操作系统的进化超出你的想象

在2024年的百度Create AI开发者大会上,百度智能云发布了新一代智能计算操作系统——万源。这一操作系统的发布标志着百度在AI原生应用开发体验上的革新,也是其...

Llama 3来了!首批开源 8B 和 70B两个版本,未来有望开源400B大模型!

步骤2:撰写摘要Meta公司发布了其最新版本的开源大模型——Llama 3,并计划在未来几个月内推出新功能,包括更长的上下文窗口、额外的模型大小和增强的性能。Lla...

全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用

[tag3/Hugging Face/排行榜/SOTA][tag4/400B/性能/野兽][tag5/指令微调/安全/Meta AI]Meta公司最近发布了备受期待的Llama 3模型,该模型使用了24000块GPU进行...
12336