标签:跨层注意力

麻省理工提出“跨层注意力”,极大优化Transformer缓存

摘要:专注于AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,以及市场研究和AIGC开发者生态。其中,Tr...