蚂蚁技术研究院李建国:扩散语言模型或成LLM新方向,生成速度可达传统模型4倍以上

专题:2026北京智源大会

蚂蚁技术研究院李建国:扩散语言模型或成LLM新方向	,生成速度可达传统模型4倍以上-第1张图片

  6月12日至13日,2026第八届北京智源大会在北京中关村国际创新中心举行。蚂蚁技术研究院深度学习实验室负责人李建国出席并演讲 。

蚂蚁技术研究院李建国:扩散语言模型或成LLM新方向,生成速度可达传统模型4倍以上-第2张图片

  李建国表示 ,扩散模型或将成为语言模型下一阶段的重要发展方向和补充,其在生成速度和可编辑性方面展现出显著优势。

蚂蚁技术研究院李建国:扩散语言模型或成LLM新方向,生成速度可达传统模型4倍以上-第3张图片

  他解释到 ,扩散模型在图像生成领域已是主流范式,应用非常广泛。正向过程是通过对图像逐步添加噪声直至变为白噪声,反向过程是从白噪声中逐步去噪 ,恢复出原始图像 。

  而在语言领域 ,当前主流范式是“Next Token Prediction ”。“就像打字机一样,我前面打出一个字,后面接着就依赖前面去产生下一个字。扩散语言模型则将图像领域的范式迁移到语言中 ,可以像印刷机一样批量、成批地输出词元 。”

  李建国以今年2月发布的LLaDA 2.1模型(可编辑扩散生成)与蚂蚁百灵2.0模型(100B参数)对比为例。LLaDA的生成速度约为1000 token/秒,而百灵2.0约为200 token/秒,速度相差4倍以上。

  他指出 ,从核心特性看,有两个速度,一个是传统的AR模型 ,一次只输出一个token,即使采用投机采样方法(如MTP)也只能做到2-3个 。另外一个速度,就是扩散语言模型 ,起步平均能做到5-6个,在代码生成 、智能体等场景中,实际观察可超过10个 ,最高可达15个 。

  此外 ,扩散语言模型的另一个重要特性是可改写性。例如在生成过程中某个字出现错误,可以通过“悔改”机制只修改错误的那一个位置,而无需重新生成整个序列。

  新浪声明:所有会议实录均为现场速记整理 ,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述 。

标签:

相关推荐

  • AI催生就业热潮,但新手难分一杯羹

    AI催生就业热潮,但新手难分一杯羹

      导语  各大企业掀起人才竞价大战,争抢有实战经验的成熟从业者,也引发业内思考:企业该如何吸纳新生代求职者。  美国各大企业争相填补人工智能相关岗位,但想要入行AI行业的新人却屡屡碰壁。  一份独家提供给CNN的最新调研显示,当下经济最热门的AI赛道,就业机会大多留给资深从业者,而非零基础新人。  追踪企业AI落地应用的研究机构...

    2026/06/16
  • Anthropic将与特朗普政府就Mythos模型争议举行会谈

    Anthropic将与特朗普政府就Mythos模型争议举行会谈

      据一位消息人士透露,Anthropic的高级员工周一正在华盛顿特区与特朗普政府官员举行会谈,试图解决这家AI公司近期与美国政府之间引发高度关注的争端。  据Anthropic发表声明称,公司于周五收到了一份援引“国家安全权力”的出口管制指令,被要求“暂停美国境内外的任何外籍人士”访问其最新AI模型Fable5和Mythos5。  为了确保遵守该指令...

    2026/06/16
  • 约克大学宿舍条件(约克大学宿舍条件如何)

    约克大学宿舍条件(约克大学宿舍条件如何)

    加拿大约克大学是几本加拿大约克大学是一本。其详细内容如下:定义和地位:一本是中国的重点大学,通常包括教育部直属的大学以及其他一些在学术水平、师资力量等方面表现优秀的大学。这些大学在中国的高等教育中处于重要地位,具有很高的声誉和影响力。招生录取:一本大学的招生录取通常是在高考中成绩优异的学生中进行的。加拿大约克大学在我国大学体系中,相当于吉林大学。以下是具体...

  • 中国警告韩国留学生/中国留学生在韩国遇害

    中国警告韩国留学生/中国留学生在韩国遇害

    中国比较多的外国留学生〖壹〗、024年在华留学生中,韩国留学生数量比较多,达06万人,占在华留学生总数的12%,连续十余年稳居首位。以下从规模、分布、成因及次要生源国四个维度展开分析:韩国留学生规模与占比根据教育部及多机构统计,2024年在华留学生总数突破50万人,其中韩国留学生以06万人的规模占据首位,占比超10%。〖贰〗、中国留学生数量比较多的国家是韩...

  • 汉堡大学申请条件/汉堡大学好申请吗

    汉堡大学申请条件/汉堡大学好申请吗

    德国留学——汉堡大学的申请语言要求〖壹〗、德语要求对于德语授课的专业,汉堡大学要求申请者具备以下语言证书之一:DSH-2或DSH-3;德福(TestDaF)最低15分,且比较多允许一个单项为3分;歌德学院C1或C2证书;telcDeutschC1Hochschule证书;预科考试合格证书。注意:所有语言证书的有效期不得超过三年。〖贰〗、报名语言要求...

  • 【新加坡永居续签条件,新加坡永居续签条件是什么】

    【新加坡永居续签条件,新加坡永居续签条件是什么】

    2025新加坡自雇EP最全解析,政策趋势+条件流程+续签要求!〖壹〗、026年1月1日起,续签需满足新薪资标准及COMPASS评估要求。EP续签要求续签周期:EP每两年续签一次,最长可一次性续签三年。核心条件:公司运营:需正常运营,建议年流水达20-30万新元以上(无利润要求,无需真实租赁办公室)。薪资发放:每月按时发放工资(需符合前期递交EP时的打分要求...

  • 美国考研条件申请/美国考研条件申请要求

    美国考研条件申请/美国考研条件申请要求

    出国考研需要什么条件出国考研,特别是在美国读研究生,一般需要满足以下几个条件:语言能力TOEFL成绩:通常要求至少79分以上,部分顶尖学校或文科专业要求可能高达100分。TOEFL成绩的高低与学校的排名和专业性质密切相关,一般来说,排名越高的学校或文科类专业对TOEFL成绩的要求越高。出国考研的条件主要包括以下几点:语言成绩TOEFL成绩:申请者通常需...

  • 新航道面试标准(新航道笔试)

    新航道面试标准(新航道笔试)

    济南新航道教育信息询问有限公司招聘济南新航道教育信息询问有限公司此次招聘涉及多个岗位,涵盖教师、留学文案、助教等,提供有竞争力的薪资与丰富福利,可通过邮箱或电话投递简历。济南新航道教育信息询问有限公司的薪酬待遇较为合理,年薪范围在6万至10万之间。公司的工作环境保持整洁和宽敞,为员工提供了一个舒适的工作空间。员工可以享受到生日福利,体现了公司对员工的关...

  • 北京留学生落户北京(北京留学生落户标准)

    北京留学生落户北京(北京留学生落户标准)

    留学生北京落户政策详细情况!〖壹〗、办理落户:审批通过后,下载函件、转递档案,提交至公安局办理准迁。2025年新增支持政策优先引进:世界排名前300高校(The/QS)的理工医类硕士及以上人才,首次回国3年内优先落户;重点产业领域可放宽排名限制。落户便利:简化集体户落户和档案存放流程,提供“一站式”服务。〖贰〗、教留服落户政策受理范围:从2024年起,仅...

  • 【移居泰国条件,怎么移民泰国户籍】

    【移居泰国条件,怎么移民泰国户籍】

    想要顺利移居泰国,需要提前做哪些准备?〖壹〗、语言准备:虽然泰国人民普遍对外国人友好且世界化水平较高,但学习一些基础的泰语将有助于更好地融入当地生活。文化适应:了解并尊重泰国的文化传统和习俗,这将有助于建立良好的人际关系并避免不必要的误解。社交圈子:在移居初期,积极参与当地的社交活动,结识新朋友,这将有助于更快地适应新环境。〖贰〗、移居泰国涉及多方面考虑,...

    2026/06/16
返回顶部