猛将|AI再添猛将,全球首个知识增强千亿大模型鹏城-百度·文心发布( 三 )


在懂懂看来 , 鹏城-百度·文心大模型众不同之处就在于数据与知识的结合 , 这也是百度的独特优势所在 , 所以文心定位是知识增强大模型 。
众所周知 , 知识是人类智慧的结晶 , 是人类进步的重要推动力 。 想让计算机像人一样理解和认知世界 , 也需要让计算机具备获取、运用知识的能力 。 百度提出了知识增强大模型“文心” , 突破了多源异构数据难以统一表示与学习的瓶颈 。 文心如同站在巨人的肩膀上 , 训练效率和理解准确率大幅提升 , 并具备更好的可解释性 。 据悉 , 随着模型不断进展 , 现在不仅能做理解 , 还能做生成 , 比如说要做知识推理、小说续写、歌词创作、作诗 , 这些都可以做得很好 。

  • 首先看跨语言 。
人类历史长河中曾经有几万种语言 。 从纵向看 , 一个国家、地区在不同时代有不同的语言 。 从横向看 , 同一时代不同国家甚至不同地区都有不同的官方语言 。 所以同一语义可能会有很多种不同的表达 。 为此 , 百度研制了知识增强跨语言大模型ERNIE-M , 可同时从多种语言中学习 , 提升跨语言理解能力 , 让机器有了同时学习和理解多种语言的能力 。
比如 , 做机器翻译的时候 , 以前是需要双语对照的 , 一句中文对应一句英文的译文 , 现在基于文心大模型不必再死板的一一对照 , 而是非平行语料 。
  • 其次是跨模态 。
人类是通过语言、语音、视觉等多种模态获得对真实世界的统一认知 。 AI如果像人一样理解真实世界 , 不仅需要听懂语音、看懂图像视频、理解语言 , 这就需要突破不同模态、异构信息的语义融合统一难题 。 百度提出知识增强跨模态大模型 , 包括理解大模型ERNIE-ViL、生成大模型ERNIE-ViLG , 实现了复杂场景的多层次、高精度语义理解 。 其中 , 理解大模型ERNIE-ViL在视觉常识推理任务榜单获得第一名;生成大模型ERNIE-ViLG实现文图双向生成 , 是全球规模最大中文跨模态生成模型 。
AI的“轮子”驶向千行百业
猛将|AI再添猛将,全球首个知识增强千亿大模型鹏城-百度·文心发布
文章图片

我们在文章的开篇就讲过 , 千行百业对于AI的期待都很高 , 但AI面临落地难的问题 。 大模型堪称AI的“轮子” , 轮子造好了 , 行业应用也就会越跑越快 , 加速AI的落地 。 正如高文院士所说 , “预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具 。 运用这个工具 , 可以帮助做很多人工智能的赋能 , 不局限于某个领域 , 这对人工智能的发展都是一个福音 。 ”
文心大模型是百度大脑最新的核心技术突破 , 能够做到效果提升、带来成本降低、实现应用便捷 , 大幅降低AI应用门槛 , 满足各种场景需求 , 加速产业的智能化升级 。

推荐阅读