每经采访人员:郭荣村 每经实习采访人员:安宇飞 每经编辑:梁枭
【训练|百度CTO王海峰:预训练大模型成为人工智能新方向】“一别今朝两月秋 , 重来相见酒频投 。 不堪回首忆当时 , 几度春风醉不休 。 ”你可能想不到 , 这是人工智能创作的诗词 。
12月8日 , 鹏城实验室与百度联合召开发布会 , 发布了双方共同研发的知识增强千亿大模型——鹏城-百度·文心 。 上述诗词创作 , 正是在这一模型中人工智能语言理解和生成能力显著提升的表现 。
百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰认为 , 预训练大模型成为人工智能的新方向 , 而知识增强大模型能降低AI开发与运用的门槛 。
预训练模型成创新发展重要工具
“人类社会已经经历了三次工业革命 , 现在正在经历第四次工业革命 , 其中核心的技术之一就是人工智能 , 而人工智能需要算法、算力和数据的共同支撑 。 ”王海峰说 。
王海峰表示 , 近年来数据越来越多 , 算法越来越强大 , 算力也越来越强大 。 在这种背景下 , 预训练大模型已成为人工智能的新方向 。
据了解 , 人工智能需要用大量的数据对其进行训练 , 理论上来讲 , 投喂数据越多、数据质量越高 , 模型效果就会越好 。 而预训练模型 , 顾名思义就是预先训练好的模型 , 可以帮助人们降低模型创建和训练的成本 。
王海峰称 , 预训练大模型需要深度学习的算法 , 也需要大的数据、大的算力 , 做自监督学习(模型直接从无标签数据中自行学习 , 无需标注数据),再面向不同的任务、在不同的应用场景里做少量任务数据进行迁移学习 , 进而应用于很多场景 , 在各行各业开花结果 。
中国工程院院士、鹏城实验室主任高文说:“预训练模型对整个科学的发展、社会的发展、创新的发展来说都是非常重要的工具 。 运用这个工具 , 可以帮助做很多人工智能的赋能 , 不局限于某个领域 , 这对人工智能的发展都是一个福音 。 ”
知识增强预训练模型降低AI开发应用门槛
人工智能是新一轮科技革命和产业变革的重要驱动力量 , 它需要在各行各业有很强的通用性 , 才能成为产业革命的通用力量 。 随着知识增强大模型出现 , 开发难度更小 , 所需要的数据标注量也更小 , 进而使用门槛更低 。
王海峰认为 , 知识增强大模型能提高人工智能的学习效率 , 它从大规模知识和海量数据中融合学习 , 效率更高、效果更好 , 具有良好的可解释性 。
他表示 , 以金融领域为例 , 鹏城-百度·文心的合同智能解析能在1分钟内完成对相关合同条款文本的解析识别 , 速度是之前的几十倍 , 大幅提高工作效率 。
推荐阅读
- Baidu|百度抢跑元宇宙 却默认“输给”字节?
- Tencent|继百度网盘后腾讯微云也已解除限速 不用单独下载App
- 词条|百度百科上线2500万词条,超750万用户参与共创科普知识内容
- Baidu|百度网盘青春版正式上线 只能传3次文件被吐槽是“一次性App”
- 青春|百度网盘青春版正式上线:免费空间 10GB,支持无差别速率下载
- Create|什么是元宇宙游戏?百度《希壤》成国内第一个吃螃蟹的人
- 量子|百度量子平台2.0重磅发布!推动构建量子计算领域繁荣生态
- 汽车|Apollo迎来7.0重大升级,百度自动驾驶开放平台迈向工具化时代
- 国计民生|25万亿级新蓝海!百度、华为、腾讯重磅出击,抢食智慧城市"大蛋糕",AI巨头如何赋能?来看真实案例
- 方案|百度:到2030年将推动交通减碳7000万吨