研究|杨旭:人工智能“浪潮”下的思考与钻研

电影《复仇者联盟》系列中 , 我们看到钢铁侠的虚拟人工智能助手贾维斯:它可以根据现场战斗情况帮助钢铁侠出谋划策 , 指挥战场的各种情况 , 甚至有一次在危急关头它还自动帮助萨科启动了钢铁侠战甲 。
然而在现实生活中我们看到的机器人却和影视剧里相差甚远 , 它们往往需要根据制造者预设的问题和模板来回应人类的指令 , 如果遇到数据库中没有录入的问题 , 它们通常会答非所问 。
多年来 , 中国科学院自动化研究所副研究员杨旭专心致力于关于机器人认知发育、图算法及模式分析的研究 , 进而提高机器人理解外界环境的能力 。 “它们要像我们人类一样 , 不断地从外界获取见识 , 增长自身的知识和经验 。 ”杨旭如是说 。
人工智能的浪潮
一台服务机器人正在客厅里看似有条不紊地整理卫生 。 在它刚刚整理过的桌子上 , 可乐和漱口水被摆放在一起 , 不同品牌的护肤水被错乱地排列开来 。 在这个机器人的识别系统里 , 并没有关于应该将可乐放在冰箱之类的常识 , 它也不知道整理时应该区分不同品牌的护肤品 。
“我们需要能够适应家庭环境、灵活收拾家务的机器人 。 ”一位想要购买服务机器人的网友留言道 。 但很明显 , 目前的机器人生产商还不能满足他的要求 。
“它是依赖大量数据被制造训练出来的 , 因此只能完成数据范围内的预设任务 。 ”杨旭说 。 事实上 , 这种依靠大量训练数据驱动的方法来制造机器人并不是某一家公司的做法 , 而是整个机器人行业的现状 。 从2015年开始 , 利用互联网数据训练算法并进行测试成为人工智能行业的一股浪潮 。 “然而结果却是这些机器人因为不够智能以至于如今无法满足用户最真实的需求 。 ”
这种依靠互联网数据训练制造机器人的浪潮不仅使人工智能行业进入滞缓阶段 , 还影响了与机器人相关的教育行业 。
近些年 , 因为看好人工智能专业的工作前景 , 越来越多的学生开始选择这个专业 , 但他们大多学的还是互联网数据驱动的方法 。 “其实数据驱动方法的数学原理很简单 , 说直白点 , 它有点像工人调节参数 。 ”杨旭说道 , “看似预设了很多模型 , 但它在现实的复杂场景中却无法应用 。 ”在他看来 , 单纯地教学生做数据驱动并不能真正地培养学生的数学思维能力 , “我们应该扎实地去学和底层数学相关的理论知识 , 去制造真正具有创新性的人工智能机器 。 ”
2014年刚走出博士学位答辩会议室的杨旭
加深认识
事实上 , 在多年前 , 杨旭就已经开始研究提高机器人学习能力的方法了 。 杨旭本科就读于中国海洋大学海洋专业 , 学习的内容是人工智能在水下环境中的感知能力 。 “相比日常生活中常见的陆地环境 , 深蓝幽暗的水下世界具有更多的未知性 。 ”杨旭介绍道 。
本科的学习内容奠定了他未来研究的基本方向 。 2009年 , 杨旭前往中国科学院自动化研究所进修硕士和博士学位 , 进一步研究与机器人相关的理论知识 。 在他攻读博士期间 , “玉兔号”发射 , 这次事件给了他将研究内容应用于实践的机会 。 在传统方法中 , 研究者往往通过对关键点检测的方法来对机器人进行定位 。 然而荒凉的月球表面并没有现实生活中丰富的视觉元素 , 黑色的环境布满了视觉画面 , 周围是光秃的荒漠以及难以分辨不同特征的石子 。 “这种环境不同于我们日常生活的环境 , 但和海底世界有些相似 。 ”他向北京北京航天飞行控制中心建议使用图算法 。 杨旭解释道:“所谓图算法是在特征匹配过程中引入结构约束 , 将特征的对应问题转化为图结构的匹配问题 , 以此来成功解决月面巡视器的定位问题 。 ”
在这之后 , 杨旭开始进一步通过图算法来提高机器人适应环境的能力 。 2016年 , 已经结束了求学生涯并在中科院自动化研究所复杂系统管理与控制国家重点实验室工作两年的杨旭开始通过项目深入研究机器人的认知发育 。 那一年 , 国家自然科学基金委主办了一场比赛 , 比赛内容是让参赛各方指挥机器人在近海处的水下进行海参等海珍品捕捞 。 然而海平面下视觉光线幽暗 , 还有各种被海苔、沙子等半掩着的目标检测物 , 机器人很难对其进行检测识别 。 杨旭作为自动化所在这次项目中的负责人 , 结合多年来对图算法及机器人认知发育的研究 , 带领团队的学生在这项比赛中拔得了头筹 。
这项比赛也加深了杨旭对认知发育的认识 , “所谓认知发育 , 就是实现机器人在智能方面的自我提升 , 使它如同婴儿一般能够不断加强对周围环境的理解” 。 但发育是一个知识获取与积累的过程 , 而图算法刚好能够将知识用图结构的方式连接起来 , 使人工智得到对动态环境的理解 。 对于杨旭来说 , 这显然是一种非常合适的方法 。
【研究|杨旭:人工智能“浪潮”下的思考与钻研】多年来 , 无论外界关于依靠互联网数据制作机器人的风吹得有多大 , 杨旭始终埋首于关于人工智能认知发育领域的研究 。 谈及此处 , 他本来严肃的目光突然柔和下来 , “从我开始工作 , 我的父母就告诫我 , 一定要抵得住外面的诱惑 , 把工作做得扎实” 。 在父母的提醒下 , 他摒弃外界的各种声音 , 沉下心来有条不紊地进行自己的研究 。
抓住契机
2020年 , 新冠疫情爆发 , 对产业发展来说既是挑战也是机遇 , 尤其无人配送等新兴产业出现强大的成长潜力 。 抓住这个契机 , 杨旭及其团队加快了在这个领域的研究及转化速度 。
在疫情期间 , 美团公司将处于研发阶段的无人车配送方案投入到抗疫前线 , 取得了良好的社会效果 , 但同时也暴露了无人系统认知能力有限的技术瓶颈 。 街道及小区里复杂的交通环境以及人员往来 , 还有天气变化等因素都成为无人车在配送过程中的阻碍 。 因此提高无人车在复杂、动态、开放环境中配送的视觉认知能力 , 成为美团急需解决的问题 。
杨旭带领团队利用机器学习手段开展无人系统视觉认知发育的研究 , 提出了基于图算法的无人系统视觉认知发育框架、算法与典型应用 , 并针对性攻克了基础的图优化技术难题 , 为美团公司无人配送的发展提供技术支持 。
在认知发育方面 , 除了与美团公司合作解决实际应用问题外 , 杨旭还承担了北京市科学技术委员会关于“无人系统认知发育技术的应用与验证”的课题任务 。 利用机器学习手段开展无人系统视觉认知发育研究 , 提出基于图算法的无人系统视觉认知发育框架、算法与典型应用 , 并针对性地攻克基础的图优化技术难题 。
这项任务的核心目标是利用最新的人工智能与机器学习方法 , 将基于图算法的机器人视觉认知发育框架做深做实 。 “做实”是对发育框架各环节运用更合理的机器学习手段 , 设计更简洁有效的算法保证效果;“做深”是对框架中最底层、基础的图优化技术提出原创的理论与方法 。
另外 , 图算法是研究人工智能认知发育的重要方法 , 然而在应用的过程中却存在一个矛盾的点 。 人工智能在面对外界环境时需要迅速对物体进行识别判断并且做出反应 , 然而图结构是整个人工智能数据结构中最复杂的一种表示方式 , 它的复杂程度根据问题规模在计算过程中呈指数上升 , 因此很难在多项式时间内去解决问题 。 针对这种现象 , 杨旭及其团队开展了关于“组合图优化方法及其在视觉问题中的应用”的国家自然科学基金面上项目 。 开展了基于“连续统”思路的组合图优化框架、理论与算法的研究 , 及其在计算机/机器人视觉领域的应用研究 , 以此来实现图算法效果与效率平衡的目的 , 这个项目的开展可以促使我国在图算法方向的研究达到国际领先水平 。
杨旭认为 , 提升机器人的认知发育 , 不断培养它在复杂环境里的学习和理解能力 , 是人工智能发展的根本方向 。 如今 , 人工智能行业的浪潮已经经历了三起三落 , 但不论外界有多少诱惑 , 他都会坚定不移地继续朝这个方向研究下去 。 他说:“我们应该做海里的石头 , 而不是浪潮上的泡沫 。 ”

    推荐阅读