关键|人工智能学者张峥:AI落地关键取决于业务数字化的可能性

近日 , 由中国建银投资有限责任公司倾力打造的2020年度“JIC讲堂·科技投资系列”第六场活动在建投书局举行 。
本期活动上 , 上海纽约大学计算机系终身教授(学术休假)、亚马逊云服务上海人工智能研究院院长张峥与《经济学人·商论》执行总编辑吴晨二人 , 以“人工智能产业的未来与挑战”为主题进行了一场信息量巨大的对谈 。
谈到目前人工智能已经可以辅助人类进行写作 , 张峥表示这是数据量大幅增加后“大力出奇迹”的结果 。 他表示 , 人工智能的应用需要解决数据的获取、数据的清洗与数据的洞察三方面的问题 。 自动驾驶是一个人工智能应用非常好的场景 , 但它需要分场景、分阶段落地 。 谈到数据安全和隐私的理念 , 张峥则认为 , “原始粗暴的数据积累早日结束早日好” , 并介绍了新的数据和隐私安全理念下“联邦学习”的加密分布式学习技术 。
人工智能写作是“大力出奇迹”的结果
吴晨介绍 , 《经济学人》有一个熊彼特专栏 , 有15年历史约1000篇稿件 , 三年前编辑部做过一个实验 , 把这1000篇稿件输入机器 , 让机器人去写 , 但写出来的结果是每句话都像英文 , 连在一起不知道在说什么 。 但三年以后的现在 , 机器人已经能够写出像样的稿件了 。
对此 , 张峥表示 , 这是数据量大幅增加后“大力出奇迹”的结果 。
“我们给机器喂了46个T的数据 , 相当于几百个100G手机的容量 , 有1750亿个参数要去慢慢调整 。 ”张峥表示 , “这几年人工智能在质量方面确实有一定的飞跃 , 所以变得越来越像‘人话’” 。
当前计算机在写作上已经能够给予人类一定的辅助 , 但机器其实并不能理解人类用词时的情感和意义 。
以当前各类应用都会有的词汇联想功能为例 , 张峥举例称 , 一个《纽约客》的作者做了一个实验 , 他在给儿子写一封邮件 , 写I'm very p.. , 其实他的原意是I'm very pleased , 但机器给他的提示是I'm very proud 。
“这比他本意要好多了——作为爸爸应该为儿子感到自豪 , 而不能总是居高临下 。 ”张峥评论道 , “但机器其实不知道是怎么回事 , 是人自己脑补做爸爸的做得不够好 。 ”
人工智能落地关键是业务数字化的可能
张峥表示 , 人工智能落地的关键是这个业务有没有数字化的可能 。
他具体介绍 , 人工智能的应用需要解决数据的获取、数据的清洗与数据的洞察三方面的问题 。 人工智能是否能在产业中落地 , 首先要看产业数字化转型程度 , 一个产业如果已经数字化并且大量地依靠数据 , 人工智能才能更好地进入 。 其次 , 产业数字化后 , 还需要注意对数据的清洗 , 因为获得的数据往往非常粗糙 , “噪声”很大 。 最后是解决对数据的洞察 , 如何从无结构的数据中获取结构 , 也是人工智能未来亟待解决的问题 。 因此 , 较有发展前景的应用领域应该是实现了良好的数字化转型 , 并能通过结构化将数据转化成生产力的领域 。
谈到自动驾驶行业时 , 张峥表示 , 自动驾驶是一个人工智能应用非常好的场景 , 但它需要分场景、分阶段落地 。
吴晨也表示 , 街上跑的车都变成自动驾驶在3-5年内是不现实的 , 但是在园区、高速公路、货运卡车这些领域可能会更快地看到变化 。 他介绍 , “硬件领域一定有很多的投资机会 , 所以会不断有需求 , 但是真正组合起来到底会是什么样新的商业场景 , 这中间存在很大的风险 。 ”
谈隐私:原始粗暴的数据积累应尽早结束
数据对于人工智能发展的重要性毋庸置疑 , 吴晨引用李开复的观点称 , 中国人工智能和大数据之所以在过去几年这么快地发展 , 就是因为中国的数据无论从总量还是搜集渠道都比美国要多得多 。
对此张峥表达了自己的看法 , 称“原始粗暴的数据积累早日结束早日好 , 这是不能乱来的 。 我觉得保护隐私是大家的责任” 。
吴晨提出 , 用户在使用很多免费服务的时候 , 实质是拿自己的行为信息在换取某种便利的服务 , 但这个数据到底应该归于谁 , 手机上的行为信息到底属于这个App还是属于用户自己 , 这是中国、欧美都在探讨的问题 。
欧洲《通用数据保护条例(GDPR)》专门提出了两个重要的领域 , 一是数据的“可迁移性”(portability) , 如当用户不想使用某个社交网络服务时 , 可以把上面过去形成的所有数据都带走 。 另一个是数据的“遗忘权” , 就是过去在网上分享的内容 , 不想再保留的话用户可以将其删除 。
在这种数据安全的理念指导之下 , 张峥介绍了新兴的“联邦学习”(Federated Learning)技术 。
联邦学习是一种加密的分布式学习技术 , 各个参与方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型 , 适合训练数据涉及隐私敏感 , 和训练数据太大无法集中收集的情况 。
张峥表示 , 联邦学习的这种“模型与数据互相不信任 , 但是还可以达到某一种服务 。 这中间有一定的折衷 , 质量可能要低一点 , 但是换取了其他意义上的信任” 。
“JIC讲堂”是中国建投集团调动优质智力资源 , 以建投书局文化空间为前沿阵地 , 集合多方智慧和力量打造的高品质讲堂品牌 。 “JIC讲堂”自2016年以来共举办70余场深度对话和思想交流 , 向社会分享前瞻视野与专业洞察 , 提供理性分析与价值参考 , 拥有逾百位专家学者的思想智库 , 覆盖国内顶级高校和科研机构 , 受到学界、业界、公众等多方人士的关注 。
【关键|人工智能学者张峥:AI落地关键取决于业务数字化的可能性】(本文来自澎湃新闻 , 更多原创资讯请下载“澎湃新闻”APP)

    推荐阅读