手势|教AI认手语的年轻人( 二 )
这个目标听起来宏大 , 想实现也很难 , 但他们还是决定动手试试看 。
新的桥梁
帮助聋人与健听人交流 , 前一座已经建成的“技术之桥” , 是语音识别 。
2007年 , 曾任中国聋人协会副主席的富志伟 , 发表了一篇题为《我看“聋人信息无障碍”》的学术文章 。 他在文中写道:“我期望将来能研制出一种机器 , 它可以和现在的微型摄像机一样大小 , 一端输入口语 , 另一端小屏幕上即显示文字……等到这种机器问世 , 聋人信息无障碍环境将大大改观 。 ”
十几年后回看这段话 , 会发现富志伟期待中的机器 , 和如今智能手机上常见的语音识别应用 , 几乎一模一样 。 语音识别技术的受益者 , 也已不限于听障群体——看看身边有多少人在用语音输入法就知道了 。
袁甜甜带领团队研发的“手语实时翻译系统” , 就类似于手语版的“语音输入法” 。 只不过后者是输入语音、机器识别、转成文字 , 而前者是输入手语动作和表情、机器识别 , 再翻译成文字——“老桥”与“新桥” , 相似又不同 。
袁甜甜没想到 , “老桥”的存在竟然会成为项目团队建设“新桥”的“阻力” 。
“为什么一定要搞手语翻译呢?聋人听不到 , 现在有语音识别啊!有的聋人不会说话 , 拿手机打字不就行了吗?”曾经有一些企业向袁甜甜了解过正在开发中的手语实时翻译系统 , 想谈投资 。 但谈来谈去 , 他们却对项目的必要性产生了质疑 , 觉得手语翻译除了“做善事”没有其他意义 。 类似的话听得太多 , 快人快语的袁甜甜有点儿急了 , “那要这么说 , 当初搞什么微信呢?就用短信不一样吗?搞什么语音识别呢 , 就直接打字呗?很多创新都有传统形式上的替代品 , 那科技就别进步了呗?”
袁甜甜说 , 直到今天 , 手语仍然是许多听障人士最自然、高效的表达方式 , “比写字、打字都快 。 ”但为了促进无障碍交流 , 要求健听人都去学手语 , 显然不现实 。 人类要掌握一门语言 , 总会受到认知水平、记忆力等各方面的限制 , “我们的手语实时翻译系统 , 就是要解决这个问题 。 ”袁甜甜有着典型的工科思维 , 遇到难题 , 第一反应就是思考能不能从技术层面突破 。 “我感觉如果技术到了那儿 , 机器的记忆力和它的学习能力 , 要比人强很多 。 所以要是能让机器学会手语 , 它肯定比我这种‘半颤子’手语翻译管用多了 。 ”
目前 , 手语实时翻译系统还处于试用阶段 。 理想状态下 , 等到研究成果真正落地 , 健听人只要打开手语翻译程序 , 就能和“手语族”直接交流了 。
但对袁甜甜和年轻的研发团队来说 , 想达到这个“理想状态”并不容易 。作为深度参与项目的听障生 , 王建源和聋人工学院计算机专业的乌力杰在手语识别、翻译技术上投入的精力越来越多 。 他俩开过一个向全社会推广、普及手语的微信公众号 , 如今已经一年半没顾上更新了 。 当初办公众号的时候 , 他们的想法是 , 要打开一扇窗 , 让聋人被“看见” 。 而现在 , 他们忙着造桥 , 想让听障者被“听懂” 。
推荐阅读
- 新浪科技|哈啰顺风车:三年完单总量3亿 认证车主数量达1800万
- 反刍动物|西北工业大学王文教授带领团队再次入选“中国生命科学十大进展”
- 尺寸|全汉推出 2400W 小尺寸电源,80 PLUS 白金牌认证
- 市场资讯|遍知教育升级D2C平台战略,发布爱奇艺遍知App
- 视点·观察|涉嫌传销再陷逃税风波,“微商教母”张庭夫妇最少补税118亿?
- Xiaomi|小米12家族再添最便宜型号:小米12 Lite在EEC认证数据库曝光
- AMD|AMD CEO确认Zen 4将使用优化后的台积电5纳米节点
- 教育|学科停船后的第一个寒假,“脑机接口”能否成为科技素质教育的后起之秀?
- 平台|爱奇艺遍知APP上线,内容聚焦职业教育、兴趣学习与家庭教育
- 违规|教你辨别摄像头