正能量:盲人可以上淘宝!程序员用8年时间修盲道
秩名 12-28 次遇见90后王孟琦先天性失明。前不久的双11,他在淘宝上,买了一个吸尘器和置物架。过程很简单,他先“听”图,再按语音指示点击购买。
王孟琦
“原来视障者也可以生活得更有品质。”作为资深剁手党,王孟琦的淘气值有1200多分,高于大部分“淘宝族”。
帮他奠定这一“江湖地位”的是淘宝的新功能“读光OCR”,一个帮助视障人士更高效“听图购物”的程序。在淘宝,像王孟琦一样的视障用户约30万,虽然占6亿多用户的不足千分之五,但双12期间,“读光OCR”日均调用接近1亿次,视障群体剁手的热情远远超出工程师们的预期。
“再小的群体我们也不会遗忘。”淘宝无障碍实验室核心成员永攀(花名)说,“在我们看来,人人都应平等享受科技带来的便利和乐趣。”
淘宝上的第一条盲道
2011年的年初,淘宝的前端工程师小马(花名)接到了一个特殊的投诉。
一位销售耳机的视障卖家,因为最新的一次网页改版,导致他的第三方读屏软件失去了作用。他在卖家后台,无法使用内容编辑框上架新的宝贝。
因为这个小小的“事故”,小马跟他深聊了一个晚上。卖家在淘宝开店一年多。在认识小马之前,他遇到问题只能找客服。这是他第一次跟淘宝系统的开发者对话。这次对话,也让小马第一次注意到视障人士这个群体。
卖家告诉小马,视障人士看不见屏幕,所有的信息都要靠读屏软件“读”出来。
然而,当时的Web页面,因为缺乏标准,对读屏软件的支持,并不完善。对于视障人士来说,能舒畅地听到页面内容,已属不易。而且,读屏软件还有一个技术难题,那就是无法读出图片中的信息。
在我国,视力障碍人群达到了1263 万人。也就是说,在 110 个人里,就有 1 位是盲人。
在盲人的世界里,上网购物比普通人想象中,更为困难。打开手机的读屏(旁白)功能,读取淘宝里随便弹出来的页面,在旁白模式下,视障朋友们从上到下听到的内容是:
“已累计访问一天——恭喜您获得今日奖励——图片——VV 旗舰店——20——人民币符号——满 199 使用”
“有机会抢如下快闪券——图片——图片——图片——图片——图片——满 400 减 200——满 100 减 50……”
淘宝上的宝贝信息,大部分都在图片上。“假如视障朋友要在淘宝上购买一个宝贝,链路冗长。他要先截屏产品的详情图片;再转发给亲友;在他们的帮助下,了解产品内容;才能下单购买。“
跟卖家聊了之后,除了修补网站改版的”BUG“,小马思索:能不能为视障朋友,在淘宝上修一条盲道?
2011年,小马牵头,成立了“无障碍实验室”。淘宝无障碍化工作,就此启动。
五六名工程师成为第一批志愿者。他们的工作,简单来说,就是手工加入只有读屏软件才会读取到的信息。把淘宝上的图片内容,编写到代码里,让视障朋友可以“读图购买“。
用了几个月的时间,志愿者们打通了基本的购物链路。首页、淘宝搜索、购物车、下单,这几个主链路上的信息,不仅能被人看见,终于也能被人听见了。
图片验证码曾是视障朋友的一大痛点。过去,他们只能截屏验证码,发送给亲友来确认。独立购物成为一件很奢侈的事情,在购买一些特殊商品时,甚至没有隐私可言。
在淘宝无障碍化的进程里,志愿者们还推出语音验证码,视障版旺旺等一系列无障碍化的改造。
距离杭州千里之外的河南,还在读高二的王孟琦,成了其中的一位受惠者。2013年,王孟琦第一次在淘宝上,独立购买了一件宝贝——给自己的手机充了10块钱。
因为那次良好的购物体验,没过多久,他又一次“出马”。这一次,他帮妈妈在网上买了些织毛衣用的开司米毛线。
“跟这个世界互动起来”
2014年,淘宝进入移动互联网时代。
那也是王孟琦工作的头一年。为了犒赏自己,他购买了一台移动版的安卓TCL S960T手机。
在他的新款智能手机上,王孟琦安装了手淘APP,开始用手机“剁手”。“电脑上购物,因为屏幕大,展示的信息量多,所以淘宝页面对我来说很繁杂,还是用手机方便。“
王孟琦最喜欢在周末的时候,用当时的“淘点点”来点外卖。“每周至少要点一次。”
事实上,因为手机默认支持的“读屏”系统,比起PC端的第三方读屏软件,在功能上更加完善。所以,视障朋友们更乐于使用手机来购物。
另一方面,因为出行不便,买一瓶酱油可能会把货架都碰倒;出门去趟超市,2公里的距离也可能让自己遍体鳞伤。视障朋友对于移动互联网的使用热情,更甚于普通人。他们希望把自己连接到网络上,跟世界互动起来。
“无障碍实验室”的阵地从PC端转战手机上,技术上也面临着转型。
小马说:“最开始的几年,淘宝的无障碍化,是根据普通人的使用体感来改造的。但随着功能的深入,总有很多细节是我们考虑不到的,需要引入视障者的实际体验。”
2013年11月11日,阿里联合信息无障碍研究会、腾讯、百度、微软中国共同发起成立了“中国信息无障碍产品联盟“。小马担任联盟的理事,历时6年。
命运在此刻发生了神奇的转折,身在深圳的王孟琦,因为卓越的IT能力,成为“信息无障碍研究会”的工程师。他由一名淘宝剁手党,深度参与了淘宝APP的研发。
“每次手淘要对外发布新版本,都会先打个包,让我们来测试其中的无障碍功能。根据我们提出的问题,再进行修改。”
手淘阶段,不用再人工编写代码,小马逐渐“隐退”。小二竹音成了手淘阶段的接口人。在技术的更新下,志愿者们也不断更迭。这是一项没有报酬,也没有完成期限的“工作”,但志愿者团队却从最开始的五六人,发展壮大到了几十人。
也是在那一年,从淘宝到天猫、支付宝、钉钉等阿里系的多个产品,都为视障用户在网上修建了一条条新“盲道”。
翌年9月,淘宝将无碍化测试工作,纳入日常发布流程中。淘宝成为国内第一个将信息无障碍测试纳入产品发布常态化流程的互联网产品。
“读光无障碍”上线
跟大部分消费者逛淘宝、看各种细节效果不同,视障朋友们在手淘上网购,最开始只能听到宝贝的产品名、参数、销量、价位。他们靠着几个冷冰冰的数字,决定是否下单。丝毫没有“像逛街一样逛淘宝”的乐趣。
2014年,一位视障工程师向淘宝“无障碍实验室”提出了把“图片上的信息读出来”的想法。一个关于OCR在淘宝无障碍化中的应用项目便正式立项,但当时的图像识别准确率只有60—70%。直到今年年初,王孟琦又一次提出了这个想法。项目重启,接口人竹音找到了淘宝技术部的永攀。
永攀是专门研究OCR(光学字符识别)的高级算法专家。也是阿里巴巴读光OCR的负责人。
淘宝内部,正式启动了OCR在淘宝无障碍中的应用项目,命名“读光无障碍”。
过去的七、八年时间,永攀的团队一直在研究OCR。简单来说,OCR就是识别图片中的文字。这听上去很美好,实现起来却非常困难。
由于淘宝平台的开放性,很多商家为了发布“与众不同“的产品图,常常启用自己的编程团队来设计页面。这样一来,代码不一样,图片承载的方式也不一样。
直到去年,一套成熟的OCR技术在业务实践中沉淀出来。在准确率上,这套技术对宝贝详情的识别平均准确率已经高达98.6%,超过人眼识别能力(约98%),阿里巴巴的OCR技术水平已经居于世界前列。
时机成熟。
双11前夕,“读光OCR”上线。
“刚开始,我们根据预估,布置了30台GPU(图形计算单元,用于AI计算。)然而,双11临近的那几天,访问量1000万、2000万、3000万,‘噌噌噌‘地出现了指数型的增长。双11当天,平台上的视障用户总量更是直逼80万。在双11的峰值,技术同学甚至来不及“埋点”(获取访问信息,来分析、统计用户特征),访问量就已经超过了我们的最大预期量。“
还没从双11缓过神来,双12就到了。数据仍在加速度地爬升。
双12的顶峰访问量是双11的3倍。全天平均访问量是双11的2倍。进入12月,平均每天视障用户对该功能的调用量高达9380多万至双12已接近1亿次。每天,淘宝上的视障消费者高达30万人次。
这多少让永攀有些意外。
有温度的技术
虽然一直从事技术工作,但永攀坦言,自己未尝能感受到技术带来的力量。而“读光OCR“项目却让她感受到了”这个力量很明确“。
聊天之中,她讲述了盲人消费者郑锐的一件小事。
郑锐
30岁的郑锐先天视弱,戴上眼镜也无法看清视力表中最大的字母。生活中,他是一个1岁半宝宝的爸爸。工作中,他是深圳市盲人协会副主席。以前网购,他只能给孩子买一些简单的毛绒玩具。前不久,他却在淘宝上购买了一款有30多种玩法的费雪智能玩具。并且,通过详情页里的信息介绍,学会了各种操作。
“如今,我玩得比孩子还多呢!” 跟郑锐的交流,让永攀感受到了技术的“温暖“。“读光OCR”项目为视障朋友打开了一面窗户。窗外,是一个更丰富,多彩的淘宝世界。
“视障朋友也享有公平获取信息的权力。“然而,一步步探索下来,永攀又开始思考另一个问题。
她和团队曾做过一份调研,结果显示,淘宝平均每个商品详情页的图片数高达40张。平均下来,一张详情页上有八、九百字的信息。
跟普通人能够“选择性“的阅读信息不同,视障朋友要购买一件宝贝,必须把详情页的产品内容、产品介绍、使用说明,售后服务等,一次性全部听完。这个过程,起码要花上两、三分钟。
“我们把一款宝贝的所有信息转化成视障人士能听到的语言,简直浩如烟海。对视障朋友来说,也是一种冲击。“
有温度的技术,究竟是该“海量“提供信息,还是进行人为地筛选呢?
永攀透露,接下来志愿者们想做的事情,是将信息分类。“根据浏览产品、购买产品、安装使用、售后问题等,划分几个类别,供视障朋友选择性的听图购物。“
“无障碍购物让我们更独立,更有尊严。”郑锐说,在淘宝上,我们既有获取信息的权利,也有自己选择信息的权力。
从2011年到现在,淘宝乃至阿里巴巴很多产品团队都已经形成了一个共识,无障碍有问题就等同于产品有BUG,每一名用户都应该平等地享受科技所带来的便利。
日前,由阿里巴巴联合起草的新一代信息无障碍国家标准已经在讨论中,预计2019年将正式对外发布。阿里巴巴在信息无障碍化上的实践经验正在成为全国乃至全世界信息无障碍标准化的重要参考。