2024国际盲人节:科技进步带来视障者的生活变化
过去一年,随着人工智能时代的来临,技术的创新步伐不断加快,是否为我国1700万视障群体的生活带来了更多的可能性?
在国际盲人节(10月15日)这个特别的日子里,信息无障碍研究会期望与大家共同回顾和盘点那些在过去一年里,依托最新的科技创新为视障人士带来生活便利的产品与应用。
帮助视障者‘看见’更大的世界
华为小艺 开启无障‘AI’世界
今年HDC 2024华为开发者大会上,很多伙伴对信息无障碍研究会联合华为推出的趣味体验——“黑超之旅”留下了深刻的印象。在全黑的环境中,明眼人能够借助华为手机的智能识别等功能找到想购买的物品,并顺利完成支付。
图:“黑超之旅”体验
这样的互动体验也让很多人感受到科技在改善视障群体生活便利性方面扮演的重要作用。
在这次的发布会上,华为还介绍了纯血鸿蒙内置的“小艺看世界”,它结合视觉大模型的识别、理解和推理能力,能够帮助视障群体更加智能地“看见”周围的世界。
现场演示了一个应用场景,当视障伙伴打开冰箱,问“卷心菜还新鲜吗?”,它能够快速的给到反馈:“卷心菜看起来还算新鲜,大部分叶子是绿色的,但有些地方已经有轻微的枯萎和变色,建议尽快食用”。
这一演示获得了热烈的掌声,因为这样的应用对视障伙伴来说太实用了。
图:华为“小艺看世界”
他们除了渴望“看懂”图片、“看清”周遭的事物,还期望走出家门,去看看更广阔的世界。
vivo看见
今年5月,视障伙伴“宝哥”在导盲犬“阿尔法”的陪伴下,借助“vivo看见”这款视障辅助应用,顺利地搭乘高铁前往北京参加科技无障碍发展大会。坐在高铁上的他将手机摄像头对准窗外,“vivo看见”快速而准确地帮他描述出了窗外的景色“天空下有一些绿色的植物,还有一座白色的桥”,他激动地说到:“这是自己失明后第一次直观感知到了高铁窗外的景色。”
图:vivo看见
不久后,“vivo 看见”正式推出了蓝心升级版,作为手机行业首个多模态大模型的视觉辅助产品,希望帮助视障用户借助实时画面进行流畅对话。
在上周刚刚结束的2024 vivo 开发者大会上,“vivo 看见”蓝心升级版,也进行了诸多优化,它能够更精准详细、更生动形象地描述镜头前的景象,并可以进行多轮问答的交流。vivo 还将开放“vivo 看见”蓝心升级版的安卓通用版本,相信不久后能够有更多的视障用户使用上这款产品了。
然而,即使有了“vivo 看见”这样的智能应用,并不是每位视障伙伴都能像“宝哥”一样有独自外出的勇气,盲道的缺失,让“走出去”成为了一种奢侈。
高德地图“视障导航”
为了提升视障人群的出行便利性,高德地图在今年8月上线了“视障导航”功能,使用者通过开启手机的“旁白读屏”功能就可以听到指引。
视障导航会优先规划包含盲道的出行路线,在途经路口和通过有红绿灯的斑马线时,会通过语音倒计时播报,提醒视障者注意通行安全;在视障者行走路线发生偏移时,导航会实时播报预警,帮助他们找回正确的方向。
图:高德地图“视障模式”
‘观影’无障碍,‘游戏’玩儿不停
和明眼人一样,视障伙伴也会花很多时间在娱乐上。前一阵子诺子喵呜作为国内第一位全盲玩家成功击败了《黑神话:悟空》的首个BOSS冲上了热搜,也让“视障伙伴能畅玩儿游戏吗?”成为了热议的话题。
网易“AI Eyes”视障模式
去年,网易游戏用户体验中心针对这一需求推出了“AI Eyes”视障模式,它运用AI图像识别与语音技术,跟踪游戏画面的变化,并主动播报新生成的信息,帮助视障人士从“听游戏”到真正沉浸式玩游戏。
图:网易游戏推出“AI Eyes”视障模式
视障伙伴同样热衷于观影和追剧,但过去很长一段时间,他们都无法真正享受观影的乐趣,直到无障碍剧场的出现,通过为电影添加专业解说,帮助视障伙伴“听懂”剧情。
优酷无障碍剧场
优酷作为国内较早倡导无障碍剧场的平台,截至去年年底已经发布了超过2000部无障碍影视作品。
今年,优酷的无障碍剧场进一步升级,通过先进的音色训练模型,成功实现了通过胡歌的AI声音来讲述《消失的她》和《三大队》等十余部作品,使视障用户在沉浸于剧情的同时,也能感受到明星亲“声”相伴的独特体验。
图:优酷无障碍剧场上线胡歌AI语音包
腾讯无障碍剧场
腾讯视频也在今年推出了无障碍剧场,并陆续上线了《热辣滚烫》、《漫长的季节》、《三体》等无障碍版作品。
传统的无障碍影片制作流程复杂且耗时,需要至少一个月的时间,观看影片15遍以上,并进行3000多次暂停来撰写解说。而腾讯视频的AI语音生成技术可以自动完成旁白录制,并与原片合成,使得整个制作周期缩短至10天左右。
图:腾讯无障碍剧场
在“环境识别”和“休闲娱乐”之外,满足视障伙伴日常生活不同需求的视障辅助产品也正在遍地开花。
前一阵子研究会的视障伙伴吴益明受邀参加了2024谷歌开发者大会,他在现场体验了多款新颖的视障辅助产品,明显感觉到“随着AI技术的发展,现场展示的面向视障群体的新产品相较往届变多了”。
比如针对视障群体“运动健身”需求,基于TensorFlow 图像识别等技术开发的视障慢跑帮手——智引线。以及面向视障儿童推出的“教育”产品——慧眼识教,通过借助多种 Google 工具,将图片处理成视障儿童能看清的状态,并生成适合这一群体学习的视频,帮助老师们提升教学效果,等等。
在新技术不断涌现的这一年,我们欣喜地看到,很多企业和组织愿意持续地投入研发资源来满足视障群体的日常需求,身体力行地践行着“科技普惠”。
面向视障用户推出的产品和应用正在朝着更加智能化、多元化的趋势发展。
我们期待这一年成为一个崭新的起点,未来有更多的机构和个人加入进来,借助“科技的力量”帮助视障伙伴平等享受现代文明。