2025TADC | 圆桌对话:AI无障碍:探索、实践
6月27日,“第七届科技无障碍发展大会(2025TADC)”在北京圆满举办。
围绕“AI+无障碍:探索、实践”的议题,大会邀请到阿里巴巴通义实验室高级产品运营专家毕超、绘话智能CEO贾学锋、微软亚洲区员工公益事务总监王岭、百度技术中台市场副总经理吴昊、方圆宝信息科技总经理曾昆和主持人非凡产研创始人吴畏展开了圆桌对谈。
吴畏(主持人):
大家下午好,我相信科技本身就是一个普惠的事情,AI也随着每一波技术浪潮,从最早的判别式AI,到生成式AI,再到今年我们说的Agentic AI,每一代AI技术,我感觉都可以为无障碍事业起到科技普惠的作用。所以第一个环节,先请各位嘉宾简短地介绍一下自己,另外可以讲讲自己跟AI无障碍之间的关系。
非凡产研创始人吴畏
毕超:
刚才吴总讲到,今年AI不管从模态上还是从形态上都在迅速发展。我是来自于阿里通义实验室的产品运营负责人,主要负责整个通义千问、通义万相等底层模型的产品运营工作。今年我们在整个通义千问,包括通义万相等生成类的模型进展非常迅速。
在跟无障碍的结合方面,有非常多的场景。我们中午看宣传片时,里面讲到了“追星星的AI”,这其实是基于我们整个视觉模型产生的,面向孤独症儿童的绘本生成辅助应用。另外在文本方向,我们也做了心理陪伴、适老化科技这样的应用。在硬件方向,因为我们上线了多模态模型,它可以基于文本、语音和视觉的理解与生成,再跟端到端的终端做一个云边端结合的模型落地。这样未来能够结合非常多的硬件,包括助残的科技硬件产品。所以接下来,我们也希望能和吴总、信息无障碍领域以及各个产业的合作伙伴有更深度的结合。
阿里巴巴通义实验室高级产品运营专家毕超
吴畏(主持人):
我相信这个简短的介绍对你来说是不够的,阿里做的跟无障碍相关的科技普惠的事情还有很多。我稍微补充一点,今年大家都知道DeepSeek很火,推动了很多人对AI的理解和认知。但其实在整个开源生态里面,一个是DeepSeek的开源模型,另一个就是阿里通义的开源模型,在全球开发者中的关注度和好评是最高的。
毕超:
对,我再补充一下。去年基于千问的开源模型衍生数量已经是全球衍生数量最多的。所以欢迎大家来我们的平台进行调用。
吴畏(主持人):
对,开源本身就是普惠的事情,我觉得这是一个很大的贡献,接下来请贾总分享。
贾学锋:
各位朋友下午好,我是上海绘话智能科技有限公司的创始人贾学锋。我自己搞人工智能的时间蛮长了,从2003年开始到现在有二十多年了。我这么多年来,一直都是围绕着人工智能,从算法研究开始,后面进入到产品设计和方案落地。
绘话智能CEO贾学锋
我们公司专注在“银发经济+养老科技”领域,打造了一款比较创新的、面向老年人的桌面机器人,它的每一个功能都跟AI无障碍密切相关。
这个机器人有三个核心特征:第一是”主动沟通”。你让父母对着一个音箱类的产品主动找话题聊天,其实是蛮难的。所以我们打造了主动沟通能力,希望能够克服交流的障碍。第二是提供个性化的互动,包括内容上和情绪上的互动。第三是为父母提供生活上的便捷。比如找人看病、约人上门洗澡等,如果让父母直接用传统的APP,使用上是有障碍的。所以在整个过程中,我们对交互界面做了全新的设计。
吴畏(主持人):
我感受到贾总对自己产品的热爱,您刚才提到交互界面,其实AI本身一方面是生产力革命,另一方面就是交互革命,这本身是不是也是对于无障碍的一种体现?
贾学锋:
对,我再补充一点,我感受比较深刻的是,适老化是不是把字放大一点、功能说明说清楚一点就够了?其实还是不够的,后面我可以再做详细分享。
王岭:
谢谢组委会和主持人的邀请,我在微软公益部门负责亚洲区员工的公益事务。我自己和无障碍结缘好多年了,2005年的时候,微软在中国成立了员工志愿者项目,我们是第一家和红丹丹(专注于视障伙伴服务的公益组织)合作的企业,我们从去给红丹丹修电脑,为视障朋友讲电影,一路发展到把我们的云和AI技术与视障群体的需求相结合。
微软亚洲区员工公益事务总监王岭
2013年,微软中国作为发起方之一,在中国成立了信息无障碍产品联盟。今年是微软成立50周年,整体来说我们的无障碍历程有30年,从研发到产品应用,我们都有一套非常完整的体系和方法论。从员工的角度来讲,我们有一个非常强大的无障碍团队。在微软,我们把无障碍分了6大类:视觉、听觉、神经多样性,行动障碍、学习障碍以及精神障碍,每一类我们都有自己的员工,因为我们有一个很强的理念:如果没有我们参与,就不要替我们做决定。
这个理念微软一直在坚持,比如说10多年前,我们就开发出了Seeing AI这个App,是我们在英国的一个视障工程师参与开发的。在微软,无障碍的理念体现在我们的各类产品中,M365的产品里面,你可以找到无障碍的组件,Microsoft Copilot 中有一系列的无障碍工具,此外微软关注无障碍的整个的生态体系,后面有时间再展开讨论。
吴畏(主持人):
感觉王老师应该是我们这里最了解公益以及无障碍这个词所包含的所有内容的嘉宾,稍后我们可以再展开。接下来请吴昊总介绍一下。
吴昊:
大家好,我是来自百度技术中台的吴昊,今天给大家分享我们基于AI技术的发展,近几年推出的无障碍产品。第一款是百度智能代码助手文心快码,在信息无障碍研究会的支持帮助下,通过研究视障开发者的使用习惯、编码困境,完成了文心快码无障碍适配版。第二个是萝卜快跑的无障碍功能,通过蓝牙自动解锁、语音开关车门、全场景语音交互等功能提供无障碍服务。第三个产品是基于手语翻译系统的AI手语数字人。
百度技术中台市场副总经理吴昊
吴畏(主持人):
百度的数字人已经得到了市场验证,前段时间罗永浩借助百度数字人直播卖了5,000万。接下来请曾总也介绍一下自己。
曾昆:
好的,感谢主办方的邀请,谢谢主持人。我是深圳方圆宝的创始人曾昆。其实我接触无障碍的时间相对短一点,刚好我们这两年有一个产品在做面向老人用户的Pad。我们考虑这个事的出发点,是发现老人在使用电视遥控器选择内容时存在很多不便。即便是现在的语音遥控器,内容还是精准定向的,而不是根据自己的需求去做选择。而对于手机来说,老人的视力还是勉为其难的。
方圆宝信息科技总经理曾昆
打造一款有温度的产品是我的初衷,刚好现在 AI 的能力也能为我们开发这个产品提供更多的赋能。所以顺便感谢一下,像阿里和百度,我也是他们的客户。他们刚刚介绍的能力,我其实也在使用,我是属于应用上层,但是对于客户来说他是需要有一个硬件,把软件能力集中在一块。
吴畏(主持人):
正好我想追问一下,你做的是一个软硬件结合的产品,可能相对依赖底层的 AI 模型能力,那么在这个过程中,有哪些难点要去解决?
曾昆:
如果是传统的语音对话,相对还不能完全地满足客户的需求。其实很多老人喜欢分享当年的一些经历。我们其实希望为老人定制一个通过 AI 慢慢生成他的专属个人自传,帮助老人完成自己家族精神财富的一个传承。
其实像我们有时候比较忙,可能陪爸妈的时间过少,但有时候自己父母跟孙子、孙女在分享的时候,你会觉得这里有些内容是你原来没有听到的,很有意义的一件事。我们其实也是希望把这个无障碍和AI 能力去赋能我们生活中的点点滴滴,让他们觉得很舒服、很温暖,对家里的子女也是很有价值的一个事情。
吴畏(主持人):
吴总,你刚才提到的无障碍产品或服务,它们目前解决的问题做到了怎样的程度,包括过程中可能有些什么样的挑战?
吴昊
对于中国超过 2780 万的听障人士而言,手语翻译是必不可少的服务。以手语数字人这个产品为例,开发手语翻译系统面临很多挑战:手语在语法、结构和表达方式上与汉语口语有根本性差异,需要提取关键信息而非直接翻译;自然手语交流不仅依赖手势,还需结合口型和身体语言,要求复杂的多通道合成。这些问题我们通过先进的视觉识别技术,以及多样化的训练数据集,都做出了技术上的突破。
吴畏(主持人):
王老师,我想问您一个有关生态的问题,市场上有很多技术公司,还有政府,包括大型企业,怎么样去构建一个好的生态,能够让 AI 无障碍做到普惠?
王岭:
首先,我们非常重视开发者的社群,其中有非常活跃的个人开发者,也有合作的公司,比如ISV。我们有些工具像Accessibility Insights,就是给开发者这个群体来用的,他们在开发无障碍产品的时候可以用到微软的这个工具去适配。
此外,我们很重视倡导,每年都会举办Microsoft Ability Summit大会,今年3 月份就有来自 164 个国家的超过 2 万名参会者。我们还有一套已经成熟的包容性设计原则和方法论,全部都是公开的。
还有就是和合作伙伴共同去解决最后一公里的问题,比如说我们的云平台上面有很多无障碍的API,把它落地特别要靠我们当地的合作伙伴。就拿我们的合作伙伴“亮亮视野”举例,它是专注于“AI+AR ”的解决方案公司,它现在做的一款增强现实眼镜,听障朋友戴上后可以实时看到语音转文字的字幕。
最后一个是细节决定成败,我们有很多好的想法,但落地的时候需要关注细节,能不能真正地用到现实生活中来。
吴畏(主持人):
谢谢王老师的分享,接下来想请贾总再进一步地去解读一下您的产品,在实际中有没有比较难啃的骨头或者是难推进的问题,怎么去平衡商业跟技术?
贾学锋:
好的,其实我们现在是从桌面机器人来入手的,我们倡导的是“语音优先”,百分之百的任务都可以通过语音互动来完成。主打的一个核心功能叫做主动沟通,这个我们要做起来就比较难,目前在硬件上做了一些设计,借助屏幕上的摄像头,在监测到老年人进入到机器人可沟通的范围时,机器人就会发出一些比较个性化的话题。
第二个技术上的壁垒是,现在的大模型还是属于“问答模式”。但我们真正需要的陪伴场景是“聊天”。它是一个互动和引导的过程,第一时间并不是给你答案。
另外,我们还实现了多模态的“察言观色”。因为有摄像头,我们想通过视觉模型捕捉聊天对象的情感。如果他看起来不开心,机器人就会问:“今天发生什么事了?看起来你不是很开心。”
吴畏(主持人):
那我追问一个问题,因为这个产品是面向老年人的,那么可能也会涉及到他们的子女,对吧?这个过程中,谁来买单?怎么去平衡子女跟老人?
贾学锋:
买单的肯定还是子女,现在很多子女跟父母是异地的,会关心父母的身体健康还有其他一些情况。在这方面,我们的产品推出了“子女端”,可以做两件事,第一件事情就是比如说今天父母聊了哪些重要话题?我们会总结一下告诉子女。另一方面,子女可以去设置机器人,给父母多聊哪些方面的话题。这样我们在主动沟通的时候,就会围绕这些话题去展开。
吴畏(主持人):
接下来,请毕总介绍一下你们的底层模型能力。
毕超:
最后的宝贵时间留给我了。其实我最后想说,不管是我们阿里云的基础设施建设,还是我们整个通义的MaaS(Model as a Service )核心能力,我们都提供的是底层的API和SDK服务。第二,刚才提到的案例,比如老年数字人这个方向,其实可以用我们的“星辰”模型。通过Prompt把人物的角色、历史背景全部灌进去以后,就可以生成一个复刻老人历史传记的内容。
像桌面机器人,可以通过我们的CosyVoice来做声音复刻。我们可以把父母的声音用来陪伴他们的子女。包括还有产业侧,像雷鸟 V3的眼镜,我们提供的也是整个底层的多模态整套SDK。我们都希望能为广大的企业伙伴、创业者提供更多开源的好应用,欢迎多调用我们通义。
吴畏(主持人):
最后一个问题,各位嘉宾可以畅想一下,未来借助AI,无障碍领域可能的发展是怎样的?大家可以做一点美好的祝愿。
毕超:
我觉得在未来无障碍场景中,人形服务机器人和脑机接口是两个很好的方向。虽然现在人形机器人受限于传感技术,没法精准服务于需要帮助的无障碍人群,但未来通过生物技术、空间技术等,能够解决它在空间坐标中的识别问题。再加上我们底层的多模态能力,我希望服务机器人能发挥更大的作用。第二个是脑机接口,现在很多无障碍设备仍需手动或肢体控制,我希望未来能通过脑部信号或自然语言来驱动硬件设备,拉近人群跟设备之间的距离。
贾学锋:
我觉得未来的AI,不管硬件以什么形态出现,都可能不可避免地成为我们的“第三个家人”。在养老这一块,我希望有了AI的加持以后,能够让每一个人都能够有尊严和更幸福地老去。
王岭:
我们考虑问题时,有时不是技术“能不能做”,而是“应不应该做”。这就是负责任的人工智能(Responsible AI)。我希望有更多人能考虑到公平、隐私、安全这些问题。比如手语,它跟自然语言一样,有方言,北京和天津的手语都不完全一样,北方和南方的差异更大。在收集数据时,是不是考虑到了这种差异?只有数据收集得全面,才能在设计产品时体现公平和包容。
此外还有隐私和安全,因为我们服务的很多是相对弱势的群体,要从这些角度去保护他们。还有就是可负担性,希望各个大厂把价格都降下来。
吴昊:
回顾这几年AI技术,尤其是大模型技术的飞速发展,让自然语言的人机交互模式成为可能,同时在产学研各界的共同努力下,不断去降低新技术的门槛,让开发更好的无障碍产品的门槛也在降低,畅享未来无论是线下的真实世界,还是虚拟的数字世界,都能够实现丝滑的无障碍的体验。
曾昆:
我想分享八个字:能力共享,成本公允。我们几位都有共识,就是怎么样让更好的服务能够进入大众的生活。外面展示了很多很好的产品,但可能因为研发成本、商业模式等原因,短时间无法给更多人提供服务。阿里、百度等公司可以很好地控制开发成本;同时,比如在深圳,利用周边的产业供应链优势,通过规模化把服务成本降低。我们很希望通过大家共同的努力,把成本控制在大众能接受的角度,让更多人能够享受到我们真正愿意去做的事情,这样才特别有意义。