最近,网上有一个很火的视频,医生给正在哭闹的失聪宝宝安琪儿安装人工耳蜗,安装后妈妈轻声地叫着安琪儿,第一次听到妈妈声音的安琪儿先是愣住了,再是惊讶,最后开心地笑了……
像安琪儿这样有听力障碍的人,全世界有三、四亿,昂贵的人工耳蜗成为了他们“从深海上岸”的救生圈。但是,在机场、商场等比较嘈杂的公共环境中,人工耳蜗依然面临着“听不清”的困扰。对此,在9月27日国际聋人日之际,腾讯正式公布开放天籁AI降噪技术,帮助听障人群解决“听不清”难题。
实际上,除了“听不清”之外,“听不多”也是人工耳蜗行业的痛点。腾讯多媒体实验室高级总监商世东举例称,现今的人工耳蜗还不能让听障人士很好地欣赏音乐,其他一些噪音干扰比较大的场景使用体验也比较差,将会是行业未来提升的方向。
AI降噪技术应用于人工耳蜗
据世界卫生组织官网最新数据,全球大约有4.66亿人患有残疾性听力损失,超过全世界人口的5%。另据第二次全国残疾人抽样调查结果显示,中国患有听力障碍人士达3480万,居目前国家五大类的残疾人群之首,并且每年仍然以2到3万新生儿童的数字在继续增长。
深圳市残联党组书记、理事长侯伊莎提到,人工耳蜗和助听器成为听障者相对成熟的人体的义肢,但是由于费用和服务力弱的原因,发达国家才有10%的聋人植入耳蜗,发展中国家就更少了,即便是植入耳蜗者,由于噪音和频道及音量技术等复杂性,实际受益的人数更少。
“噪声问题一直是影响人工耳蜗佩戴者听觉体验的最大障碍。”腾讯多媒体实验室高级总监商世东表示,“举个例子,当电脑、手机可以达到主频是G赫兹的多核架构的时候,人工耳蜗由于尺寸限制,却往往只有几十兆赫兹的处理能力。在这样的局限条件下,高复杂度的噪声处理成为了业界的一个难点。”
基于此,商世东和团队萌生了通过AI算法改善听障人群听觉体验的想法,并找到了国内最大的人工耳蜗厂商之一——诺尔康电子神经科技有限公司(以下简称诺尔康),一起讨论在当前人工耳蜗软硬件局限条件下的解决方案,经过长达半年的技术验证,从架构上最终确定了“手机伴侣+人工耳蜗”的联合解决方案。诺尔康实验检测数据显示,天籁技术与人工耳蜗结合后,语音平均识别率达到96.28%,其中带噪语音识别率为93.38%,环境噪音中声音识别率达到94.24%。
不过,诺尔康总经理李楚表示,人工耳蜗属于医疗器械,要把新的技术置入产品里,需要事先进行产品的临床注册才能放到产品上。“这个流程快的话半年左右,慢的话要一年。我们目前做的临床患者,后续扩大到几百个样本量,样本量得出结论,然后拿去给药监局做信息的注册和更改。”
“听不多”仍是行业痛点
人工耳蜗由于技术门槛高,研发周期长,长期以来被澳大利亚Cochlear公司、美国Advanced Bionics公司和奥地利MED-EL公司占据着超过90%的市场份额。
因此,传统人工耳蜗厂家常用的编码策略都是CIS、ACE、SPEAK、FSP等基于印欧语系进行开发、设计的,主要适合于印欧语系的语调语言。在设计上没有考虑到汉语四声的特点,所以并不特别适用于中国耳聋病患者。
不过,随着近年来我国人工耳蜗企业的崛起,打破了国外三巨头垄断的局面。其中,诺尔康与上海力声特公司均获得了国家批注的人工耳蜗生产证,并且,诺尔康与丹麦Oticon集团合计占据全球人工耳蜗5%的市场份额。
目前,国产人工耳蜗在汉语编码方面有所突破。例如力声特在CIS通用编码策略的基础上开发了L- CIS编码策略,开发了针对汉语四声特征的MTone编码策略,两个编码策略的结合,可以让植入者感受到汉语的声调。
不过,有分析人士称,人工耳蜗在汉语音调识别方面仍然还有比较大的发展空间。另外,人工耳蜗只能部分弥补听力缺陷,它们并不是一种仿生装置,戴上人工耳蜗的听障者不能欣赏音乐,不能听到千奇百怪的虫鸣鸟叫,“听不多”仍然是行业痛点。
对于“听不多”的问题,商世东解释道,正常人的耳朵里有5万个左右的听毛细胞,听毛细胞是连着听神经的。正常人耳朵的声音传到中耳,中耳把声音信号变成一个振动信号。振动信号到了内耳,把里面的淋巴液浮动起来,听毛细胞随着这种波动会产生生物电到了听觉神经。然后听觉神经受到刺激传到大脑就听到声音了,这是正常的声音渠道。“而耳蜗患者,他们的听毛细胞死光了,所以就缺少途径把振动信号变成电信号传到大脑。我们现在所做的就是拿一根电极植入到耳蜗内部。目前全球最多的电极是24个,耳蜗是蜗牛的形状,上面是低频,下面是高频,平摊出来就是一个钢琴键盘,正常人有3千个键盘,我们只有24个。”
“所以我们‘弹’出来的声音和正常耳朵听到的声音是很大的区别。我们认为是可以通过技术改善的,让他们听得更多。”李楚说道。
“我们未来也会继续利用腾讯现有产品中外溢的技术,开放给更多合作伙伴、行业机构、开发者,一起进一步提升人工耳蜗听障患者的听觉体验,在我们看来,今天只是一个起点。”商世东说。
全球新型肺炎疫情实时查询