机器人去耳,耳朵听人说话像机器人

喂~真的不是机器人的耳朵!揭露人工电子耳的运作原理 作者 /

作者/张毅平|温雅基金会听力科学研究中心研究员听到“人工电子耳”这个词,你会想到什么?既“人造”又“电子”的耳朵,大概就像假肢或者眼睛。它们将具有与原始器官相似的外观。一不小心打开了妄想宇宙,各种机器人的科幻电影立刻浮现.等一下!这是一个很大的误会!

帮助听损者重拾听力的高科技

人工电子耳其实是除了助听器之外,听力损失者可以选择使用的助听器之一。“听声”是听觉正常的人在出生前就已经积累的感官体验。胎儿的听觉系统在怀孕6个月左右发育(Graven Browne,2008),听觉也是人死后消失的感觉功能(布伦顿,加拉格尔,沃德,2020)。可以说是五官中陪伴人一生时间最长的感官。然而,由于各种先天或后天因素,许多人都有不同程度的听力损失。随着科技的发展,重获听力不再遥不可及。

就像大部分长辈衰老导致的听力下降,程度相对较轻,可以通过佩戴助听器来矫正听力;但对于重度或极重度听力损失,使用助听器放大声音可能无法满足需求。此时,植入人工电子耳朵是恢复听力的另一种选择。

人工电子耳如何产生听觉?

人工耳结构示意图。图1//维基百科人工耳原名人工耳蜗,也有人称之为“人工耳蜗”。从图1可以看出,医生通过手术将电极植入内耳耳蜗,戴在耳朵上的音频处理单元根据音量和频率分布计算出接收到的声音信号,并转换成电信号,然后通过戴在头上的线圈以电磁感应的方式传输到植入物,再通过受损的内耳,电极以电流刺激听觉神经。因此,人造电子耳的外观并不与耳朵相似,而是一部分戴在耳朵上,另一部分植入头部。近几年一体化成型机比较多(参考网页),把外面磨损的部件都组合在一起,磨损更轻。

当代人造电子耳的发展可以追溯到20世纪60年代。起初,许多学者实际上并不乐观,认为仅仅通过几个电极不可能真正呈现复杂的声音信号和特征,并将其作为有意义的信息传输到大脑进行解释。然而,经过研发和临床试验,许多已经植入电子耳朵的听障人士可以取得良好的效果(Eshraghi等人,2012),植入后一年的平均正确率可以达到90%左右(Wilson Dorman,2008)。美国FDA(美国美国食品药品监督管理局;相当于厚生省的食品药品监督管理局),电子耳分别于1980年和2000年正式植入成年人和一岁以上儿童体内,到2019年底,全球注册的电子耳数量超过73万只(NIDCD,2021)。

00-1010虽然电子耳朵确实能把重度听力损失的人带回声音世界,但一开始并不看好的学者们,其实对电子耳朵在恢复听力方面的表现也是惊叹不已。声音信号非常复杂。仅仅通过1622个电极,你究竟是如何完成传输声音信号的任务的?要回答这个问题,需要了解声音的两个特性,以及如何分别用电流呈现。

声音的两个特性是“音量”和“频率”。在电子耳的信号处理中,体积可以用电流来表示,而频率可以用电极在耳蜗中的位置来表示。原理是人的耳蜗本来就有“张力性”的特点。

人的耳蜗长度约3.5 cm,形状有点像蜗牛壳(所以叫耳蜗!),盘绕了大概两圈半。所谓音高排列,如图2所示,如果你想象一下,耳蜗拉直后,耳蜗底部负责高频音,顶部负责低频音,就像相应钢琴键盘上按声音频率排列的琴键一样。所以并不是所有的声音信号都一起送到所有的电极,而是音频处理单元会把声音分解成几个不同的频段,分别送到对应的电极。

耳蜗间距排列示意图。耳蜗伸直时,卵圆窗基底负责高频声音,而顶点对应低频声音。图二。/维基百科植入耳蜗的电极数量决定了音频处理单元会将输入的声音分解成几个频段。比如澳洲电子耳厂商耳蜗公司的Neucleus电子耳,一般都在耳蜗里。

植入 22 个电极,那么声音处理器就会将声波分解为 22 个频段,再以电流脉冲(pulses)进行编码,并分别去刺激对应的电极。也就是说,大约在 100-300 Hz 这个频率带的声音,在进行编码后就会被传送到植入在耳蜗最顶端的电极;而大约在 6000-8000 Hz 这个频率带的声音,则会透过耳蜗最底端的电极来刺激听神经[注1]

上述说明的是理论上最理想的状况,然而在实际上,可能因组织构造、听损本身造成的神经存活状态、电极间电流的互相干扰(此为电流本身之特性)等种种原因,造成呈现特定声音频率带的电脉冲并不是(只)刺激原本所设定、负责某频段的听神经,使得声音有失真和扭曲的现象。所幸人类的大脑具有可塑性,在植入电子耳后,透过听能训练和日常不断累积聆听经验,许多电子耳使用者都能逐渐适应、并提升听辨的表现。

电极数越多、一定听得越好?

那么,透过电子耳的声音听起来到底是如何呢?在网路上有不少电子耳声音模拟[注2]的影音可以参考,这里介绍美国达拉斯大学提供的网页(Loizou, n.d.)。其中提供了不同频道数(channel = 频道;概念上相当于电极数)、以及不同植入深度的声音模拟。以频道数来说,若逐个试听,会发现愈多频道时语音会愈清楚。不过受限于耳蜗体积、电极相近时会互相干扰等因素,植入的电极数能增加数量有限,如前述一般是植入 16 – 22 个电极。此外,虽然在理论上愈多频道(电极)声音会愈清晰,但由于各种複杂的影响因素[注3],实际上这样的关係并不是绝对的,尤其不同的电子耳产品间、或不同个案间,不能直接以电极数来评断声音/聆听品质的优劣。

植入深度也是影响因素

除了频道数外,网站上还提供了不同植入深度的模拟。电子耳的植入手术中,是将电极从耳蜗的底端插入,理想的植入深度是大约 25 公釐。这样的情况下,特定频率带的声音就可以透过对应的电极,去刺激负责那段频率的听神经。如果植入的深度不够,代表电极的位置是比较偏底端的,根据前面提到的音调排列特性,特定频率带的声音就会被送往较接近底端、偏向较高频率的电极和听神经了。

植入深度不足对语音处理的影响示意图。图三/

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/188378.html

(0)

相关推荐

  • 快手小店退货运费谁承担,快手小店退货运费怎么理赔运费

    快手小店运费,快手小店出现运费纠纷怎么办,快手小店出现运费纠纷快手小店出现运费纠纷怎么办 目前快手商家开店,运费纠纷是最常见的问题之一。快手小店运费是根据“谁过错,谁承担”的原则处理的。那么哪些情形运费需要卖家承担?下面

    电商 2021年10月30日
  • 永劫无间中秋节活动时间是哪天?千里共婵娟活动内容

    一年一度的中秋节即将来临,而在这段时间里,又会开始一项新的限时活动,那就是一起玩千里。有些玩家不清楚活动的时间和内容。边肖在这里汇总了《永远的掠夺》的内容,快来了解一下吧。 千里共...

    教程 2022年9月3日
  • 换手率多少为好,可转债的换手率在哪里看

    换手率多少为好,可转债的换手率在哪里看 换手率”也称“周转率”,指在一定时间内市场中股票转手买卖的频率,是反映股票流通性强弱的指标之一。以样本总体的性质不同有不同的指标类型,如交易所所有上市股票的总换手率、基于某单个

    攻略 2021年10月9日
  • 泰国带什么,mike泰国

    泰国带什么,mike泰国 提起mike,爱看泰剧的小伙伴们肯定对他特别熟悉吧,我是从他和李海娜主演的《浪漫满屋》认识他的,那一眼望过去,惊为天人,不由得赞叹,世上怎么会有长得如此好看的男人!这部剧可以说是翻拍韩剧翻拍

    攻略 2021年10月25日
  • 你留言的网易云音乐,上市了 / 青春痘疫苗,后年可以打

    12月2日下午,加拿大鹅向上海市提交了《更换条款》的正式说明。针对这份说明,上海市消保委表示,加拿大鹅公司并未对此前问询的问题给出直接明确的答复。例如,此份说明解释了“中国区7天无理由退换货、但别的国家却是30天”的政策,但并未说明原因。

    科技 2021年12月3日
  • 围棋几年级就可以停了,围棋什么情况可以停手

    围棋比赛可以暂停吗围棋比赛可以暂停。暂停时间不包括在游戏时限内。在重大比赛中,可以采用收棋制。当比赛达到规定的收棋时间时,比赛还没有结束。生完孩子的一方应该马上离开。想了想,生完孩子的一方要把准备好的点写在记录纸上,然后

    电商 2021年10月30日