iWeekly
近日,由东京大学的研究生竹内雅树等人开发的佩戴式电子人工喉Syrinx受到业界不小的关注,这款人工喉运用了人工智能技术,助力因疾病等摘除声带而无法说话的患者通过动动嘴即可生成接近于本人声音的语音,是人工喉科技领域的重大突破。据悉,团队今后还计划增加通过嘴角动作来开关电源、可再现抑扬顿挫语调的功能,以期在2025年实现实用化。
新型人工喉Syrinx
根据世界卫生组织的数据,全世界每年有超过18.4万人受到喉癌的影响。60岁的前时尚品牌总裁小津弘一(Hirokazu Ogitsu)是这种癌症的受害者之一,他在接受CNN采访时表示:“10年前,我得了颈段食管癌,失声了,虽然在当时恢复得很顺利,但大约两年前我的病复发了,没有设备就无法说话。”
如今,小津在日本东京的一个喉摘除者支援团体“银铃会”(Ginreikai)当志愿者,他在那里用一种叫做电子人工喉的语音设备重新学习说话。电子人工喉是帮助因喉癌等原因摘除声带的人发声说话的装置。目前应用最为广泛的是老式的需要用单手握住的圆柱形产品,它的原理是把人工喉的振动顶端部位放在喉咙位置,通过舌头和嘴的动作来发声。许多用户抱怨说,在开车、吃饭或打字等重要的双手任务中,无法方便使用,而且它发出的声音听起来不自然、机械。“自100多年前它被发明以来,在音质和功能上并没有太多的改进。”
Syrinx项目的牵头人竹内在接受CNN采访时表示:“这些患者表示,他们希望在公共场合(使用人工喉)交谈,不会造成任何不便或尴尬。很多人说:‘我想和健康的人一样说话。’在公共场合使用时,传统的人工喉因其类似机器人的声音而引人注目,除非在紧急情况下,人们不会使用它。” “这个项目是为了开发一种好的设备来改善这一点。”
传统的人工喉和Syrinx的主要区别在于设备制造声音的方式。“传统的设备使用脉冲波,脉冲波可以产生巨大的声音,但与人类的声音相距甚远,且非常机械。所以,我们使用了人类的录音,并对它们进行处理,创造出更像人类声音的声音。” 竹内说,该设备还可以整合用户以前的语音记录(如果他们有的话),使通过Syrinx发出的声音听起来更像原声——这对许多患者来说是一个重要的选择。研究团队通过AI分析了不同高度的声音以多大的震动强度发出,然后生成反映用户声音特征的振动音,将其作为喉原音。我们的声音与我们的身份紧密相连,纽约市威尔·康奈尔医学院(Weill Cornell Medicine)的语言病理学家伊冯·纳普(Yvonne Knapp)说:“如果有人打电话给你,你不知道对方是谁,但那个人说了一个音节,你就知道他是谁,从一个音节就能知道他的身份,这就是声音所能传达的,当患者被剥夺了这些,真的非常非常艰难。”
另外,为了再现不同的声音,Syrinx还在装置中嵌入了两个振荡器,可以产生更大范围的声波频率(这可以实现更多的音高),用户可以通过舌头和嘴唇发音将其转化为语音。除此之外,Syrinx还改良了使用方法,采用以颈带缠在脖子上的设计,改善了易用性,解放了患者的双手。
东京大学学生主导
Syrinx项目由竹内牵头,成员包括松藤圭亮、安在师、李根学、小笠原佑树等研究生。
“由于喉癌等原因,全世界每年有30万人失去声音,日本有4000人失去声音,我们计划让这些患者通过Syrinx发出原声。” 竹内说,在课堂上遇到渐冻人症患者成为了人生的转机。“为帮助那些失去声音的人而行动起来,是在我进入庆应义塾大学理工学部之后做出的决定。”契机是一年级时参加的关于声音的研讨会课程。作为演讲嘉宾登场的是庆应义塾大学语言文化研究所的川原繁人副教授,川原教授、东京都立神经医院的职业治疗师本间武藏先生和患有脑性麻痹障碍但仍担任程序设计师从事软件开发的吉村隆树先生一起主办了“我的声音研讨会”。这个研讨会致力于向因渐冻人症等将来可能会失去声音的患者宣传在做喉摘除之前预先录下声音,让他们在失去声音后也能用自己的声音交流。参加研讨会的渐冻人患者大多是30 ~ 40岁的年轻人。竹内回忆道,“在艰难的生活中也积极地通过SNS、活动、电视等传递信息的姿态激励了我”。在帮助患者录音的过程中,想要帮助患者发出自己原声的想法越来越强烈。
成员松藤圭亮和安在师原本就在研究如何用人工喉进行交流,虽然不知道这项技术能派上什么用场,但两人读了很多关于语音研究的论文,对现有技术有丰富的知识。竹内认为,如果能将他们的学术研究与自己的课题结合起来,就能制造出对患者有用的产品,于是提议与两人组成研发团队。副组长安负责制作电路和便于用户使用的软件,松藤负责信号处理。项目进行到一半时,安的后辈根学、小笠原佑树也加入了团队,负责硬件的设计和3d打印。在这些学生的努力下,Syrinx终于横空出世。
机遇与挑战
目前,Syrinx设备已经在亚洲获得认可,赢得了2021年日本医疗保健商业竞赛(Japan Healthcare Business Contest)的大奖赛,以及2020年的微软创新杯(Microsoft Imagine Cup)亚洲区大奖赛,还被评为2020年詹姆斯戴森奖的日本国家获奖者。
然而,在实现自然的声音方面还存在一些难题。其中之一是振动音会泄露。仅从喉咙里发出振动音是最理想的,但事实并非如此,现有的装置与脖颈之间有时会有振动音泄露,变成噪声传播。还有一个需要攻克的难题是现有的技术很难形成抑扬顿挫的语调,声音往往很单调。
为解决这些问题,研究团队正考虑今后为装置配备摄像头来读取唇部动作等。竹内介绍说:“如果能捕捉到嘴角的动作,就能更接近本人的声音。”目前,使用该设备与配备的放大器等连接时,需通过按钮操作来切换电源。竹内认为,如果能配备传感器功能,将有望实现患者动动嘴唇就可开关电源的功能。
实际上,Syrinx还正在从东大医院的医生、信号处理专家、福利工学专家等方面听取建议,进行技术开发。在 “银铃会”的协助下,还经常对用户进行测试。75岁的咽喉癌幸存者杉山隆(Takashi Sugiyama)已经对这种设备进行了大约七次测试。他说,这听起来仍然过于机械,但随着时间的推移,已经取得了进展。在最近的测试中,他说这种设备的声音更清晰了,而且佩戴起来非常方便舒适。小津大约每个月测试一次该设备,他说他希望Syrinx的带子更有弹性,更好地缠绕在他的喉咙上。
目前,竹内表示,他正致力于将从“银铃会”获得的反馈反映到该设备未来的迭代中。“我很高兴听到,人们惊讶于这个设备,说‘我等不及要使用设备’和‘我希望很快能够商业化’。” 小津也表示,他希望看到这款设备能尽快全面开发出来并上市。他说:“我非常感激能够用自己的声音进行交流,交流对人类和社会是多么重要。”“我相信,我们可以在自如使用两只手的同时,像健康的人一样说话,过上更正常的社交生活。”
使用人工喉的不仅仅是因癌症等而切除声带的人,接受气管切开手术的人、幼儿有时也需要使用。竹内表示:“想将其制造成任何人使用时都不会感到尴尬的设备。” Syrinx今后的目标是实现能发出更自然声音的设备,并以与以往的产品相同的价格上市,该团队还将考虑与企业合作。
新闻来源:CNN、Dezeen、日经新闻,部分图片来源于网络
iWeekly周末画报独家稿件,未经许可,请勿转载