2022 年,约翰逊成为加州大学伯克利分校和加州大学旧金山分校联合开展的一项临床试验的第三位参与者。这项试验旨在通过一种神经假体恢复严重瘫痪患者的语言能力。研究人员通过植入神经假体,从大脑的语言运动皮层记录信号,绕过受损的神经通路,从而产生可听的语音。
据IT之家了解,该设备依赖于放置在大脑语言生成区域上方的植入物,当约翰逊尝试说话时,植入装置会检测到神经活动,并将信号传输到连接的计算机。随后,人工智能解码器将这些信号转化为文本、语音或数字形象上的面部表情。最初,该系统使用了序列到序列的人工智能模型,需要完整的一句话才能输出结果,导致会有 8 秒的延迟。然而,2025 年 3 月,研究团队在《自然神经科学》杂志上报告称,他们已转向流式架构,实现了仅 1 秒延迟的近实时翻译。
为了使体验更加个性化,研究人员利用约翰逊 2004 年婚礼演讲的录音重现了她的声音。她还选择了一个与自己外貌相符的虚拟形象,该形象能够模仿微笑或皱眉等面部表情。
加州大学伯克利分校电气工程与计算机科学助理教授戈帕拉・阿努曼奇帕利(Gopala Anumanchipalli)、加州大学旧金山分校神经外科医生爱德华・张(Edward Chang)以及伯克利分校博士生凯洛・利特尔约翰(Kaylo Littlejohn)表示,他们的目标是使神经假肢实现“即插即用”,将其从实验系统转变为标准临床工具。未来改进的方向可能包括无线植入装置,从而无需直接连接计算机,以及更加逼真的虚拟形象,以实现更自然的互动。研究团队还设想开发数字“克隆人”,不仅能复制用户的声音,还能模仿其对话风格和视觉信号。
这项突破有望帮助那些因中风、肌萎缩侧索硬化症(ALS)或受伤而失去语言能力的相对小众但极为脆弱的群体,让他们重新获得更快速、更自然的沟通能力。研究人员强调,该系统只有在参与者有意识地尝试说话时才会工作,从而确保用户的自主性和隐私。
对于约翰逊来说,这次试验彻底改变了她的生活。“我希望患者看到我,知道他们的生活并未结束,”她在接受加州大学旧金山分校采访时说。她期待有一天能在康复中心担任咨询师,借助神经假肢与客户交流。
随着延迟时间降至约 1 秒,以及人工智能建模的持续进步,研究人员相信,实用的实时语音恢复技术有望在几年内实现,这将彻底改变技术为失去语言能力的人们赋予声音的方式。