人工智能如何讓癱瘓婦女恢復聲音
帕特·貝內特的處方比“吃幾片阿司匹林,早上給我打電話”要復雜一些。但在她的大腦中植入了四個嬰兒阿司匹林大小的傳感器,旨在解決令她和其他人感到沮喪的問題:失去清晰說話的能力。這些設備將貝內特大腦中幾個與語音相關的區(qū)域的信號傳輸到最先進的軟件,該軟件解碼她的大腦活動并將其轉換為計算機屏幕上顯示的文本。
貝內特現年 68 歲,曾任人力資源總監(jiān),曾經是一名馬術運動員,每天慢跑。2012年,她被診斷出患有肌萎縮側索硬化癥,這是一種進行性神經退行性疾病,會攻擊控制運動的神經元,導致身體虛弱,最終癱瘓。
“當你想到 ALS 時,你會想到手臂和腿部的影響,”貝內特在通過電子郵件進行的采訪中寫道。“但在一群 ALS 患者中,一切都是從言語困難開始的。我無法說話。”
通常,ALS 首先出現在身體的外圍——手臂和腿、手和手指。對于貝內特來說,惡化不是像典型的那樣從她的脊髓開始,而是從她的腦干開始。她仍然可以四處走動、穿衣服并用手指打字,盡管難度越來越大。但她無法再使用嘴唇、舌頭、喉部和下頜的肌肉來清晰地發(fā)音出音素(或聲音單位,例如“sh”),而這些是語音的組成部分。
盡管貝內特的大腦仍然可以制定生成這些音素的方向,但她的肌肉無法執(zhí)行這些命令。
研究人員并沒有訓練人工智能識別整個單詞,而是創(chuàng)建了一個從音素解碼單詞的系統(tǒng)。這些是語音的子單位,它們形成口語單詞的方式與字母形成書面單詞的方式相同。例如,“Hello”包含四個音素:“HH”、“AH”、“L”和“OW”。
使用這種方法,計算機只需要學習 39 個音素就可以解讀英語中的任何單詞。這既提高了系統(tǒng)的準確性,又使其速度提高了三倍。
2022 年 3 月 29 日,斯坦福大學醫(yī)學院的一位神經外科醫(yī)生在貝內特大腦表面的兩個不同區(qū)域分別放置了兩個微型傳感器,這兩個區(qū)域都與語言產生有關。這些傳感器是皮質內腦機接口(iBCI)的組件。與最先進的解碼軟件相結合,它們旨在將伴隨語音嘗試的大腦活動轉化為屏幕上的文字。
手術后大約一個月,斯坦福大學的一組科學家開始每周兩次的研究課程,以訓練解釋她演講的軟件。四個月后,Bennett 嘗試的話語以每分鐘 62 個單詞的速度在計算機屏幕上轉換為單詞,是之前 BCI 輔助通信記錄的三倍多。
貝內特寫道:“這些初步結果證明了這個概念,最終技術將迎頭趕上,讓不會說話的人也能輕松使用它。” “對于那些不會說話的人來說,這意味著他們可以與更大的世界保持聯系,也許可以繼續(xù)工作,維持朋友和家庭關系。”
接近說話的速度
進行手術的外科醫(yī)生杰米·亨德森 (Jaimie Henderson) 醫(yī)學博士說,貝內特的速度開始接近英語使用者自然對話的每分鐘大約 160 個單詞的速度。
亨德森說:“我們已經證明,你可以通過記錄大腦表面一個非常小的區(qū)域的活動來解碼想要的語音。”
神經外科系的 John、Jean Blume-Robert 和 Ruth Halperin 教授 Henderson 是一篇描述該結果的論文的共同高級作者,該論文于 8 月 23 日發(fā)表在《自然》雜志上。
他的共同資深作者、電氣工程和生物工程教授 Krishna Shenoy 博士在研究發(fā)表前去世。
弗蘭克·威利特 (Frank Willett) 博士是霍華德休斯醫(yī)學研究所的一名科學家,隸屬于亨德森和謝諾伊于 2009 年共同創(chuàng)立的神經修復轉化實驗室,他與研究生艾琳·昆茲 (Erin Kunz) 和范超飛 (Chaofei Fan) 共同擔任該研究的主要作者。
2021 年,Henderson、Shenoy 和 Willett 是《自然》雜志上發(fā)表的一項研究的共同作者,該研究描述了他們成功地使用 iBCI 將癱瘓者想象的筆跡轉換為屏幕上的文本,達到了每分鐘 90 個字符或 18 個單詞的速度—迄今為止 iBCI 相關方法的世界紀錄。
2021年,貝內特了解了亨德森和謝諾伊的工作。她聯系了亨德森并自愿參加臨床試驗。
怎么運行的
亨德森植入貝內特大腦皮層(大腦最外層)的傳感器是微小硅電極的方形陣列。每個陣列包含 64 個電極,排列成 8×8 網格,彼此間隔的距離約為信用卡厚度的一半。電極穿透大腦皮層的深度大致等于兩個堆疊的四分之一的深度。
植入的陣列連接到細金線上,這些細金線通過用螺釘固定在頭骨上的基座引出,然后通過電纜連接到計算機。
人工智能算法接收并解碼貝內特大腦發(fā)出的電子信息,最終教會自己區(qū)分與她試圖表達構成英語口語的 39 個音素中的每一個相關的不同大腦活動。
它將對貝內特嘗試的音素序列的最佳猜測輸入到所謂的語言模型中,該模型本質上是一個復雜的自動更正系統(tǒng),它將音素流轉換為它們所代表的單詞序列。
“這個系統(tǒng)經過訓練,知道哪些單詞應該出現在其他單詞之前,以及哪些音素構成哪些單詞,”威利特解釋道。“如果某些音素被錯誤地解釋,仍然可以進行很好的猜測。”
熟能生巧
為了教會算法識別哪些大腦活動模式與哪些音素相關,貝內特進行了大約 25 次訓練,每次持續(xù)約四個小時,在此期間,她嘗試重復從由對話樣本組成的大型數據集中隨機選擇的句子在打電話的人們中間。
舉個例子:“過去五年才這樣。” 另一個:“我就在中間離開了。”
當她嘗試背誦每個句子時,貝內特的大腦活動會被解碼器翻譯成音素流,然后由自動更正系統(tǒng)組裝成單詞,并顯示在屏幕上原始內容下方。然后屏幕上就會出現新的句子。
Bennett 在每次訓練中重復 260 到 480 個句子。隨著貝內特嘗試演講時 大腦活動的熟悉,整個系統(tǒng)不斷改進。
iCBI 的預期語音翻譯能力在培訓課程中使用的不同句子上進行了測試。當句子和單詞組裝語言模型僅限于 50 個單詞的詞匯時(在這種情況下,所使用的句子是從特殊列表中抽取的),翻譯系統(tǒng)的錯誤率為 9.1%。
當詞匯量擴展到 125,000 個單詞(大到足以組成幾乎任何你想說的內容)時,錯誤率上升到 23.8%——遠非完美,但與之前的技術水平相比已經邁出了步。
“這是一個科學的概念證明,而不是人們可以在日常生活中使用的實際設備,”威利特說。“但這對于恢復無法說話的癱瘓患者的快速溝通來說是一個巨大的進步。”
貝內特寫道:“想象一下,當非語言的人能夠用語言表達自己的想法時,購物、赴約、點餐、去銀行、打電話、表達愛意或欣賞甚至爭論等日?;顒訉卸嗝床煌?。”即時的。”
本研究中描述的設備僅授權用于研究用途,不可商用。這項注冊臨床試驗是在 BrainGate 的支持下進行的,BrainGate 是一個多機構聯盟,致力于推進腦機接口在假肢應用中的使用,由研究合著者、神經學家 Leigh Hochberg 博士領導麻省總醫(yī)院、布朗大學和弗吉尼亞州普羅維登斯(羅德島)醫(yī)療保健系統(tǒng)的研究員。
免責聲明:本文由用戶上傳,與本網站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據此操作,風險自擔。 如有侵權請聯系刪除!
-
6月25-28日,由中國進出境生物安全研究會、中國國際旅行衛(wèi)生保健協(xié)會主辦,中國青年創(chuàng)業(yè)就業(yè)基金會支持,中國出入...瀏覽全文>>
-
胃腸鏡檢查,聽起來可能有些令人不安,但實際上,它可能是生活中的救命稻草。對于一些人來說,定期進行胃腸鏡...瀏覽全文>>
-
6月16日-20日,2025年優(yōu)秀博士后研究人員(紹興)研學活動順利舉行。本次活動匯聚了來自全國各地的百余名博士后,...瀏覽全文>>
-
近日,天津松果生物醫(yī)療科技有限公司自主研發(fā)的牛跟腱來源去端肽I型膠原蛋白原材料成功通過國家藥品監(jiān)督管理局...瀏覽全文>>
-
在數字化產業(yè)轉型的浪潮奔涌之際,病理學正經歷著前所未有的革新機遇。奧偉登(Evident)憑借百年光學技術積淀,以...瀏覽全文>>
-
6月6-8日,CHINAGUT 2025中國腸道大會在寧波國際會議中心隆重舉辦。大會由南京醫(yī)科大學第二附屬醫(yī)院、國家消化...瀏覽全文>>
-
在第28屆北京國際口腔展這一行業(yè)風向標級盛會上,北京易嶺生物科技有限公司(下面簡稱易嶺生物)憑借重磅新品發(fā)...瀏覽全文>>
-
2025款上汽大眾ID 4 X在安徽阜陽地區(qū)的售價會根據配置和選裝包有所不同?;A版車型的廠商指導價大約在20萬...瀏覽全文>>
-
嵐圖FREE,作為一款集豪華與智能于一體的新能源SUV,正以全新的姿態(tài)迎接每一位渴望高品質出行的用戶。現在,嵐...瀏覽全文>>
-
安徽阜陽的大眾ARTEON 2022新款現已到店,最低售價從34 80萬元起,無疑是近期購車的最佳時機。這款車型以其...瀏覽全文>>