![]() |
臺(tái)北2024年6月25日 /美通社/ -- 繼今年 6 月份於臺(tái)北舉辦的COMPUTEX 2024引起AI浪潮後,全球基因定序儀器龍頭企業(yè) Illumina 的副總裁及特聘科學(xué)家樊鎧豪(Kyle Kai-How Farh)博士於 6 月 21 日到臺(tái)南出席醫(yī)學(xué)研討會(huì)和發(fā)表專題演講,以「人工智慧在精準(zhǔn)醫(yī)學(xué)和藥物開發(fā)的應(yīng)用(AI for Precision Medicine and Drug Discovery)」為題,暢談如何借助深度學(xué)習(xí)(Deep learning)技術(shù)探索臨床基因變異,並以此促進(jìn)新藥物的開發(fā)。此外,他也分享了 AI 在臨床試驗(yàn)的應(yīng)用以及對(duì)精準(zhǔn)醫(yī)學(xué)發(fā)展的貢獻(xiàn)。
跨越資訊遺傳學(xué)醫(yī)學(xué) 3 大領(lǐng)域,目前執(zhí)掌 Illumina AI 實(shí)驗(yàn)室
樊博士於 2015 年 5 月加入 Illumina,目前是這家生技大廠的副總裁兼基因組解讀 AI 實(shí)驗(yàn)室負(fù)責(zé)人與首席研究員,領(lǐng)導(dǎo)一個(gè)由超過 50 名跨國(guó)專家學(xué)者組成的跨領(lǐng)域團(tuán)隊(duì),團(tuán)隊(duì)成員涵蓋深度學(xué)習(xí)、統(tǒng)計(jì)遺傳學(xué)和分子生物學(xué)等不同領(lǐng)域,致力探索人類遺傳變異帶來的臨床影響,從而提升疾病診斷率,並應(yīng)用於新藥的開發(fā)。
事實(shí)上,樊博士本身也是一位跨領(lǐng)域?qū)<遥?2001 年於美國(guó)萊斯大學(xué)(Rice University)畢業(yè),取得資訊科學(xué)學(xué)士學(xué)位後,先後於麻省理工學(xué)院和哈佛醫(yī)學(xué)院完成分子生物學(xué)博士學(xué)位及醫(yī)學(xué)士哲學(xué)博士(MD–PhD)雙學(xué)位。此後他曾分別於布洛德研究所(Broad Institute of MIT and Harvard)從事群體遺傳學(xué)和神經(jīng)生物學(xué)的博士後研究,以及在波士頓兒童醫(yī)院(Boston Children's Hospital)臨床遺傳學(xué)部門擔(dān)任住院醫(yī)師,其跨學(xué)科實(shí)力由此可見一斑。
解讀變異尚在起步階段,PrimateAI-3D 助破解意義不明變異
在演講的一開始,樊博士指出科學(xué)界現(xiàn)今對(duì)人類遺傳變異仍然所知甚少,針對(duì)這些變異的臨床影響的研究還是處於起步階段。在 7,000 萬個(gè)涉及蛋白質(zhì)編碼的變異(Protein-coding variants)之中,只有約 0.1% 是已知道其功能或影響的,其餘 99.9% 仍是屬於「意義不明的變異(Variants of unknown significance,VUS)」。有鑒於此,他與團(tuán)隊(duì)定下 5 年計(jì)畫,期望能早日破解人類基因組中所有變異會(huì)帶來的臨床影響。
為了在這個(gè)領(lǐng)域?qū)で笸黄疲┦康膱F(tuán)隊(duì)近年開發(fā)出一套名為 PrimateAI-3D 的深度學(xué)習(xí)演算法。顧名思義,研究人員採用了來自 233 種靈長(zhǎng)類動(dòng)物(Primates)、超過 800 隻個(gè)體(平均每個(gè)物種 3.5 個(gè))共 450 萬個(gè)常見遺傳變異來訓(xùn)練這個(gè) AI 演算法,訓(xùn)練數(shù)據(jù)及規(guī)模甚至是現(xiàn)有權(quán)威資料庫 ClinVar 的 70 倍??紤]到靈長(zhǎng)類動(dòng)物的蛋白質(zhì)編碼序列跟人類的吻合程度高達(dá) 99.6%,結(jié)合序列的進(jìn)化保守性(Evolutionary conservation)和蛋白質(zhì) 3D 結(jié)構(gòu),經(jīng)過訓(xùn)練的演算法可用作預(yù)測(cè)人類基因變異的致病性。
樊博士提到,靈長(zhǎng)類動(dòng)物持續(xù)平行演化(Parallel evolution),因生活在相似環(huán)境而發(fā)展出相似的適應(yīng)特徵,這導(dǎo)致部分疾病的基因已經(jīng)透過自然選擇而被淘汰。而在靈長(zhǎng)類動(dòng)物中常見的變異對(duì)人類而言普遍是良性的,這亦是建立 PrimateAI-3D 演算法的核心理念,由此,研究人員將大約 440 萬個(gè)原本被定義為 VUS 的人類基因變異重新歸類為「可能良性(likely benign)」,為解讀基因組變異帶來重大突破。演算法的研究成果於 2023 年 6 月在頂尖期刊《科學(xué)》(Science)中發(fā)表,團(tuán)隊(duì)發(fā)現(xiàn) PrimateAI-3D 在經(jīng)過訓(xùn)練後,其區(qū)分良性和致病性變異的能力顯著優(yōu)於另外 15 種已發(fā)布的機(jī)器學(xué)習(xí)演算法。
接下來樊博士以 CACNA1A 基因?yàn)槔?,進(jìn)一步介紹研究團(tuán)隊(duì)如何使用深度學(xué)習(xí)解讀基因變異。醫(yī)學(xué)界目前已知 CACNA1A 的致病性變異會(huì)導(dǎo)致癲癇和自閉癥等一系列神經(jīng)病變和發(fā)育障礙,他表示基於自然選擇演化的數(shù)據(jù)可以幫助訓(xùn)練模型,找出 CACNA1A 基因與癲癇的關(guān)聯(lián)。這些模型能夠識(shí)別致病變異,並應(yīng)用於藥物的開發(fā)過程。此外,在 CACNA1A 基因變異的分析中,樊博士博士展示結(jié)合 gnomAD、靈長(zhǎng)類變異、ClinVar 資料庫和 PrimateAI-3D 數(shù)據(jù)的優(yōu)勢(shì),通過多項(xiàng)數(shù)據(jù)源的交叉分析比對(duì),可以更準(zhǔn)確地理解基因變異的臨床意義。
以 AI 辨識(shí)人類致病變異,提升藥物發(fā)現(xiàn)及臨床試驗(yàn)成功機(jī)率
除了準(zhǔn)確分辨人類基因體的變異,樊博士表示 PrimateAl-3D 演算法也有助於突破標(biāo)靶藥物開發(fā)的關(guān)鍵瓶頸,從而大幅提高藥物開發(fā)和臨床試驗(yàn)的成功率。以 LDLR 和 CDSK9 這兩個(gè)基因?yàn)槔鼈兯幋a的蛋白是與高膽固醇血癥和心血管疾病密切相關(guān)的生物標(biāo)記物,透過利用此 AI 演算法推估變異的致病性評(píng)分(PrimateAI-3D score),研究人員發(fā)現(xiàn)人體內(nèi)低密度膽固醇(Low-density lipoprotein cholesterol,LDL,即民眾俗稱的「壞膽固醇」)的水平與 LDLR 和 PCSK9 的變異相關(guān)。例如當(dāng)前者的變異得出的 PrimateAI-3D 分?jǐn)?shù)較高,個(gè)體血液中的 LDL 膽固醇水平會(huì)比低分者為高。至於後者,演算法結(jié)果顯示帶有罕見且 PrimateAI-3D 分?jǐn)?shù)較高的變異的個(gè)體,其 LDL 膽固醇水平會(huì)相對(duì)較低。
這些發(fā)現(xiàn)將有助科學(xué)家更有效找出藥物標(biāo)靶,繼而開發(fā)模仿自然遺傳變異的藥物。事實(shí)上,借助 AI 搭配遺傳學(xué)分析,團(tuán)隊(duì)已經(jīng)找出造成 LDL 異常累積的路徑,讓藥廠能夠針對(duì)當(dāng)中的關(guān)鍵變異及生物標(biāo)記物研發(fā)標(biāo)靶療法,估計(jì)相關(guān)藥物(例如 PCSK9、ANGPTL3/4 或 NPC1L1 的抑制劑)的市場(chǎng)規(guī)模達(dá)數(shù)十億美元計(jì)。此外,團(tuán)隊(duì)另一個(gè)於 2023 年在《科學(xué)》中發(fā)表的研究顯示,同樣針對(duì)英國(guó)生物樣本庫(UK Biobank)中逾 45 萬個(gè)個(gè)體,PrimateAI-3D 在發(fā)現(xiàn)新的藥物標(biāo)靶方面的表現(xiàn)顯著優(yōu)於美國(guó)某藥廠於 2021 年進(jìn)行的研究。展望未來,團(tuán)隊(duì)將會(huì)與不同的大藥廠以及國(guó)家級(jí)基因定序計(jì)畫合作,期望將演算法的應(yīng)用範(fàn)圍從高膽固醇這類比較普遍的健康問題拓展至罕見多發(fā)性硬化癥、帕金森氏癥等相較罕見的疾病。
另一方面,樊博士在演講中也提到「多基因風(fēng)險(xiǎn)評(píng)分(Polygenic Risk Score,PRS)」帶來的挑戰(zhàn)。簡(jiǎn)單而言,PRS 就是根據(jù)個(gè)體中多個(gè)基因的變異狀況,以統(tǒng)計(jì)學(xué)方法計(jì)算出一個(gè)人罹患某種疾病的風(fēng)險(xiǎn)。在罕見變異多基因風(fēng)險(xiǎn)評(píng)分(PRS)方面,顯示罕見變異 PRS 能夠有效識(shí)別疾病風(fēng)險(xiǎn)最高的個(gè)體,特別是膽固醇異常和 2 型糖尿病風(fēng)險(xiǎn)。在跨族群通用性方面,罕見變異 PRS 在非歐洲族群中的表現(xiàn)良好,呈現(xiàn)出比常見變異 PRS 更高的相關(guān)性。
AI 基因組學(xué)技術(shù)長(zhǎng)足進(jìn)步,加速精準(zhǔn)醫(yī)學(xué)時(shí)代來臨
隨著機(jī)器學(xué)習(xí)、人工智慧和基因組學(xué)技術(shù)長(zhǎng)足進(jìn)步,樊博士及其團(tuán)隊(duì)還進(jìn)一步開發(fā)以深度神經(jīng)網(wǎng)路為基礎(chǔ)的 SpliceAI,可利用 RNA 定序(RNA-seq),針對(duì)個(gè)別組織或疾病,預(yù)測(cè)相關(guān)的選擇性剪接(Alternative splicing)模式、以及會(huì)擾亂基因剪接的非編碼變異(Non-coding variants),並識(shí)別病人細(xì)胞中異常的剪接問題?,F(xiàn)時(shí) SpliceAI 的準(zhǔn)確度可達(dá) 95%,遠(yuǎn)超過現(xiàn)有功能類似的 AI 演算法。以自閉癥為例,硏究團(tuán)隊(duì)在 28 名未確診的自閉癥患者中,預(yù)測(cè)了 75% 患者中基因體發(fā)生異常剪接的位點(diǎn)。
另一方面,團(tuán)隊(duì)也持續(xù)開發(fā)新的應(yīng)用,包括一款名為 perturb-seq 的基因編輯技術(shù)。其原理是將每顆細(xì)胞視為一個(gè)實(shí)驗(yàn),研究人員將不同基因變異插入單個(gè)細(xì)胞,讓每顆細(xì)胞都帶有一個(gè)變異,接下來再以單細(xì)胞 RNA 定序分析這些變異如何影響細(xì)胞功能,並運(yùn)用機(jī)器學(xué)習(xí)演算法評(píng)估每個(gè)變異的致病性。目前團(tuán)隊(duì)已借助此技術(shù)成功破解涉及 TP53、CDKN2A 和 SOD1 基因合共逾 5,000 個(gè)變異,當(dāng)中前兩者是常見的腫瘤抑制基因。樊博士認(rèn)為,這項(xiàng)技術(shù)未來可加速罕見疾病的診斷。最後他也表示,隨著精準(zhǔn)醫(yī)學(xué)時(shí)代來臨,如何推動(dòng)群體基因體定序,最終還是有賴人工智慧的技術(shù)協(xié)助。而 Illumina 亦致力在相關(guān)領(lǐng)域提供領(lǐng)先業(yè)界的服務(wù)和解決方案,協(xié)助各大藥廠加速藥物開發(fā)。
參考資料:
進(jìn)階搜尋
搜尋
|
|
|
|
繁體中文知識(shí)庫正在建設(shè)中,請(qǐng)您選擇簡(jiǎn)體中文或英文版查看。
Copyright © 2025 美通社版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載.
Cision 旗下公司.