當前位置: 華文問答 > 科學

突破性技術:基因測序進入私人客製時代

2024-07-09科學

千禧年初發展的組學技術在 2020 年新冠肺炎疫情出現時發揮了重要的作用:糖組學分析新冠病毒棘蛋白糖基化,代謝組學分析輕重癥患者差異,比較相關作用組學勾勒新冠病毒蛋白作用圖譜等等。那為什麽這些組學分析在平時比較少見?我們日常生活中接觸到的核酸檢測又屬於什麽技術?

舉例來說,代謝組學多套用於復雜的生物學研究,檢測和分析周期長,不太適用於快速判定個人核酸陰/陽性。且代謝組學一般需要提取人體的血漿或血清,這對返鄉過年,需要多次檢測的廣大同胞而言可不是友好的操作。因此,核酸檢測一般為咽拭子或鼻拭子,只需輕輕一刮即可采集遺傳物質。後續透過 DNA 擴增和測序技術,即可確定陰/陽性。這樣「飛入尋常百姓家」的 DNA 測序技術又是何時開始發展,並廣泛投入套用的呢?

微流控技術降低 DNA 測序成本

DNA 測序技術是研究基因組學的重要技術途徑。基因組學的研究內容是對生物體所有基因進行表征和研究,對不同基因組之間的關系進行分析和比較。20 世紀末,多個物種的基因組計劃逐個啟動。

1977 年,噬菌體(5.4 kbit)測序完成。

1981 年,人類胞器中的線粒體基因組(16.6 kbit)測序完成。

1992 年,釀酒酵母 Ⅲ 號染色體(315 kbit)測序完成。

1995 年,嗜血流感菌基因組(1.8 Mbit)測序完成。

1996 年,釀酒酵母完整基因組(12.1 Mbit)測序完成。

大眾最熟知的莫過於人類基因組計劃(又稱生命科學的「登月計劃」)。2003 年,人體基因組 DNA 中 30 億個堿基對(3000 Mbit)的秘密被全部揭曉。自此後基因組時代開啟,DNA 測序技術開始迅速發展。

由於 DNA 是遺傳物質,相比於蛋白、多糖、脂質等生物大分子,其結構和組成比較簡單,且十分穩定。因此,相比於其他組學技術,DNA 測序技術發展得尤為快速。具有代表性的是個人基因組學(Personal Genomics)、100 美元基因組測序($100 Genome)和癌癥基因組學(Cancer Genomics)。這 3 種技術也分別入選了 2004 年、2009 年和 2011 年的【麻省理工科技評論】「全球十大突破性技術」。

人類基因組計劃揭曉 30 億個堿基對的遺傳資訊後,人們開始關註遺傳資訊帶來的個體差異。為什麽大家擁有類似的遺傳資訊,卻在發色、膚色、身高等一系列性狀中差異巨大呢?佩爾金科學(Perlegen Sciences)公司的首席科學家大衛·考克斯(David Cox)很快提出要尋找個人基因組之間的差異性,將個人基因組測序發展成一種快速有效的檢測疾病手段。這種技術方法避免了醫生在茫茫 30 億個資訊裏做判斷,而是量身定做,針對每個人的基因組測序結果,確定個體是否對某種疾病易感,提前防範。

圖|提取細胞樣本

當然,有的疾病對應著一兩個基因突變,此類疾病(如亨廷頓病)比較容易診斷,但也有許多疾病會與多個基因相關,不易判斷。此時,個人基因組測序的結果與疾病發病之間的相關程度不夠緊密,因此考克斯等人也希望采集海量的個人數據,分析處理得到單核苷酸多型性(SNP)以與疾病之間建立更加緊密的關系。類似「望聞問切」一樣,透過基因的「癥狀」對個人進行診斷。這也是邁向精準醫學的第一步。

為了完成人類基因組計劃,全球投入了 30 億美元。「私人客製」的個人基因組測序的市場在哪裏?隨著測序儀器的不斷進步,尤其是微流控生物芯片技術(Microfluidics)(該技術入選了 2001 年【麻省理工科技評論】「全球十大突破性技術」)的進步,極大地降低了基因組測序的成本。2009 年,大部份科學家們保守地認為基因組測序可以降低至 1000 美元,但同時也提出高目標,在 5 年內降低基因組測序成本至 100 美元,即 100 美元基因組測序。

圖|微流控生物芯片

微流控生物芯片是如何實作降低成本的呢?由於基因組 DNA 有 30 億個「字母」資訊要去讀取,假設我們把一個人的基因組 DNA 想象成一根長繩,通常人們會選擇把這根長繩切成片段,比如 100~1000 個字母,測序後,再將片段拼成一根長繩,整個過程的成本很高,也很耗時。微流控生物芯片同樣也要把長繩切開,但每個片段可以有 100 萬個字母,這樣測序速度提升了,成本也降低了。當然,不止微流控生物芯片技術,科學家們采取了許多方法(一代、二代、三代、四代測序技術)最佳化測序過程。

2012 年 3 月 29 日,美國生命技術(Life Tech-nologies)公司宣布在中國推出基因測序儀 IonProton。借助該技術產品,個人全基因組測序只需一天時間、1000 美元即可完成。2014 年 1 月,全球基因測序和芯片技術公司因美納(Illumina)推出 HiSeq X Ten 儀器,將單人類基因組測序成本降至 1000 美元以下。

單細胞測序實作細胞多樣性表征

在個人基因組測序速度越來越快,成本越來越低時,研究人員提出了新的挑戰:單細胞測序。傳統的測序一般需要提取數萬個細胞中的 DNA 或者 RNA 進行測序,常常會對人體細胞的多樣性理解產生偏差。而單細胞測序,類似於前文所提的「單細胞分析」技術,是在單個細胞層面進行測序和解析基因組,實作了細胞多樣性的表征。

2009 年,第一篇單細胞 mRNA 測序研究問世,標誌著單細胞測序技術開始興起。2018 年,高通量單細胞測序技術被【科學】和【自然方法】雜誌提名為年度突破技術。單細胞測序技術的細分市場也以年均 20% 以上的速度逐年增長。

為什麽傳統測序需要數萬個細胞,而單細胞測序只需要單個細胞呢?簡單來說,傳統測序就像如今核酸檢測中的「混檢」,數萬個細胞會展示出某種性質,如基因突變,至於是哪個或哪種細胞貢獻的,無從得知。而單細胞測序就類似於核酸檢測中的「單檢」,一目了然。同時顯而易見,單細胞測序面臨著如何降低測序時間、節約測序成本、提高測序準確性的考驗。

2016 年,10x Genomics 公司成功推出全球首款單細胞測序儀 Chromium Controller,此後長期占據全球市場,所占市場份額保持領先地位。

圖|10x Genomics 公司的液滴微流控技術

10x Genomics 是怎麽更好、更快、更準地實作單細胞測序的呢?公司憑借著液滴微流控技術,利用含有 75 萬種條形碼(Barcode)的油滴包裹的凝膠珠(GEMs),在 10 分鐘內可自動完成 8 萬個細胞的捕獲。「油包水」的結構實作了凝膠珠與細胞的包裹、細胞裂解,以及凝膠珠溶解釋放條形碼序列靶向特定基因組序列。總體來說,微流控技術實作了單個細胞的分離,而液滴技術實作了不同細胞中同一基因測序文庫的建立。

科學技術的發展沒有最好,只有更好。近年來,國內這片沃土也孕育了一批批有誌之士,他們的加入為單細胞測序賽道帶來了新的生機。

2018 年註冊成立的新格元(Singleron)公司目前已融資近兩億美元,專註於將單細胞測序技術套用在臨床檢測、健康管理和藥物開發領域。2020 年,新格元推出國內首個自動化單細胞測序前處理儀器 Singleron Matrix。針對不同的樣品,新格元實作了測序前樣品制備的完整解決方案,便於臨床樣品的儲存、運輸。

2021 年 6 月,萬乘基因(10K Genomics)公司上線國內首款液滴微流控單細胞測序儀 Perseus™。公司創始人施威揚表示儀器的核心器械都實作了國產化。相比於市場上普遍的轉錄組分析,萬乘基因也在不斷拓展市場,發展單細胞甲基化、單細胞蛋白質組等,打造多組學單細胞測序平台。

國內的 M20 Genomics 公司近來也考慮利用單細胞測序技術,推進細胞圖譜 2.0 的繪制工作,搭建人類細胞藍圖,建立超精確的人類生理學模型,為藥物的研發和實驗提供加速器。

2021 年 4 月,中國 39 家研究所和醫院的研究人員與 10x Genomics 中國區團隊攜手合作,利用單細胞 RNA 測序技術處理了來自 284 個樣本中的 146 萬個細胞,對新冠病毒感染後的免疫反應進行深入分析,尋找細胞因子風暴的新元兇,相關工作發表於【細胞】雜誌上。大規模單細胞圖譜研究的潛力可見一斑。更多的研究和套用都靜待單細胞測序技術去大展身手。

測序技術帶動多領域發展

全球範圍內,高通量、低成本、單細胞、超靈敏的測序技術,發展得日新月異,讓人眼花繚亂。

同時,突飛猛進的測序技術也帶動了學術界開展更多的研究,例如人們考慮將遺傳物質 DNA 作為數據儲存材料。大數據時代的地球每天產生的資訊量,遠遠超過了過去 5000 年人類文明的資訊總和。更有預計稱,到 2040 年,全球需要 1×10⁶t 矽基芯片儲存數據。而 DNA 儲存密度大、能耗低、周期長,理論上只需要 1kg 就能夠實作全球資訊的儲存。

資訊儲存的流程主要是儲存、編碼和讀取。DNA 測序技術對應的是數據的讀取,然而目前 DNA 在儲存層面還存在合成成本高、速度慢、穩定性差等多個問題,但人們依舊期待 DNA 成為數據儲存材料的未來。投身「人類基因組測序」的科學家們或許也沒有想到,有一天基因組測序也會為 DNA 儲存帶來騰飛的機會。

此外,2011 年的【麻省理工科技評論】「全球十大突破性技術」之一,癌癥基因組學也得益於測序技術的發展。該技術圍繞癌癥基因圖譜測序,進而實作癌癥預測或治療。這項技術的領軍人物伊萊恩·馬爾迪斯(Elaine Mardis)認為「基因-突變-治療」這個方程式式過於簡單。癌癥測序不僅要考慮多種基因突變,還要考慮 DNA 測序之外的 RNA 測序。此外,在臨床試驗中納入真實數據及推動患者基因數據共享等都要不斷地推進實作。

2013 年,【科學】雜誌用多篇文章專題介紹「癌癥基因組學」,提出從測序分析、原則總結、疾病檢測和臨床影響等方面全面發展。2020 年 8 月,西班牙的研究團隊從來自 66 種癌癥的 28076 個腫瘤樣品基因組中鑒定了 568 個癌癥驅動基因,繪制了迄今為止最完整的癌癥驅動基因全景圖。

癌癥基因組學的發展表明,在不久的將來,常規癌癥治療將不再側重於器官,而會更關註癌癥的基因組特征。期待未來,醫學專家能夠透過讀取 DNA 資訊,在治療過程中為每位患者確定最好的治療方案。

除了癌癥,壽命的延長研究也得益於測序技術的發展。目前,已經有許多基因被證明對多種模式動物的衰老和壽命有廣泛影響。這張基因名單還在不斷變長。那麽對衰老基因的幹預是否可以實作壽命延長呢?參照愛因斯坦的一句話:我從來都不思考未來,它來得太快了。

圖|2012 - 2020 年全球基因測序行業市場規模及預測

DNA 測序技術也帶來了廣闊的市場前景。全球基因測序行業市場規模不斷地擴大,僅因美納公司市值已達 571.96 億美元(資料來源於百度股市通)。

僅對中國測序市場規模進行分析,2015 - 2019 年,國內基因測序行業市場規模以 40% 的復合年均增長率增長,2019 年,國內基因測序行業市場規模約為 149 億元。未來,以中國為主的亞太地區將成為基因檢測的重要市場之一。從具體診療方向來看,腫瘤診斷治療也是最具潛力市場之一。

如此龐大的基因測序市場規模,已經在日常生活的方方面面展現了出來。

孕前檢查和產前檢查,比如羊水穿刺檢測、唐氏篩查、無創產前基因檢測等都透過測序技術,結合疾病的遺傳模式幫助夫婦孕育健康的寶寶,避免出生缺陷;又如更具科學性的「滴血驗親」—— 親子鑒定,便是透過 DNA 測序實作的。醫院中的遺傳病篩查、腫瘤靶向治療等也是 DNA 測序的套用方向。許多刑事案件中遺留下來的物證,也可以透過提取 DNA 測序,進而定位犯罪嫌疑人。

甚至,DNA 測序對於每個人的日常生活習慣也存在指導意義。例如由於個體的基因差異,每個人的酒精代謝和咖啡代謝是不同的。透過 DNA 測序,喝咖啡等許多生活習慣都可量身定做,每個人都可以找到更適合自己的生活方式。

圖|人類前進演化

人們接觸到的核酸檢測,更是 DNA 測序的重要體現。透過鼻拭或咽拭提取樣品,若樣本中存在病毒的基因,則意味著「陽性」,反之則為「陰性」。如此便利準確的核酸檢測正是一系列測序技術發展的副產物。「科技改變生活」,感謝 20 多年前提出偉大理想的科學家們,正是他們多年的攻堅克難,才讓如今的生活方便快捷。

除了陰陽性判定,核酸檢測中的 DNA 測序還有更多套用。例如,為什麽兩年多來的新冠肺炎疫情,有的是Alpha毒株引起的,有的是德爾塔或Omicron毒株引起的?DNA 測序技術幫助人們實作了追蹤新冠病毒。2022 年,新冠病毒變異追蹤(COVID Variant Tracking)被評為【麻省理工科技評論】「全球十大突破性技術」之一。

到目前為止,新冠病毒已經是地球上被測序最多的生物體,全球陽性樣品累積的病毒基因組序列已經實作了超過 700 萬個基因圖譜,也讓科學家們迅速發現了多種病毒突變體。

斯泰隆博斯大學(Stellenbosch University)的科學家圖裏奧·奧利韋拉(Tulio Oliveira)在 2021 年 11 月 25 日向世界宣布,其實早在 6 周之前,奧利韋拉團隊就對 11 月底變異程度最高的突變體Omicron隱約有所「感覺」,迅速針對新型病例進行了大量的 DNA 測序,進而快速確定了Omicron突變體。

得益於突變體的快速鑒定,11 月之後,圍繞Omicron的一系列研究迅速開展,比如毒株的傳染性、毒性,以及對於現有疫苗的敏感度等。同時,一系列政策如旅行禁令、疫苗接種原則等也迅速頒布。在防疫路上,人們也逐漸從「被動防疫」轉化為「即時跟進」。

科學家們並不止步,更希望能夠「主動迎擊」,從海量的數據中預測病毒下一步的行動,預防新的威脅出現。

雖說如今 DNA 測序已經非常「平價」,但針對全球範圍的樣品,還是會有很高的成本。因此奧利韋拉提出優先考慮感染率突增的地區樣本,有針對性地分析,並稱之為「非線性測序」。目前全球各地的測序技術、測序儀器和測序水平參差不齊,也給非線性測序帶來了挑戰。例如秘魯的測序技術小眾,對Lambda變體的測序發現太晚,導致Lambda疫情在秘魯無法阻擋。

病毒的預測其實在流感病毒中也有所體現。每年科學家們都會挑選未來可能占主導地位的流感毒株,並基於此設計疫苗。但目前預測結果準確度較低。

測序能告訴我們以往病毒是如何變異的,目前還無法準確地確定未來病毒會如何演變,但至少即時追蹤已經為全球提供了「早期預警」,避免了某個變種的「星星之火」成「燎原之勢」。

本文摘錄自:【科技之巔(20周年珍藏版):全球突破性技術創新與未來趨勢】