性命年夜迷信:從微查包養網心得不雅到介不雅的組學研討_中國網

作者:

分類:

中國網/中國發展門戶網訊 在20世紀中葉,研討者在物理學和化包養行情學之理論與實驗技術的推動下,勝利解析了卵白質的空間結構并提出了DNA雙螺旋模子;分子生物學在此基礎上誕生,進而開啟了在分子程度上研討性命及其活動的現代性命科學時代。性命科學樹立在還原論的基礎之上,即生物體與非性命物體沒有本質的區別,都要遵守嚴格的物理學和化學的規律,可以在分子層面上通過包養對個別基因或卵白質的結構與效能來認識和闡明細胞甚至個體的性命活動。這個時期的研討者采用“碎片化”的形式來研討性命及其心理或病理活動。

可是,研討者逐漸認識到,性命活動并非是由一個個基因或卵白質“零件”獨立完成的,而是樹立在性命體內眾多基因、卵白質和其他化學小分子構成的復雜彼此感化之上;對于高級生物而言,除了分子層面復雜的彼此感化網絡外,還有著細胞、組織和器官等分歧介觀層面各種組分之間的彼此感化。是以,性命活動是這樣一種復雜系統的整體行為。顯然,要真正揭開性命的奧秘,需求從整體角度來研討性命復雜系統的各種彼此感化網絡,以及相應的心理病理活動。隨著20世紀末基因組測序技術和其他研討技術的發展,國際科學界啟動了跨世紀的“人類基因組計劃”。在這個國際年夜科學計劃的推動下,性命科學的研討范式慢慢從部分研討戰略轉變到整體研討戰略,正如Nature雜志在一篇評論該計劃的社論中所說:“似乎在一夜之間就從一個基因、一個卵白質、一個分子、一次研討一個,轉變為一切基因、一切卵白質、一切分子、一次研討一切。一切都按組學的規模進行。”

分子層面的多組學研討

20世紀中葉興起的現代性命科學研討表現出典範的“個體戶”特征,即以眾多項目負責人(PI)領導的小規模實驗室為研討主體,可以稱為“小科學”形式。隨著世紀之交“人類基因組計劃”的啟動,性命科學領域出現了全新的年夜科學研討形態。由多個科研團隊組織起來,針對某一具體研討目標配合開展研討的“聯合體”(包養網consortium)已經成為性命科學領域的常態,如:研討精力決裂癥的國際“精力病基因組學聯合體”(Psychiatric Genomics Consortium),以及american國立衛生研討院(NIH)組建的“國際十萬人隊列聯合體”(International Hundred Thousand Plus Cohort Consortium)——觸及43個國家100多個人群隊列的研討。可是,性命年夜科學并不僅僅表現為研討隊伍的規模年夜,還有其他值得關注的特征——在此筆者著重討論以下兩個方面。

數據驅動的研討新范式

樹立在分子生物學基礎上的現代性命科學之主流是假設驅動的研討范式:凡是以解決具體的科學問題為重要目標,采用生物學實驗往剖析和驗證針對特定科學問題的相關科學假設。

但是,“人類基因組計劃”等性命年夜科學研討卻不是科學假設所驅動,表現出一種數據驅動的研討新范式,其重要目標是往獲取海量的生物學數據。自“人類基因組計劃”實施以來,不僅有針對各種生物年夜分子的組學研討,如研討RNA表達譜的轉錄組學、研討卵白質組成和品貌的卵白質組學,並且還衍生出許多相關的組學研討,如研討DNA或RNA修飾的表觀遺傳組學、研討卵白質翻譯后修飾的卵白質修飾組學。此外,還產生了針對糖類分子的糖組學、針對脂類分子的脂組學、針對代謝物等生物小分子的代謝組學。可以說,基于數據驅動的組學研討戰略已經被廣泛地用于分子層次的各種類型的生物分子研討,其特點就是全局性的高通量數據采集與剖析。例如,2022年Science雜志發表了一項觸及英國12000多名癌癥患者的全基因組測序任務,研討者從中發現了近3億個單堿基置換(substitutions)、260多萬個雙堿基置換(double substitutions)、1.5億多個拔出或缺掉(indels)和近200萬個重排(rearrangements)。

更主要的是,這些性命科學年夜數據剖析能夠供給過往生物學小數據所不克不及供給的信息。例如,研討者通過對27萬名歐洲血統參與者的全外顯子組序列數據剖析,發現了許多常見疾病的罕見基因變異。2024年Nature雜志發表了一篇今朝世界上最年夜的人類全基因組等位基因頻率的數據庫(Genome Aggregation Database)的剖析文章,研討者從76156個體的全基因組測序數據中提掏出各種基因變異,進而構建了用來懷抱天然選擇對人類基因組各個區域發生突變的限制水平之“變異受限圖譜”(genomic mutational constraint map)。

由于數據驅動的項目之研討目標和內容不依賴于單一的科學假設或科學問題,所以其研討數據可以用來進行眾多科學問題的研討。這一特點在安康醫學領域有著凸起的表現,最勝利的案例是英國的UK Biobank——該生物銀行搜集了50萬名中老年英國志愿者的血液和唾液等生物學樣本,以及電子安康檔案和全外顯子測序等生物學數據。自2012年建成至今,全球來自90多個國家的3萬多名注冊用戶應用了該數據庫,并基于這些數據發表了9000多篇與安康和疾病相關的研討論文。UK Biobank于2023年11月30日正式宣布完成了這50萬名志愿者的全基因組測序,經同意的研討者可以在“UK Biobank Research Analysis Platform”上訪問這些數據。UK Biobank的數據量預計在2025年將達到40 PB。在UK Biobank勝利的基礎上,英國又在2022年10月啟動了一個更巨大的研討項目——“我們未來的安康”(Our Future Health)。該項目計劃招募500萬名英國志愿者,以獲取他們的生物學樣本和安康信息及生物學數據;盼望通過該項目標實施為抗擊疾病的“關口前移”供給科學指導和技術支撐,并借此推動安康新業態、新產業的發展。中國科學院2020年啟動的戰略性先導科技專項(B類)“多維年夜數據驅動的中國人群精準安康研討”也同樣屬于數據驅動的性命安康年夜科學研討項目;該專項計劃在5年時間內進行年夜規模人群生物學樣本和相應的多組學數據的采集和剖析,進而基于這些數據開展中國人群性命安康方面的各種研討。

生物學年夜數據今朝已經成為性命科學研討的主要戰略資源。在國家數據局等部門最新聯合發布的《“數據要素×”三年行動計劃(2024—2026年)》中,第9條明確提出,“促進嚴重科技基礎設施、科技嚴重項目等產生的各類科學數據互聯互通,支撐和培養具有國際影響力的科學數據庫建設,依托國家科學數據中間等平臺強化高質量科學數據資源建設和場景應用。以科學數據助力前沿研討,面向基礎學科,供給高質量科學數據資源與知識服務,驅動科學創新發現。……摸索科研新范式,充足依托各類數據庫與知識庫,推進跨學科、跨領域協同創新,以數據驅動發現新規律,創造新知識,加快科學研討范式變革”。由此可見,中國科學院在2019年啟動的“國家生物信息中間”建設顯然就是國家科學數據戰略的一個主要組成部門。

迭代演進的研討新形式

數據驅動的性命年夜科學研討新范式的另一個主要特點是“迭代”(iterate),即組學研討的結果凡是不是完備的,其每一次組學研討任務類似于計算機軟件開發——研討者可以在舊版軟件的基礎上不斷地迭代出新版本,組學數據或研討結果可以不斷被完美。“人類基因組計劃”就是性命組學“迭代”的典範:2001年2月,Nature雜志發表了人類基因組測序“草圖”,它僅僅覆蓋了人類基因組90%核酸序列;在2003年“人類基因組計劃”正式宣布完成后,2004年10月在Nature雜志發表的論文也只給出了人類基因組常染色質區域內年夜約99%核酸測序結果;2022年4月,研討者在時隔基因組草圖發表22年之后于Science雜志發表了“人類基因組完全序列”——終于完成了人類全基因組30億個堿基對的測定,比2004年發表的基因組測序版本增添了近2億個堿基對和近2000個新基因。

需求指出的是,“人類基因組計劃”是一個目標明確的年夜科學計劃——測定人體基因組所有的堿基序列,其目標的完成情況在一次次迭代中可以進行準確的評估。可是,對于檢測基因組基因表達情況的“轉錄組學”和卵白質種類與數量的“卵白質組學”等其他類型的組學研討則很難依照基因組研討的方法進行,因為這些生物年夜分子在機體內的總數很難確定。例如,一個卵白質組的一切卵白質種類不僅與其基因組的基因總數及mRNA的可變剪切有關,並且還與卵白質翻譯后修飾有關。人類基因組內的基因數量估計在2萬個擺佈,但卵白質種類估計在20萬到200萬之間。2014年5月,2篇人類卵白質組草圖的文章在Nature雜志上發表;此中,一篇采用質譜技術檢測到了來自17294個編碼基因的卵白質類型,另一篇同樣應用質譜技術檢測到了18097個基因編碼的卵白質。顯然,這些卵白質組草圖離完全地反應人類卵白質種類還差得很遠。

更具挑戰性的是,在多細胞生物體中,轉錄組或卵白質組的構成分歧于基因組的構成。后者在個體的一切細胞里基因組堿基序列基礎是分歧的和穩定的,而前者在分歧種類的細胞里有著分歧的組成類型和品貌,並且在分歧發育階段和分歧保存環境下不斷地變化。不久前,我國科學家啟動了一個國際年夜科學計劃——“人體卵白質組導航計劃”(Proteomic Navigator of the Human Body,π-HuB);該計劃為期30年(2023—2052年),將在首個10年完成對人體近40萬億細胞的卵白質組圖譜,以及與生涯方法相關的卵白質組圖譜的系統繪制息爭析。可以這樣說,即便到2052年之后,人類卵白質組研討仍然處于“迭代”過程中;正如π-HuB計劃首席科學家賀福初所說:“π是一個無窮無盡的數,而科學是‘無盡的前沿’,我們盼望通過‘π’致敬對科學的無限尋求。”

介觀層面的多組學研討

細胞是生物體的基礎結構單元和效能單元。對于多細胞生物而言,個體是由數量眾多的、分歧種類的細胞構成——單個受精卵細胞在發育過程中通過細胞增殖方法增添細胞的數量,并應用細胞分化的方法構成分歧的細胞類型,進而發育成為各種組織和器官。傳統的細胞分類重要是依據細胞形態、空間地位和心理性質等表型特征。據此研討者推測,組成人體的近40萬億個細胞能夠由200—300種細胞類型所構成。

隨著單細胞核酸測序技術的成熟,國際性命科學領域啟動了一個比“人類基因組計劃”更為巨大的年夜科學研討計劃——“人類細胞圖譜”(Human Cell Atlas,HCA)。該計劃今朝有近100個國家約3000名科學家參與,其總體目標是“采用特定的分子表達譜來確定人體的一切細胞類型,并將此類信息與經典的細胞空間地位和形態的描寫連接起來”。從此,單細胞組學成為性命科學一個新的前沿領域:從個體發育到腫瘤發生/發展等各種心理或病理活動的研討中都能看到大批基于單細胞組學的研討任務,研討者的視野從分子層面進進到細胞層面甚至組織器官層面。2024年1月22日,Nature雜志發布了2024年值得關注的七年夜技術,此中就包含了細胞圖譜。

時空交匯的細胞圖譜研討

細胞圖譜的研討最後是基于單細胞轉錄組測序技術。浙江年夜學的研討者于2018年在Cell雜志上發表了全球首個哺乳動物細胞圖譜,觸及小鼠近50種組織的40余萬個細胞;2020年,該研討團隊在Nature雜志報道了他們的另一項任務——應用高通量單細胞轉錄組測序技術構建了人體細胞圖譜,從胎兒和成人的8個重要器官的60種組織中鑒定出100余種細胞年夜類和800余種細胞亞類。

雖然“人類細胞圖譜”當前最常用的單細胞研討技術是轉錄組測序,可是在分子程度對細胞進行分類的測量技術顯然不會局限于此:“這種分子標志物的聚集還將包含非編碼基因的表達程度、轉錄本可變剪接的程度,每個啟動子和增強子的染色質狀態,以及每個卵白質表達程度和它們的每一種翻譯后修飾狀態等”。為此,研討者發展了一系列可用于單細胞研討的組學技術。例如,北京年夜學研討者發展了一種組學程度的單細胞染色質測序技術(single-cell chromatin overall omic-scale landscape sequencing),可以對1個單細胞同時進行染色質狀態、DNA甲基化、基因組拷貝數變異及染色體倍性的全基因組測序技術。由于卵白質組成的復雜性和不成人為擴增性,單細胞卵白質組研討一向是該領域的技術難點。2023年,國際卵白質組學權威及其一起配合者發表了一篇關于單細胞卵白質組研討技術的文章,為解決該難題供給了能夠的解決計劃。

隨著單細胞測序技術的進步,組學研討進進了更年夜的介觀層次——組織甚至器官。研討者發展了把記憶技術和單細胞轉錄組測序結合在一路的“空間轉錄組學”(spatial transcriptomics)。瑞典研討者應用這種技術檢測了人體胚胎心臟發育過程中分歧時間點的組織切片,構建了首個具有單細胞空間辨別率的人體心臟發育圖譜。近年來,研討者進一個步驟發展了多種技術整合的“空間組學”(spatial omics)。例如,american耶魯年夜學研討者發展的一種空間組學技術“DBiT-seq”,可以同時完成組織切片的空間轉錄組測序和卵白質組檢測。此外,深圳華年夜性命科學研討院牽頭的時空組學聯盟(The Spatio Temporal Omics Consortium)將“DNA納米球陣列”(DNA nanoball-patterned arrays)與“原位RNA捕獲”(in situ RNA capture)整合構成一種新的“Stereo-seq”技術,其辨別率可達500 nm,視野可達13 cm×13 cm;研討者應用該技術獲得了單細胞辨別率程度小鼠器官構成的時空轉錄圖譜。2023年,一篇題為“空間組學的曙光”的綜述文章詳細地介紹了用于空間組學的各種技術,以及這些技術之間的組合與運用。

空間組學技術今朝已經用于解析復雜的腦組織。例如,2023年華年夜性命科學研討院聯合中國科學院神經科學研討所等單位在Cell雜志上發布了迄今為止最完全的靈長類腦皮層細胞圖譜——研討者應用其發展的“Stereo-seq”技術及高通量單細胞核轉錄組測序技術等,對獼猴年夜腦皮層的143個腦區進行了空間轉錄組研討,獲得了基于特定轉錄組形式的264種皮層細胞類型。2023年10月13日,Science雜志發表了題為“腦細胞普查”(Brain cell census)的專輯,一共21篇關于人類和非人靈長類動物年夜腦細胞圖譜的研討論文同時在該雜志及其子刊發表。可以說,當前空間組學技術正在為人們認識性命的復雜結構和心理病理活動供給著史無前例的高精度圖像和信息。

整合視野下的性命組學

超出了分子層次和細胞層次的空間組學不僅供給了組織器官結構的精細信息,並且為認識生物體整體演變和調控規律開創了新路徑。americanNIH于2019年啟動了一個名為“人類生物分子圖譜包養計劃”(Human Biomolecular Atlas Program,HuBMAP),旨在開發在細胞辨別率程度繪制人體組織器官圖譜的開放式框架和技術,其焦點就是要樹立一個涵蓋分歧標準的人體整合組織圖譜。Nature雜志在2023年發布了一個介紹了HuBMAP進展的論文集(go.nature.com/3vbznk7)。2023年,我國中山年夜學研討者和英國劍橋年夜學研討者牽頭的國際一起配合團隊在Nature雜志發表了一篇關于肢體發育的文章,研討者基于空間轉錄組技術構建了人胚胎肢體發育過程中的細胞圖譜;不僅確定了組成胚胎期肢體的67個特定細胞簇,並且還提醒出分歧時空的基因表達若何調控了精確的細胞逝世亡,從而保證了肢體的正確形狀之實現。

細胞圖譜研討戰略打破了傳統的還原論研討范式——將高層次的性命活動“還原”到分子層次進行研討息爭釋,倡導從整體的角度研討和懂得性命。2024年,american洛克菲勒年夜學的研討者在Science雜志上發表了一篇從“超細胞標準”(supracellular)來研討形態發生的論文;研討者以雞胚胎的皮膚作為研討模子,系統地剖析了形態因子(morphogen)對分歧空間地位細胞的物感性質之影響,并明確指出“懂得這一多標準過程需求區分細胞標準上形態構成的近端效應和超細胞標準上形態構成的效能效應”。2024年,我國研討者報道了一種單細胞程度的轉錄因子時序熒光原位雜交技術(TF-seqFISH),研討者應用該技術解析了各種轉錄因子在人脊髓發育過程中的空間表達規律,進而提醒了分歧的神經祖細胞亞型沿背腹軸的空間分布形式,以及在內外軸標的目的上進行的神經發生、分化、遷移及成熟等過程。

這種研討范式的轉變不僅發生在正常的心理過程研討,並且也被用于病理過程的研討。american國立腫瘤研討所(NCI)于2020年啟動了一個名為“人類腫瘤圖譜網絡”(The Human Tumor Atlas Network)的年夜科學研討項目,計劃從分子、細胞、組織器官等分歧層次獲取各種類型腫瘤的數據,并與腫瘤患者的臨床數據進行整合,從而構成多標準的腫瘤圖譜,為腫瘤患者和高危人群進行更好的醫學干預供給科學依據。2023年,芬蘭研討者在一篇論文中報道了應用單細胞轉錄組測序和CRISPR基因編輯技術等方式對人體免疫系統里的“天然殺傷”(NK)細胞與血液癌細胞的彼此感化之研討,提醒出分歧血液癌細胞對NK細胞的敏理性存在顯著差異,並且分歧的癌細胞會惹起NK細胞發生分歧的轉錄組變化。

我國在整合型性命年夜科學研討標的目的最具代表性的是由復旦年夜學研討團隊牽頭的人類表型組國際年夜科學計劃——“國際人類表型組計劃”(Human Phenome Project)。該計劃在2017年立項,現已進進項目實施的“二期”階段,其焦點目標是對人體從分子層面到細胞層面、組織器官層面甚至個體層面對各種人體特征進行緊密測量和剖析。今朝,該計劃已經獲得了4個“全球第一”,包含:研發了“中華家系1號”——全球第一套多組學標準物質;樹立了國際上首個天然人群深度表型組隊列——每個參與者被測量了近2.5萬個表型;繪制了第1張人類表型組導航圖;建成第1個多維度的人類表型組緊密測量平臺。中國科學家與american和歐洲多國科學家組成了國際人類表型組研討協作組(International Human Phenome Consortium),計劃最終將在全球各年夜洲代表性人群中進行5萬人、每人10萬個以上表型指標的全景測量和超過50萬人的特定表型應用示范測量。

綜上所述,以“人類基因組計劃”為代表的性命年夜科學之興起正在改變著性命安康領域的研討“版圖”。今朝,我國科研氣力在國際性命年夜科學領域總體處于“并跑”的地位,在一些研討標的目的上處于“領跑”的地位。為了更好地推進我國性命年夜科學的發展,需求留意加強3個方面的任務:進一個步驟加強和完美有組織的科研之治理機制體制。這類性命組學研討凡是都觸及多個實驗室甚至多個研討單位的參與,國際一起配合項目還要觸及分歧國家的科研氣力;需求發揮好牽頭單位的組織氣力,在課題治理和資源分派及結果共享方面要給予相應的保證。樹立或完美相關的規模化組學研討技術平臺。這些集中了大批先進儀器設備和技術的平臺是支包養網撐規模化組學研討高效實施的基礎。例如,在卵白質組研討領域,新成立的廣州“慧眼”年夜科學設施就是支撐“人體卵白質組導航計劃”實施的需要條件。加強對性命安康科學年夜數據的開放與共享。一方面要保證這些項目執行中產生的組學研討數據和其他相關數據的平安和倫理管理,另一方面也要落實項目內外研討者對相關數據的共享與應用。

(作者:吳家睿,中國科學院分子細胞科學出色創新中間 上海路況年夜學主動安康戰略與發展研討院。《中國科學院院刊》供稿)


留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *