1998年,Handelsman首次提出了宏基因組學(或元基因組學,Metagenomics)概念,即運用測序技術,對樣品中的全部微生物的DNA進行研究的技術。后來加利福尼亞大學伯克利分校的研究人員Kevin Chen和Lior Pachter將宏基因組定義為“應用現(xiàn)代基因組學技術,直接研究自然狀態(tài)下的微生物有機群落,而不需要在實驗室中分離單一菌株”的科學。宏基因組學可以從環(huán)境樣品中提取出的全部微生物DNA出發(fā),構建宏基因組文庫,并利用測序技術進行DNA測序,再對測序數(shù)據進行分析,從而全面了解樣品中所包含的全部微生物的組成信息和群落功能。
1.數(shù)據質控:下機的原始數(shù)據(Raw Data)會存在一定比例的低質量數(shù)據,原始數(shù)據都必須進行嚴格質控;
2.宏基因組組裝:基于Clean Data,先進行單個樣本組裝,再將各樣本中未參與到組裝的reads合并進行混合組裝,以此增加低豐度物種的測序深度,獲得更多的物種序列信息;
3.基因預測:基于單樣本和混合組裝的scaftigs,利用MetaGeneMark進行基因預測,對預測得到的所有基因進行去冗余,得到非冗余基因集;再將各樣本的Clean Data 比對到該基因集上,統(tǒng)計獲得基因集在各樣本中的豐度表;
4.物種注釋:基于質控得到的Clean Data,與NCBI 微生物的參考基因組數(shù)據庫進行比對注釋,獲得各樣本在不同分類層級的物種豐度表;
5.功能注釋:基于非冗余基因集,與KEGG數(shù)據庫進行比對注釋,獲得功能豐度表;
6.統(tǒng)計與分析:基于物種和功能豐度表,進行豐度柱狀圖、Krona、Heatmap、樣本聚類分析、PCoA分析、Wilcoxon秩和檢驗分析、LEfSe多元統(tǒng)計分析以及代謝通路比較分析,挖掘樣本(組)之間物種和功能組成的差異;
7.高級分析:基于以上宏基因組標準分析的結果,可選擇進行一系列高級分析,例如NMDS、CCA/RDA、Network、CAG/MGS分析、腸型分析、抗性基因注釋、拷貝數(shù)變異等分析;同時,可以結合宏轉錄組、宏代謝組以及宏蛋白組數(shù)據等進行多組學的關聯(lián)分析。
分析類別 | 分析內容 | |
基因統(tǒng)計與分析 | 樣本間基因分布Venn圖 | 組間基因數(shù)目差異分析 |
樣本基因α多樣性分析 | ||
微生物群落分析 | 樣品菌落組成柱狀圖 | 樣品間相似性指數(shù)
PCoA分析 樣品聚類分析 LEfSe分析 Wilcoxon秩和檢驗分析 |
物種分布Krona圖 | ||
樣本主要物種分布比較 | ||
Heatmap圖 | ||
代謝通路分析(基于KEGG數(shù)據庫) | 樣品代謝功能組成柱狀圖 | |
Heatmap圖 | ||
樣品代謝通路分析 | ||
不同樣品代謝通路比較分析 | ||
碳水化合物酶分析(基于CAZy數(shù)據庫) | 樣品碳水化合物酶組成柱狀圖 | |
Heatmap圖 | ||
功能組成分析(基于eggNOG數(shù)據庫) | 樣品功能組成柱狀圖 | |
Heatmap圖 | ||
高級分析菜單 | RDA/CCA 分析 | 腸型分析 |
Network分析 | CAG/MGS分析 | |
單菌Binning組裝 | 抗性基因注釋 | |
拷貝數(shù)變異分析 |
微信公眾號