根據(jù)各個樣品在不同分類層級上的相對豐度分析結(jié)果,可以得知一個或多個樣品在各分類水平上的物種組成比例情況,并通過柱形圖來反映樣品在不同分類學(xué)水平上的群落結(jié)構(gòu)及差異。
各樣品間物種組成的大小及差異可以用顏色的變化來直接反映。通過將高豐度和低豐度的物種分塊聚集,可以從顏色梯度上來反映多個樣品在各分類水平上群落組成的相似性和差異性。
PCoA分析,即主坐標(biāo)分析,是一種研究數(shù)據(jù)相似性或差異性的可視化方法,它通過對一系列的特征值和特征向量進(jìn)行排序后,選擇主要排在前幾位的特征值,找到距離矩陣中最主要的坐標(biāo),并將樣品在坐標(biāo)上的位置進(jìn)行可視化展示。
LEfSe分析即LDA Effect Size分析,是一種用于發(fā)現(xiàn)和揭示兩個或兩個以上生物條件下,菌群、代謝產(chǎn)物或其他差異的分析工具。在擴(kuò)增子分析中,它可以從多個分組的數(shù)據(jù)出發(fā),找到組間在豐度上有顯著差異的物種。
機(jī)器學(xué)習(xí)就是一種智能的數(shù)據(jù)挖掘技術(shù),它依據(jù)先驗的知識建立預(yù)測模型來識別大數(shù)據(jù)中的有用信息,而隨機(jī)森林是一種基于決策樹的高效的機(jī)器學(xué)習(xí)算法,可以用于對樣本進(jìn)行分類,也可以用于回歸分析。因此可以挖掘變量之間復(fù)雜的非線性的相互依賴關(guān)系,找出能夠區(qū)分兩組樣本間差異的關(guān)鍵成分(OTU或物種)
用于統(tǒng)計多個樣品中共有或獨有的OTU數(shù)目,可以直觀地表現(xiàn)各樣品之間的OTU?組成相似程度。從OTU豐度表出發(fā),統(tǒng)計各個樣品的獨有OTU數(shù)目,及各個樣品間共有OTU數(shù)目,并進(jìn)行作圖展示。
稀釋曲線是研究樣品內(nèi)的物種組成和預(yù)測樣品中物種豐度的有效工具,在生物多樣性和群落調(diào)查中,被廣泛用于判斷測序量是否充分以及估計物種豐富度。我們采用對序列進(jìn)行隨機(jī)抽樣的方法,以抽到的序列數(shù)與它們所能代表OTU的數(shù)目構(gòu)建了稀釋曲線,通過稀釋曲線不僅可以判斷測序量是否充分,在測序量充分的前提下,運用稀釋曲線還可以對物種豐富度進(jìn)行預(yù)測。
關(guān)聯(lián)分析(correlation analysis),是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。它可以根據(jù)物種豐度以及環(huán)境因子或代謝產(chǎn)物在各樣本中的變化情況,研究物種與物種以及環(huán)境因子與物種之間的相互變化關(guān)系,得到兩兩之間的相關(guān)性。通過網(wǎng)絡(luò)圖,可以形象地展示不同樣本或組之間的物種豐度和環(huán)境因子指標(biāo)情況。此外,還可以通過相關(guān)性網(wǎng)絡(luò)圖,展示相互作用關(guān)系,從而甄別出不同互作類型的物種信息。
樣本聚類分析從各樣品間的距離矩陣出發(fā),通過UPGMA聚類算法,將距離最接近的樣品聚為一類,并將其通過樣品聚類樹進(jìn)行可視化展示,從聚類樹出發(fā),可以用來比較樣品間是否有顯著的微生物菌落差異。
微信公眾號