【4.3.5】 qiime2的alpha和beta分析

Alpha和Beta多样性分析

一、介绍

QIIME 2的多样性分析可通过q2-diversity插件获得,该插件支持计算alpha和beta多样性指标,应用相关的统计测试以及生成交互式可视化。我们将首先应用核心指标系统发生方法,该方法将FeatureTable [Frequency]稀疏到用户指定的深度,计算多个alpha和beta多样性指标,并使用Emperor为每个指标生成主坐标分析(PCoA)图、 Beta多样性指标。默认情况下计算的指标是:

Alpha diversity

  • 香农的多样性指数(衡量社区富裕程度的指标) Shannon’s diversity index (a quantitative measure of community richness) Observed Features (a qualitative measure of community richness)
  • 观察到的特征(对社区丰富度的定性度量) Faith’s Phylogenetic Diversity (a qualitiative measure of community richness that incorporates phylogenetic relationships between the features)
  • Faith的系统发育多样性(一种定性的衡量社区丰富程度的方法,其中纳入了特征之间的系统发育关系)
  • 均匀度(或Pielou的均匀度;衡量社区均匀度的指标) Evenness (or Pielou’s Evenness; a measure of community evenness)

Beta多样性

  • 雅卡德距离(定性度量社区差异) Jaccard distance (a qualitative measure of community dissimilarity)
  • Bray-Curtis距离(社区差异的定量度量) Bray-Curtis distance (a quantitative measure of community dissimilarity)
  • 未加权的UniFrac距离(结合特征之间的系统发育关系的社区差异的定性度量) unweighted UniFrac distance (a qualitative measure of community dissimilarity that incorporates phylogenetic relationships between the features)
  • 加权UniFrac距离(结合特征之间的系统发育关系的社区差异的定量度量) weighted UniFrac distance (a quantitative measure of community dissimilarity that incorporates phylogenetic relationships between the features)

二、命令行

需要为此脚本提供的一个重要参数是–p-sampling-depth,它是均匀的采样(即稀疏度)深度。 因为大多数多样性度量标准对不同样本之间的不同采样深度敏感,所以此脚本将随机地将每个样本的计数子采样到为此参数提供的值。

例如,如果您提供–p-sampling-depth 500,则此步骤将对每个样本中的计数进行二次采样而不进行替换,以便结果表中的每个样本的总数为500。如果任何样本的总数小于此值,这些样本将从多样性分析中删除。

选择此值很棘手。 我们建议您通过查看上面创建的table.qzv文件中提供的信息来做出选择。 选择一个尽可能高的值(以便每个样本保留更多的序列),同时排除尽可能少的样本。

查看table.qzv,尤其是该可视化文件中的“ Sample Detail”选项卡。 对于 –p-sampling-depth,您选择通过什么值? 根据此选择,您的分析中将排除多少个样本? 您将在 core-metrics-phylogenetic 命令中分析多少个总序列?

比如,我看到样本中,reads数最少的为 17890

qiime diversity core-metrics-phylogenetic --i-phylogeny rooted-tree.qza  --i-table table.qza  --p-sampling-depth 17890  --m-metadata-file sample-metadata.tsv --output-dir core-metrics-results

说明:

  • rooted-tree.qza 来自进化树分析那一步
  • table.qza 来自dada2,序列聚类那一步
  • 17890来自,所有样本中样本reads数最小的那个
  • sample-metadata.tsv 最开始创造的样本数据

在计算了多样性指标之后,我们可以开始在样品元数据的背景下探索样品的微生物组成

分析数据可视化展现

我们将在此进行 Faith Phylogenetic Diversity(衡量社区丰富程度)和evenness指标的操作。

qiime diversity alpha-group-significance --i-alpha-diversity core-metrics-results/faith_pd_vector.qza 	--m-metadata-file sample-metadata.tsv --o-visualization core-metrics-results/faith-pd-group-significance.qzv

qiime diversity alpha-group-significance --i-alpha-diversity core-metrics-results/evenness_vector.qza --m-metadata-file sample-metadata.tsv --o-visualization core-metrics-results/evenness-group-significance.qzv

qzv可以在 https://view.qiime2.org/ 查看

qiime diversity beta-group-significance –i-distance-matrix core-metrics-results/unweighted_unifrac_distance_matrix.qza –m-metadata-file sample-metadata.tsv –m-metadata-column body-site –o-visualization core-metrics-results/unweighted-unifrac-body-site-significance.qzv –p-pairwise

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn