【4.3.5】 qiime2的alpha和beta分析

September 22, 2020 16S 阅读量：次

Alpha和Beta多样性分析

一、介绍

QIIME 2的多样性分析可通过q2-diversity插件获得，该插件支持计算alpha和beta多样性指标，应用相关的统计测试以及生成交互式可视化。我们将首先应用核心指标系统发生方法，该方法将FeatureTable [Frequency]稀疏到用户指定的深度，计算多个alpha和beta多样性指标，并使用Emperor为每个指标生成主坐标分析（PCoA）图、 Beta多样性指标。默认情况下计算的指标是：

Alpha diversity

香农的多样性指数（衡量社区富裕程度的指标） Shannon’s diversity index (a quantitative measure of community richness) Observed Features (a qualitative measure of community richness)
观察到的特征（对社区丰富度的定性度量） Faith’s Phylogenetic Diversity (a qualitiative measure of community richness that incorporates phylogenetic relationships between the features)
Faith的系统发育多样性（一种定性的衡量社区丰富程度的方法，其中纳入了特征之间的系统发育关系）
均匀度（或Pielou的均匀度；衡量社区均匀度的指标） Evenness (or Pielou’s Evenness; a measure of community evenness)

Beta多样性

雅卡德距离（定性度量社区差异） Jaccard distance (a qualitative measure of community dissimilarity)
Bray-Curtis距离（社区差异的定量度量） Bray-Curtis distance (a quantitative measure of community dissimilarity)
未加权的UniFrac距离（结合特征之间的系统发育关系的社区差异的定性度量） unweighted UniFrac distance (a qualitative measure of community dissimilarity that incorporates phylogenetic relationships between the features)
加权UniFrac距离（结合特征之间的系统发育关系的社区差异的定量度量） weighted UniFrac distance (a quantitative measure of community dissimilarity that incorporates phylogenetic relationships between the features)

二、命令行

需要为此脚本提供的一个重要参数是–p-sampling-depth，它是均匀的采样（即稀疏度）深度。因为大多数多样性度量标准对不同样本之间的不同采样深度敏感，所以此脚本将随机地将每个样本的计数子采样到为此参数提供的值。

例如，如果您提供–p-sampling-depth 500，则此步骤将对每个样本中的计数进行二次采样而不进行替换，以便结果表中的每个样本的总数为500。如果任何样本的总数小于此值，这些样本将从多样性分析中删除。

选择此值很棘手。我们建议您通过查看上面创建的table.qzv文件中提供的信息来做出选择。选择一个尽可能高的值（以便每个样本保留更多的序列），同时排除尽可能少的样本。

查看table.qzv，尤其是该可视化文件中的“ Sample Detail”选项卡。对于 –p-sampling-depth，您选择通过什么值？根据此选择，您的分析中将排除多少个样本？您将在 core-metrics-phylogenetic 命令中分析多少个总序列？

比如，我看到样本中，reads数最少的为 17890

qiime diversity core-metrics-phylogenetic --i-phylogeny rooted-tree.qza  --i-table table.qza  --p-sampling-depth 17890  --m-metadata-file sample-metadata.tsv --output-dir core-metrics-results

说明：

rooted-tree.qza 来自进化树分析那一步
table.qza 来自dada2，序列聚类那一步
17890来自，所有样本中样本reads数最小的那个
sample-metadata.tsv 最开始创造的样本数据

在计算了多样性指标之后，我们可以开始在样品元数据的背景下探索样品的微生物组成

分析数据可视化展现

我们将在此进行 Faith Phylogenetic Diversity（衡量社区丰富程度）和evenness指标的操作。

qiime diversity alpha-group-significance --i-alpha-diversity core-metrics-results/faith_pd_vector.qza 	--m-metadata-file sample-metadata.tsv --o-visualization core-metrics-results/faith-pd-group-significance.qzv

qiime diversity alpha-group-significance --i-alpha-diversity core-metrics-results/evenness_vector.qza --m-metadata-file sample-metadata.tsv --o-visualization core-metrics-results/evenness-group-significance.qzv

qzv可以在 https://view.qiime2.org/ 查看

qiime diversity beta-group-significance –i-distance-matrix core-metrics-results/unweighted_unifrac_distance_matrix.qza –m-metadata-file sample-metadata.tsv –m-metadata-column body-site –o-visualization core-metrics-results/unweighted-unifrac-body-site-significance.qzv –p-pairwise

参考资料

https://docs.qiime2.org/2020.6/tutorials/moving-pictures/

药企，独角兽，苏州。团队长期招人，感兴趣的都可以发邮件聊聊：tiehan@sina.cn

个人公众号，比较懒，很少更新，可以在上面提问题，如果回复不及时，可发邮件给我： tiehan@sina.cn