在生物多样性的研究中,“谱系多样性”(Phylogenetic Diversity,常简称为PD)用来衡量一个生物群落或物种集合在系统发育(演化)层面上的多样性。它不仅考虑到物种数量(物种多度或物种丰富度),还将物种之间的系统发育关系(亲缘远近)纳入衡量范围。下面我将对 PD 及其他相关指标做一个较为详细的介绍。
一、什么是 PD(Phylogenetic Diversity)
最常见的“PD”指标是由 Faith(1992)提出的,被称为 Faith’s Phylogenetic Diversity。它的核心思想是:
- 通过一棵代表这群生物共同祖先及其分化历史的“系统发育树”(phylogenetic tree,或进化树),将目标群落中所有物种所覆盖的分支长度相加,得到整棵子树的总分支长度。
- 这个子树的分支长度之和就代表了该物种集合所拥有的系统发育多样性,也就是 PD 值。
1. 计算方式
对于一个给定的群落(或样方)中有若干物种,构建或获取它们的系统发育树后,找出最小包含这些物种的子树(可理解为最小的闭包子树或最小生成子树),将这棵子树中所有分支(branch)的长度加和,即为 PD 值。形式上可以写作:
PD=i∈branches∑Li
其中 Li 表示第 i 条分支的长度(通常按演化距离计量,可通过分子序列差异、化石校正等方式得到)。
2. 意义
- PD 指标不仅仅是“物种数”的简单累加,而是综合了它们的“亲缘关系”。若一个群落中物种数相同,但其中一个群落的物种在进化树上分散、相对孤立,则它的 PD 值会更高。
- 当我们关注保护优先级时,如果目标是保护进化历史的多样性,那么直接选 PD 值高的物种组合可以在一定程度上“最大化”保护到更多的系统发育历史。
二、其他常见的谱系多样性指标
尽管 Faith’s PD 在研究中非常常用,但学者们也发展了很多其他反映不同生物学意义的谱系多样性指标,这些指标可能在群落结构、物种间相似度、进化分化程度等方面各有侧重。以下列举一些常见的:
-
MPD(Mean Pairwise Distance)平均两两距离
- 定义:对一个群落内所有物种,两两之间计算它们在系统发育树上的距离(通常为进化距离或分支长度总和),然后求这些距离的平均值。
- 解释:MPD 衡量的是群落整体的平均亲缘差异程度。如果 MPD 值高,说明群落中的物种之间平均进化距离大,谱系分化也更多元。
-
MNTD(Mean Nearest Taxon Distance)平均最近类群距离
- 定义:对每个物种,找出在群落里与之最近的亲缘物种(相对最短进化树距离),记录该距离;然后对所有物种的最近距离取平均值。
- 解释:MNTD 更关注“最近相邻”物种之间的差异。如果 MNTD 值高,说明相邻物种之间的距离也较远;若 MNTD 低则代表群落中存在若干对“亲缘关系非常近”的物种。
-
PSV(Phylogenetic Species Variability)
- 概念:PSV 的概念由 Helmus 等人(2007)提出,主要用来刻画群落中系统发育的“冗余”或者说“独立性”,与物种是否紧密聚集或是否均匀散布在谱系树上相关。
- 解释:数值越高,代表在系统发育上,群落中的物种相对独立;越低,则表示群落中物种在谱系上更趋于聚集。
-
PSE(Phylogenetic Species Evenness)
- 概念:在考虑物种丰富度和亲缘分散度的同时,进一步把“群落中物种的丰度(数量或覆盖度)”也纳入计算,以衡量物种在系统发育树上的均匀度。
- 应用:适用于探讨群落构建过程中的竞争、过滤或中性过程等生态学机制。
-
Rao’s Quadratic Entropy(Rao’s Q)
- 定义:Rao’s Q 原本是一个基于物种间距离(可以是功能性状距离,也可以是系统发育距离)的多样性指标,后来也常被用于谱系多样性分析。
- 特点:同时考虑了丰度信息和距离矩阵(无论是功能距离还是谱系距离)。如果把谱系距离当作物种间距离,就能得到一个可以“加权”丰度的谱系多样性指标。
-
UniFrac 指标(Weighted 和 Unweighted UniFrac)
- 领域:该指标在微生物群落多样性分析领域很常见,主要是用分子序列构建菌群进化树,然后比较不同群落之间的差异。
- 原理:基于系统发育树的分支长度,衡量两个或多个群落共同拥有/独有分支长度的占比。
- 区分:Unweighted UniFrac 不考虑丰度只考虑存在/缺失;Weighted UniFrac 则考虑物种(或 OTU)在不同群落中的相对丰度。
- 用途:常被用作“谱系 Beta 多样性”指标,用以评估不同群落之间在系统发育层面的差异。
-
其他衍生或相关指标
- Phylogenetic Endemism (PE):将谱系多样性和物种地理分布信息结合起来,考察在一定地理范围内某些分支独有程度。
- Evolutionary Distinctiveness (ED):关注每个物种在谱系树上的“进化独特性”,分支越长且共享物种越少时,物种独特性越高。
三、这些指标的区别与选择
-
是否考虑物种丰度
- 像最基本的 Faith’s PD、MPD、MNTD 通常只考虑到物种的“在与不在”,并不纳入丰度权重。
- Rao’s Q、Weighted UniFrac 等可以纳入物种(或 OTU)丰度权重,更适合研究实际生态系统中物种数量差异带来的影响。
-
是否关注平均差异 vs. 最近邻差异
- MPD 更偏向整体物种之间的平均差异。
- MNTD 则更强调群落中的最近邻关系。
- 因此在解析群落是否表现“聚集”或“散开”时,MPD 和 MNTD 常常结合使用,通过比较它们的标准化效应值(如 SES.MPD / SES.MNTD)来判断群落构建机制(环境过滤、物种竞争或随机过程等)。
-
是否关注进化树的总体分支 vs. 独特分支
- Faith’s PD 关注的是整个最小生成子树的分支长度总和。
- ED(Evolutionary Distinctiveness)或 PE(Phylogenetic Endemism)更关注一个物种或某些分支的“演化特异性”。
-
在何种尺度上使用
- 有些指标适用于比较“样方内多样性”(Alpha 多样性),如 Faith’s PD、MPD、MNTD 等;
- 有些指标(如 UniFrac)更偏向比较不同样地之间的差异(Beta 多样性),帮助我们理解群落的替代或演化差异。
四、总结
- Faith’s PD(Phylogenetic Diversity)是谱系多样性的经典指标,主要依赖目标物种在系统发育树上覆盖的分支总长度来度量。它能够从进化角度量化“物种集合”所包含的历史信息量。
- 除了 PD 以外,研究中还常用的指标包括 MPD、MNTD、PSV、PSE、Rao’s Q、UniFrac 等。这些指标分别对系统发育距离、最近邻距离、丰度加权、不同样地间差异等方面着重。
- 在具体研究中,应该结合研究目的、数据特点以及假设的生态学或进化学过程,来选择最合适的谱系多样性指标。
如上所述,如果你的目的是保护演化历史或衡量整体系统发育覆盖度,Faith’s PD 是一个非常直观而有代表性的指标;如果你想进一步探究群落构建机制,那就可能要配合 MPD、MNTD(及其标准化值)来判断物种聚集或发散;若你需要比较不同群落在系统发育上的差异(Beta 多样性),则可以使用 UniFrac 或其他合适的距离度量工具。根据具体需要和实验设计,往往需要多指标联合分析,得到对谱系多样性的更全面认识。