APP下载

基于MaxEnt模型的小黄花茶在中国的适生区域研究

2021-04-08代玉烜徐海霞

关键词:小黄花物种因子

代玉烜, 金 瑭, 徐海霞, 王 东, 王 丽

(四川大学生命科学学院, 成都 610065)

1 引 言

小黄花茶(CamelliaLuteofloraY. K. Li),山茶科(Theaceae)山茶属(Camellia)灌木或小乔木,是山茶属小黄花茶组的唯一种.1981年首次在贵州赤水发现小黄花茶[1],据统计,当地仅有1 700余株[2-3].2013年长宁环保局科考人员在四川长宁自然保护区发现了至少几十株小黄花茶和至少两处小黄花茶的生长地[4].2015年陈锋课题组在四川古蔺县桂花乡发现了小黄花茶的存在,该物种在四川的新发现为进一步的研究提供了基础资料[5].经过研究者野外踏查及长宁林竹局涂为熙等科考人员统计,目前发现小黄花茶数量约为泸州古蔺1 200株、宜宾长宁800株.

1983年国家科委明令将小黄花茶作为我国禁止外流的特殊保护物种[2];1988年小黄花茶被列为贵州省一级珍稀濒危保护植物[3];2013年在《中国生物多样性红色名录一高等植物卷》中,其濒危等级评定为易危;IUCN(名)收录时,濒危等级为VU,为我国特有种(环境保护部和中国科学院,2013)[6].小黄花茶在形态、结构上的特殊性决定了其在遗传育种、系统发育、种质资源等方向的科研价值,以及在庭园绿化、园艺观赏、生态建设等方面的经济价值.但小黄花茶开花不多,结果较少,种子易受虫害鸟食、自然生长较慢、移栽成活率低,加之近年来随着人为砍伐和过度采食加剧了其群落的破碎化等,导致了小黄花茶目前处在濒危之境.

在如今的气候变化背景下,对珍稀濒危植物的生物多样性保护最重要的在于进行就地保护,利用原生生态环境使被保护的生物能够更好地生存,以保证生物遗传繁育的完整性.近年来物种分布模型在生物多样性保护的多方面得到应用,如物种环境生态位的量化、未来环境气候变化对物种分布的影响、自然保护区的选择、传染病的空间传播、生物质能源开发、入侵物种扩散及其适生区的问题等研究[7-10].其中MaxEnt生态位模型只需要基于物种存在数据和整个研究区域的环境信息,则能够分析统计后预测出物种的潜在生境[11-12],样本量少、精确度高、操作简明是其优势.而ArcGIS10.2不仅能简便地进行参数地输入,还能形象化地输出结果,显示规律[13].

小黄花茶被发现以来,引起了国内外科研人员和国际组织的高度重视.国内众多学者对其进行了繁殖技术、种群结构、分布格局、生理生化特性等多方面的研究[14],但对其适生区的预测研究、气候变化的影响研究等尚未有报道.本文基于贵州省、四川省小黄花茶的野生生境调查研究、标本记录和各环境变量,运用MaxEnt生态位模型和ArcGIS相结合预测其潜在的适生区,对该树种的繁育保护有实际指导意义.

2 材料与方法

2.1 小黄花茶分布点数据

小黄花茶的分布点数据来源于资料搜集和野外调查.(一)通过查阅国内外公开发表的相关文献、中国植物图像库(PPBC, http://ppbc.iplant.cn/)、中国国家标本资源平台(NSII, http://nsii.org.cn/2017/home.php)等找出已报道的分布地点;(二)查阅有关报道以及政府网站的新闻消息;(三)同时利用野外调查数据补充分布点.目前小黄花茶已知分布点共计20个,通过Google Earth校正,识别并删除重复点,从而保持1 km×1 km范围内的一个点,以避免采样偏差[15].将有效点按照MaxEnt软件要求的格式录入到Excel表中,添加为XY数据,保存为*.csv格式.

2.2 方 法

2.2.1 环境数据来源及预处理 (一)从WorldClim网站(http://www.worldclim.org/)下载30 s(约1 km)空间分辨率的生物气候因子19个(Bio1~Bio19).(二)坡度和坡向、海拔数据从地理空间数据云(http://www.gscloud.cn/)下载的数字高程模型(DEM)通过ArcGIS软件利用空间分析工具获得.(三)将从国家基础地理信息系统(http://nfgis.nsdi.gov.cn/)中下载的1∶400万中国矢量地图作为分析底图,并进行相对应的环境图层的剪裁提取[16].

考虑到物种分布模型的一个问题是由于变量之间的多重共线性而导致模型过度拟合[17],会影响对于响应关系、贡献率的评判[18].故在SPSS22.0软件中先进行标准化处理,然后进行斯皮尔曼相关性分析,比较所使用的22种环境因子之间的相关性,选择相关系数<0.75的变量.而生态极限往往和植物的实际分布相关.小黄花茶贵州分布地属于中亚热带温和湿润气候,海拔在700~1 060 m高处,其植株常生在坡度较陡的崖壁上、灌丛中及沟谷两旁的密林内,多分布于杂木林和竹林中,喜温暖潮湿[5].结合植物生存环境需求及其生理特性,在相关系数>0.75的变量中保留最重要的生态因子[17].筛选环境变量后通过ArcGIS将获得的气候、地形数据.tif格式,转换为MaxEnt模型运行所需的*.asc格式[11],建立面文件对环境数据进行掩膜处理,使模拟结果的实用性更高.

2.2.2 模型预测及数据处理 将小黄花茶的有效分布点数据和主要环境变量数据集同时导入MaxEnt模型中,将测试子集设置为分布点数据的25%,训练子集为数据的75%.以线性二次抽样、铰链功能的方式进行10次重复运算,其余参数设置为默认值,算法在160次迭代(1 s)后收敛,运行计算物种的适生区.

采用刀切法(Jackknife)检验环境因子贡献权重,设置受试者特征曲线(ROC,Receiver operating characteristic curve),以假阳性率即1-特异性为横坐标,代表佣金误差;以真阳性率即灵敏度为纵坐标,表示没有遗漏误差.用筛选的所有主要变量建立模型(红色条带表示);单独用每一个变量建立模型(宝蓝色条带表示);每次排除依次排除一个变量,用剩余的变量建立模型(青蓝色条带表示),观察条带之间的变化.当蓝色条带越长代表增益值越高,说明该变量对物种分布贡献越大;当青蓝色条带降低较多,则代表该变量可能含有较多信息,对物种分布较为重要;红色条带表示所有环境变量对建模的累积贡献率[19].ROC曲线是通过绘制所有可能阈值的x轴上的1-特异性和y轴上的灵敏度而成的[12].其曲线下面积(AUC,Area under the ROC curve)的大小作为评价模型运算结果精准度的指标[20-21].AUC值在0.5~1,一般来说, 0.5≤AUC<0.6为差,0.6≤AUC<0.7为较差, 0.7≤AUC<0.8为一般,0.8≤AUC<0.9为好,0.9≤AUC<1.0为非常好[18,22].

运行ArcGIS软件处理预测结果,将适生分布信息按自然简单分级法显示[23].将分析结果导入软件中,依据Maxent模型最大约登指数及自然间断点对其进行重分类,得到小黄花茶生境适宜性评价图,在布局视图中点击插入对应的比例尺、图例、指北针,完善分布图,最后运用ArcMap软件空间分析模块工具提取各潜在适生区的面积[24].

3 结果与分析

3.1 MaxEnt模型精度评估和变量分析

经过校正,本研究最终运用于生态位模型运算的小黄花茶有效分布点共15个(图1),数据导入后形成表1.图2显示了22种环境因子之间的相关性,环境数据处理最终结果仅保留了8个因子(表2),其中降水量因子占据3个,气温因子占据2个,这表明与气候变化相关的气候不稳定性和干旱压力的增加将是当地物种损失的主要决定因素.在模型预测中,使用14个分布点记录用于训练,1个记录用于测试.预测结果如图3a,显示小黄花茶适生区分布最大熵模型运算的10组训练集(cha)AUC均值为0.947,测试集的均值为0.953,表示了实验数据可信度高.图3b显示了本研究运算结果中ROC预测精度数值最大的1组(cha_7),训练子集AUC、预测子集AUC分别为0.947和0.997,非常接近1,根据Swets提出的模型评价标准[25-26],表明该模型对其适生区的预测精度高,为优级. cha_7可作为分析对象.

刀切法(Do Jackknife)检验结果估算了环境变量对MaxEnt模型的相对贡献(表2),最热季平均气温(Bio10)贡献率最高(51.1%),其次是最热季降水量(Bio18)(23.6%)、最冷季降水量(Bio19)(16.1%);而坡度、最湿月降水量(Bio13)、坡向、海拔(Dem)、最热月最高气温(Bio5)的贡献率分别为4.7%、1.9%、1.1%、0.9%、0.3%,累计仅达8.9%,表明了它们本身对小黄花茶分布没有占据很大的影响.上述环境因子中降水因子占有3个,地形因子占3个,温度因子占1个,这与已知研究的该树种实际分布情况(喜分布于地势较低、地形闭塞、温湿度较高的特殊生境[27-29])是一致的.这8个环境因子在模型构建过程中起主要作用,也是影响小黄花茶潜在分布最重要的生态因子.

图4是可变重要性的折刀测试的结果,显示了8个环境变量对MaxEnt模型预测结果的影响.当单独使用变量时,重要性最大的环境变量为最热季降水量(Bio18),训练增益超过1.0;其次是最热季平均气温(Bio10)、最冷季降水量(Bio19)以及最湿月降水量(Bio13)对模型影响较高,训练增益超过0.6.结果显示,环境温湿度是影响小黄花茶的潜在适生区分布的重要因素,而夏季最高温及坡度是小黄花茶发育发展的主要制约因子.这与目前所发现的小黄花茶生长环境相符合.

图1 小黄花茶样点分布图Fig.1 Distribution points of Camellia Luteoflora

图2 22个环境因子间的Spearman相关分析Fig.2 Spearman Correlation results among 22 environmental factors

表1 小黄花茶15个分布点的地理数据

表2 8个环境变量对MaxEnt模型的贡献率和训练集增益

图3 模型检验AUC值

图4 基于AUC的Jackknife法环境变量重要性测试图

3.2 小黄花茶潜在适生区分析

借助ArcGIS处理,小黄花茶的适生区预测图可按4个等级进行划分,分级标准如下:<0.08为非适生区,0.08~0.27为低适生区,0.27~0.54为中适生区,>0.54为高适生区.从图5可知,小黄花茶在当前气候条件下预测的潜在适生区与现已知的实际生长地大致相符,可能存在尚未发现的生长区.图中浅米色区域表示非适生区,绿色区域表示低适生区,黄色区域表示较适生区,红色区域代表高适生区.小黄花茶适生区主要处于中国西南方103°E~109°E,25°N~30°N的地区,四川泸州、宜宾,贵州遵义、仁怀、赤水,云南昭通、昆明以及重庆江津、綦江是其高度适生区,黔、川、渝交界处是小黄花茶的核心分布地.除此之外,预测显示在贵州毕节、铜仁、黔东南苗族侗族自治州,四川自贡、广安,云南曲靖、玉溪,重庆西部及北部有零星低适生区.

提取适生区面积结果显示(表3),小黄花茶在中国的总适生区面积约为21 371 km2,占我国陆地总面积的0.222%.其中高、中、低适生区的面积占比分别为0.028%、0.068%和0.126%,而非适生区面积占比高达99.778%.

表3 小黄花茶潜在适生区面积统计

3.3 适生地理分布与变量的关系

模型用响应曲线图(图6)展示了每个环境变量是如何影响MaxEnt预测的,该图横坐标为对应环境因子的数值,纵坐标即为分布概率.曲线反映了预测的分布适宜性对单一变量的依赖性,曲线变化可以为对应物种提供最佳生长所需环境阈值的有用信息[30-31].一般认为,当分布概率>0.50时,对应的环境因子值适合物种的生长.

当最热月最高气温(Bio5)(图6a)处于<4.5 ℃时,小黄花茶分布概率极低;随着最高气温的上升,分布概率逐渐增大;达到27.5 ℃时,小黄花茶分布概率到达顶峰.即在最热月时最高气温达到27.5 ℃时,小黄花茶的最适生长温度到达.而最热季平均气温(Bio10)(图6b)的阈值范围为11.1~18.0 ℃,最适阈值低于14.5 ℃,当气温高于25 ℃植物分布概率趋近于0.

最湿月降水量(Bio13)在290~360 mm时,小黄花茶的分布概率到达峰值(图6c).以分布概率>0.50为适宜范围,最湿月降水量为290~500 mm,此降雨区间小黄花茶生长较好.当最湿月降水量>700 mm后,小黄花茶分布概率几乎为零.湿度过大可能更容易造成植物病虫害,反而不利于小黄花茶的生长.最热季降水量(Bio18)(图6d)的阈值为4.4~6.6 mm,8.5 mm以上的最热季降水量将会影响植物的生长.最冷季降水量(Bio19)(图6e)适合目标物种生长的阈值为16.7~24.8 mm.

小黄花茶在海拔450~1 000 m的区域中分布概率较高(图6f),在此区间之后呈现出海拔越高分布概率越低的趋势,且小黄花茶不分布于海拔>4 000 m的地方.海拔愈高,温度愈低、湿度增加、光照增强、土壤含量变化,对小黄花茶的生长和分布产生了负影响.在坡向为-40°~190°范围内小黄花茶的分布概率>0.50,说明小黄花茶喜爱分布于阴坡和半阴坡以及小部分的阳坡(图6g).当坡度>20°时,小黄花茶具有较高的分布概率(>0.50),随着坡度的增加其分布概率也在增大,在坡度达到64°时,小黄花茶的分布概率到其极限值(图6h),可能是过于陡峭的斜坡土壤含水量流失较快,小黄花茶无法汲取充足水分生长,其选择分布在更适宜生长的生态带.

图5 基于MaxEnt模型小黄花茶适生分布预测

4 讨 论

4.1 小黄花茶潜在适生区分布

小黄花茶目前的分布面积较为狭小,其植株生长缓慢、病虫害严重、种子自然萌发率低,加之人为干扰迫害加剧,小黄花茶数量呈现下降趋势.小黄花茶在1983年被我国列为珍稀濒危保护物种,世界自然基金会(WWF)在2003—2004年将贵州赤水小黄花茶的保护和发展纳入基金会在中国的物种保护资助项目内,2013年小黄花茶濒危等级评定为易危,目前国家和国际组织对小黄花茶的保护高度重视[7,32].物种适生区分布的精准预测对于物种的推广和引种极其重要[33],在明确其目前已知的野外生存现状下,对其潜在的适生分布区进行预测十分重要.

在本次模拟中,虽然我们能够测试的物种数量分布点少于20个,但一些研究同样使用低样本量成功模拟了物种潜在分布,证明我们在样本量小的情况下使用Maxent是可行的.例如Deb等人对一种稀有兰花(VandabicolorGriff.)仅使用了4个发生点来开发小样本分布预测模型[15];Ortega-Huerta等对样本量只有2~20的11种鸟类和其地区环境条件的数据运用不同的模型预测了物种分布[34];Pearson等对马达加斯加特有的样本大小为4~23个的13种壁虎(Uroplatusspp.)建立模型,并对其进行评估[35];Adhikari等人对印度东北部一种极度濒危的大叶冬青树种进行再引种生境分布模拟,其样本量为16个[36];Groff等利用17个已验证的位置开发了生态位模型,以评估俄勒冈州斑点蛙(Ranapretiosa)在加利福尼亚州的存在情况[37];Hernandez等人的研究表明当样本量小到5、10和25个时,四种建模方法(Bioclim、Domain、GARP和Maxent)中,Maxent是最有能力产生有用结果的[38].本次MaxEnt模型预测结果的高精确度证明了在样本量小的情况下预测小黄花茶分布是可信的.

适生区预测结果显示,小黄花茶主要适生于黔、川、渝及滇部分区域,这些区域主要位于长江流域一带,气候、土壤条件适宜,适合喜湿喜荫的小黄花茶生长.这与目前所报道的小黄花茶发现地四川泸州古蔺、宜宾长宁竹海自然保护区、贵州赤水自然保护区相吻合,根据试验者实地调查亦得知,泸州叙永、贵州贵阳等地均有小黄花茶生长.

4.2 小黄花茶生态因子特征

刀切图显示了影响小黄花茶分布的环境因子中贡献率前三分别为Bio10、Bio18、Bio19,重要性最大的环境变量为Bio18,其次是Bio10、Bio19、Bio13对模型影响较高.可以看出,最热季的平均气温和降水量以及最冷季降水量是影响小黄花茶生长分布最重要的环境因子,这与野外调查的小黄花茶多生长于杂林中、沟谷内、崖边、溪水旁的生长地环境相符合,其喜爱温暖湿润,充沛的降水和湿润的环境利于其生长.刀切法的分析结果认为平均温度和降水是影响小黄花茶分布的关键要素,最热季平均温度与小黄花茶分布密切相关,降水量过低或过高均不利于其分布,说明降水和温度共同决定了其分布区气候类型.

主要环境因子响应图显示了小黄花茶的生态适宜带为最热月最高气温为22.5~27.5 ℃,最热季平均气温为11.1~18.0 ℃,最湿月降水量为290~500 mm,最热季降水量为4.4~6.6 mm,最冷季降水量为16.7~24.8 mm,海拔为450~1 000 m,坡向在-40°~190°范围内,20°<坡度<64°.植物对生态环境的选择策略不同,并对其有一定的耐受度,不在度区间时植物的生存则会受到影响.因此在明确了小黄花茶分布的限制环境因子后,可以对其展开生态修复.

本研究基于MaxEnt模型对小黄花茶的潜在适生区进行了预测分析.MaxEnt模型对于物种适生区分布预测的准确度,主要是基于统计或理论推导的响应面,将野外观测与环境预测变量联系起来的经验模型,其由提供给模型的物种实际分布数据和环境变量数据决定[32,39].

在实际分布数据方面,因小黄花茶分布的地域性以及环境特殊性,其样本分布点数据量很少,预测结果可能存在一定误差.根据前人的研究,当数据集过小时可以选择两种方法降低对预测结果的影响:(1)不划分训练和测试子集时,因为每个位置都可能提供唯一的、有价值的信息,即先从数据集中删除每个局部性一次,并用剩余的局部性生成一个模型,然后在设定为10%的固定阈值下进行评估,最后使用P-Value Compute程序以测试模型预测是否优于排除地点的随机分配[35];(2)划分训练和测试子集时,对具有10%训练存在的阈值规则的物种进行数次重复的模型运行,采用交叉验证技术将样本划分为重复折叠,并将所有其他参数用作测试数据,构造出一个可行的模型[15,36].本研究采用了划分训练子集和测试子集的方式,尚未在设定为10%的固定阈值下进行评估,可能存在预测范围有误差.但是小样本量开发的模型应该被解释为识别与已知物种出现的环境条件相似的区域,而不是预测物种范围的实际限制,因此本研究尚具有一定的区域参考价值.当然在后续的研究中,我们将进行多方面的建模,以获得更高、更显著的成功率.在环境变量方面,本文仅仅考虑了气候及地形因子,而没有考虑土壤类型、水分、植被、植物天敌等环境因素以及由自然或人为引起的外界扰动对其分布的影响,存在一定的局限性和模型预测结果的不确定性.如能综合所有因素,预测结果将会更加准确.同时,在环境变量的筛选时,可以采用MaxEnt模型将生态环境因子数据多次计算,每次舍去贡献率为0的生态因子,最终联系刀切法选择出贡献率在5%以上的环境因子作为最终环境变量组来减小对植物生境适宜性预测的影响[40].

在研究区域方面,本研究以四川省、湖北省、重庆市、湖南省、云南省、贵州省、广西壮族自治区等七省(自治区、直辖市)为研究对象,空间尺度适中、精度有待提高,并且仅在小黄花茶已知的现存分布区域内进行预测与评估,可以考虑在更小范围区域展开更加精细的研究.从预测区域大小来看,在较小的区域内Maxent模型能够给出显著的预测结果, 而当小样本数据用于更大的区域的预测时,预测模型即变得不稳定[36],因此应该在较小面积上使用小样本量来开发模型以降低对预测结果的影响.在下一步的研究中或可以收集更多与植物分布相关的自然、人为因素添加到模拟模型中,以提高预测精度,为小黄花茶的资源保护与开发利用提供更有效的参考信息,并为其他繁育研究、工作等提供科学依据.同时我们也将采集更多的物种分布信息以提高预测精确度.

在未来的研究中,我们也会预测其对于未来环境气候条件变化的响应,以此更好地了解植物对生长环境因子的需求以及其对环境变化做出的应对机制[41].同时考虑从生态位角度探讨珍稀濒危植物的濒危机制、种间竞争及群落共存特征,为针对性地制定珍稀濒危物种保护措施提供有利信息[42].同时我们将开展地面调查工作,通过地面试验评估模型的预测能力.

MaxEnt模型根据气候、地形因子与小黄花茶之间的关系,找出其分布规律的最大熵,评估了影响植物生长分布的主导环境因子,预测了其潜在适生区,这对于指导植物的野生资源保护、繁育引种、开发利用等具有重要意义.小黄花茶作为中国特有植物,在我国分布范围也相当狭窄,而了解其适生区范围、适生环境阈值对发挥其高经济价值、高科研价值具有重要意义.

猜你喜欢

小黄花物种因子
板凳狗和他的一朵小黄花
迎春花开
池塘边上的小黄花
回首2018,这些新物种值得关注
山药被称“长寿因子”
电咖再造新物种
直径不超过2的无爪图的2—因子
巧解难题二则
世界上的15个最不可思议的新物种
疯狂的外来入侵物种