海洋浮游植物不仅是海洋食物网的基石,还在地球气候调节和碳循环中发挥着关键作用,对于维持全球生态系统的稳定至关重要。为更深入地探索浮游植物在生态功能、资源利用方式及环境适应性方面的差异,研究人员将其划分为不同的浮游植物功能类型(Phytoplankton Functional Type, PFT)。全球大尺度、长时序、高精度的PFT数据是研究海洋生态系统及其对气候变化响应的核心基础。然而,现有数据产品在反演精度、时空分辨率、空间覆盖率和时间跨度等方面仍面临重大挑战,制约了对海洋浮游植物的时空分布及其气候响应变化趋势的全面分析与研究。
为填补这一研究空白,河口海岸学国家重点实验室沈芳研究员团队将AI技术与多源海洋大数据相结合,创新性地提出了一种基于深度学习的时空生态集成模型(Spatio-Temporal Ecological Ensemble based on Deep Learning,STEE-DL),进而成功开发了领域内首套全球长时序(1998-2023)逐日无缝4公里浮游植物功能群浓度数据产品(AI-driven Global Daily gap-free 4 km PFT product, AIGD-PFT),显著提升了对8种主要浮游植物功能群的反演精度和时空覆盖率。该研究成果以“AIGD-PFT: the first AI-driven global daily gap-free 4 km phytoplankton functional type data product from 1998 to 2023”为题,在线发表于《Earth System Science Data》期刊,全文可访问:https://doi.org/10.5194/essd-16-4793-2024。论文第一作者为博士生张远,通讯作者为沈芳研究员。AIGD-PFT数据产品现已向全球开放,获取链接:https://doi.org/10.11888/RemoteSen.tpdc.301164。
图 1 论文首页
浮游植物类群的组成和分布受众多环境因素的影响,例如光热条件、营养物供应、水动力环境等。本研究将浮游植物类群反演视为多元非线性映射问题,通过引入多源环境预测因子,包括水色参数、生物地球化学参数、物理海洋参数和时空信息等参数,来克服单一生物光学算法的局限性。
图 2 使用到的多源环境预测因子
在2023年研究的基础上(参见https://doi.org/10.1016/j.rse.2023.113596),团队首先进一步扩展汇编了全球原位HPLC数据集,增加了原位观测数据的可用数量;随后,采用离散余弦变换-惩罚最小二乘法(DCT-PLS)来进行OC-CCI水色遥感产品的缺失重建,并整合多源海洋环境因子作为驱动数据;最后,进一步构建了基于深度集成学习的STEE-DL模型,从而生成了1998年至2023年8种PFT浓度的逐日数据产品。
图 3 研究总体技术路线
AIGD-PFT数据产品发布为分析浮游植物群落的时空动态提供了重要工具,有望对揭示浮游植物组成对气候变化的响应机制研究提供支持。此外,该数据产品还可促进海洋碳通量的精确量化,提高生物地球化学模型的预测精度,为未来的气候变化与海洋科学研究提供有力支持。该产品动态视频演示可参见https://doi.org/10.5446/67366。
图 4 8种浮游植物类群全球反演示意图