OPTIMIZATION OF BP NEURAL NETWORK FOR CHLOROPHYLL-A CONCENTRATION INVERSION BASED ON SPARROW SEARCH ALGORITHM: A CASE STUDY OF XIAOJIANG
-
摘要:
针对传统反向传播(Back Propagation, BP)神经网络在叶绿素a浓度反演中对初始值敏感、容易陷入局部最优的问题, 文章提出基于麻雀搜索算法(Sparrow Search Algorithm, SSA)优化SSA-BP反演模型。结合大疆RTK300无人机搭载AFX-10高光谱相机的遥感数据与小江回水区同步地面采样数据, 构建新型反演模型。结果显示: (1)Savitzky-Golay(SG)平滑显著优化光谱数据质量, 使SSA-BP模型决定系数(R2)提升至0.98; (2)相较于传统BP神经网络, SSA-BP模型反演精度全面提升, 其中渠马水域平均绝对误差(MAE)降低了59.14%, 均方根误差(RMSEP)降低了60.78%, 相对百分比差异(RPD)提高了57.32%; (3)SSA-BP模型克服了传统BP模型在低浓度区域(R2从0.94降至0.76)的性能衰减, 在不同叶绿素a浓度梯度下均保持稳定高精度, R2最高达到0.98。研究证实SSA-BP模型显著提升无人机高光谱遥感反演叶绿素a的精度与适应性, 为内陆水体生态环境监测提供可靠技术手段。
Abstract:Chlorophyll-a concentration is a crucial parameter characterizing water ecological environment quality. To address the issues of traditional Back Propagation (BP) neural networks, which are highly sensitive to initial values and tendency to local optima in chlorophyll-a inversion, this study proposes an SSA-BP inversion model optimized by using the Sparrow Search Algorithm (SSA). A novel inversion model was constructed by integrating remote sensing data from the DJI RTK300 UAV equipped with an AFX-10hyperspectral camera and synchronous ground sampling data from the Xiaojiang backwater area. The results demonstrate that: (1) The application of Savitzky-Golay (SG) smoothing significantly improved spectral data quality, increasing the determination coefficient (R2) of the SSA-BP model to 0.98; (2) Compared with traditional BP neural networks, the SSA-BP model showed comprehensive improvement in inversion accuracy, with the Quma water area exhibiting a 59.14% reduction in Mean Absolute Error (MAE), 60.78% decrease in Root Mean Square Error of Prediction (RMSEP), and 57.32% increase in Relative Percent Difference (RPD); (3) The SSA-BP model overcame the performance degradation of traditional BP models in low-concentration regions (where R2 decreased from 0.94 to 0.76), maintaining stable high precision across different chlorophyll-a concentration gradients, with the highest R2 reaching 0.98. This research confirms that the SSA-BP model significantly enhances the accuracy and adaptability of UAV hyperspectral remote sensing in chlorophyll-a inversion, providing a reliable technical approach for ecological environment monitoring in inland water bodies.
-
叶绿素a浓度是水体藻类生物量的重要指标, 与水体生态环境状况密切相关[1, 2], 对其调查监测十分必要。传统叶绿素a浓度监测方法通常依赖于现场采样和实验室分析[3], 方法耗时长、成本高, 且数据仅能反映具体样点情况。遥感技术因其速度快、成本低、大面积观测、实时同步、可获取大尺度的区域信息等优点, 近年来广泛应用于水体叶绿素a浓度监测中[4—6]。叶绿素a遥感反演卫星数据源主要包括Landsat系列: Landsat-5[7]、Landsat8[8]; 哨兵系列: Sentinel-2[9]、Sentinel-3A[10]; GF系列: GF-1[11]、GF-2[12]; 资源环境卫星系列: HJ-1A卫星[13]、HJ-1B卫星[14]、MODIS[15]、资源一号[16]、珠海一号[17]等。由于星载高光谱数据存在空间分辨率较低, 拍摄范围不能完全覆盖研究区域, 且有云雾遮挡造成可利用的遥感图像少。相比之下, 基于无人机遥感技术具有机动灵活、覆盖范围广、数据获取快速等特点和优势, 有学者利用Landsat-5 TM多光谱遥感图像与水质参数建立回归模型, 证实了多光谱遥感技术对于水质监测的可行性[18]。但多光谱数据的波段较宽, 难以精确捕捉湖泊中更多的光谱信息特征, 反演精度受限; 高光谱遥感技术在反演水质参数方面提供更高光谱分辨率, 能够精确捕捉水体中特定成分的光谱特征, 其连续窄波段成像能力增强了对水质参数的识别和定量分析, 提高了反演精度。此外, 高光谱数据减少了光谱混淆, 提升了水质监测的准确性和可靠性[19—22]。冯翠杰等[23]以城市水域为研究对象、无人机高光谱数据为数据源, 建立了水体叶绿素a浓度、氨氮和磷酸盐3种水质指标的反演模型, 马启良等[24]利用无人机高光谱对养殖水体进行水质参数反演, 这些结果为高光谱的进一步应用提供了参考, 但高光谱在水体叶绿素a反演中的应用仍需要更多的研究工作。
在反演模型方面, 传统方法主要是基于数学统计方法分析光谱辐射数据和叶绿素a浓度之间的相关关系。然而, 大洋与内陆水体因光学特性差异显著, 需采用不同的模型策略: 大洋水体的适用模型, 大洋水体光学特性相对均一, 悬浮颗粒物和有色溶解有机物(CDOM)浓度较低, 光谱信号受叶绿素主导。单波段与波段比值模型: Rundquist等[25]提出的一阶微分模型通过单波段(如690 nm附近)反射率变化建立叶绿素a浓度函数关系, 这种单波段模型建立简单但反演精度有限。Gordon等[26]首先提出了蓝-绿波段比值模型利用叶绿素在蓝波段的吸收特性与绿波段的反射特性, 成为大洋叶绿素反演的主流方法。此类模型在大洋中表现良好(R2可达0.8以上), 但对复杂水体适应性不足。半解析算法: 基于辐射传输理论的OC系列算法(如OC3、OC4)通过多波段组合优化, 显著提升了大洋叶绿素反演精度; 但在内陆水体光学复杂性高, 受悬浮物、CDOM及藻类次生代谢产物干扰, 叶绿素a浓度与地表反射率并非简单的线性关系, 该方法对于叶绿素a浓度变化的敏感度和反演精度均较低; BP (Back Propagation)神经网络因其非线性模拟的特点, 可用于叶绿素a浓度反演[27]。朱云芳等[28]利用高分一号卫星16 m多光谱相机WFV4结合BP神经网络进行太湖叶绿素a浓度监测, BP神经网络模型反演太湖叶绿素a浓度较波段比值模型精度有所提高。但BP神经网络存在初始值敏感、容易陷入局部最优的缺陷限制了稳定性[29], 为此, 有必要开展传统BP神经网络的优化。本文针对BP神经网络的不足, 提出一种利用麻雀搜索算法(Sparrow Search Algorithm, SSA)对BP神经网络的权值和阈值同时进行迭代寻优, 建立SSA-BP模型的优化构想。以小江回水区为对象, 利用无人机高光谱影像和地面原位实测数据对叶绿素a浓度进行反演, 对反演结果进行对比分析, 确认SSA-BP模型具有适用性和较高的精确度, 研究结果为内陆水体利用无人机高光谱影像进行叶绿素a浓度监测提供技术支撑。
1. 材料与方法
1.1 研究区域及数据
区域概况 小江作为长江的一条重要支流, 流域面积达5173 km2, 干流全长182.14 km, 小江入河口距三峡大坝约250 km。在三峡库区30余条支流中, 小江是三峡库区北岸中流域面积最大的支流。小江回水区位于长江三峡水库中部, 是三峡大坝建成后形成的一个典型的回水区域。起始于小江河口, 延伸至云阳县渠马镇, 全长约33 km。从2004年三峡水库蓄水后, 小江回水区成为三峡库区众多支流中频繁暴发水华的水域之一。本文选取小江8个区域为监测区域: 双江(SJ)、黄石01 (HS01)、黄石02 (HS02)、高阳01 (GYO1)、高阳02 (SY02)、水华点(SH)、渠马01 (QM01)和渠马02 (QM02)(图 1)。
高光谱数据及处理 本文采用RTK300大疆无人机搭载AFX10机载高光谱成像仪, 其光谱为400—1000 nm, 共448个空间通道, 224个光谱通道, 光谱分辨率为5.5 nm。无人机采集飞行速度为5 m/s, 飞行高度为440 m, 地面分辨率为0.3 m, 采集频率为16.67 FPS, 影像的幅宽为307 m。
在2024年6月29日至7月2日期间, 针对研究区域进行了AFX10高光谱数据的采集工作。每个区域均进行3次飞行作业, 以确保选出的影像能够代表该区域。对采集到的数据预处理, 首先使用SPECIM CaliGeoPRO软件进行几何校正与辐射校正。随后利用ENVI IDL软件中的Specim插件进行数据的归一化处理, 最后得到反射率数据图像。
地面实测数据 为了构建高光谱数据反演叶绿素a浓度的模型, 在高光谱数据采集期间同步进行了地面原位样品采集检测, 具体而言, 依据《水质叶绿素a的测定 分光光度法》(HJ 897-2017)技术规范, 采用标准采样方法采集表层水样(0—0.5 m深度), 并在实验室条件下使用分光光度计测定水样中的叶绿素a浓度。这些数据作为独立的验证样本, 用于构建和评估高光谱反演模型的性能。
数据集划分 为增加训练和验证数据集划分的合理性, 利用化学计量学中的经典算法SPXY (Sample set Partitioning based on joint X-Y distance)实现数据集的划分[22], SPXY既考虑X光谱空间对训练集选取的影响, 同时也考虑 Y 浓度矩阵对训练集选取的影响, 基于X-Y联合距离对样本集进行选取。训练集和验证集的划分比例为4:1。
1.2 光谱数据预处理
为了提升高光谱数据反演精度, 并减少环境变量对叶绿素a浓度反演的干扰。采取5种光谱预处理方法: 一阶导数(First Derivative, D1)、数据中心化(Mean Centering, MC)、多元散射校正(Multiplicative Scatter Correction, MSC)、卷积平滑算法(Savitzky Golay, SG)及标准正态变换(Standard Normal Variate, SNV)以比选优化光谱预处理方法。
1.3 SSA-BP神经网络模型
BP神经网络因其卓越的非线性映射能力和泛化性能, 在处理复杂问题时比传统的线性数学统计方法更具优势, 适用于更广泛的应用场景。然而, BP神经网络的一个主要缺点是其对初始权重和阈值的选择非常敏感, 这使得网络在训练过程中容易陷入局部最优解, 从而影响模型的反演准确性和稳定性。为了克服这一挑战, 本文引入了麻雀搜索算法(SSA)来优化BP神经网络的权值和阈值选择。SSA是由Xue等[30]在2020年提出的一种新型群体智能优化算法, 它通过模拟麻雀群体在捕食和逃避捕食者行为中的互动来寻找最优解。在SSA中, 麻雀群体被划分为三个关键角色: 发现者、加入者和警戒者。发现者负责寻找食物资源并引导群体移动, 加入者跟随发现者并尝试获取食物, 而警戒者则负责监测周围环境以预警潜在威胁。这三个角色之间存在动态转换, 以保持群体的适应性和多样性。通过将SSA应用于BP神经网络的权值优化, 可以有效提高网络的训练效率和反演稳定性。
每次迭代过程中, 发现者的位置更新:
$$ X_{i,j}^t = \left\{ \begin{gathered} X_{i,j}^t \cdot \exp \left( {\frac{{ - i}}{{a \cdot ite{r_{\max }}}}} \right),\begin{array}{*{20}{c}} {}&{} \end{array}{R_2} < ST \\ X_{i,j}^t + V \cdot L,\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {}&{} \end{array}}&{} \end{array}}&{} \end{array}{R_2} \geqslant ST \\ \end{gathered} \right. $$ (1) 式中, t为迭代次数, $ {X}_{i,j}^{t} $为第t次迭代中第i只麻雀的第j维位置。α为(0,1]内的随机数, R2为报警值, ST为安全阈值, 范围分别为[0, 1]和[0.5, 1]。V为正态分布随机数, L为全1向量。若R2<ST, 则无捕食者, 发现者可广泛搜寻; 若R2>ST, 则发现捕食者, 种群需转移至安全区。
加入者的位置更新:
$$ X_{i,j}^{t + 1} = \left\{ \begin{gathered} V \cdot \exp \left( {\frac{{X_{worst}^t - X_{i,j}^t}}{{a \cdot ite{r_{\max }}}}} \right),\begin{array}{*{20}{c}} {}&{}&{} \end{array}if\begin{array}{*{20}{c}} {} \end{array}i > n/2 \\ X_p^{i + 1} + \left| {X_{i,j}^t - X_p^{t + 1}} \right| \cdot {A^ + } \cdot L,\begin{array}{*{20}{c}} {}&{} \end{array}otherwise \\ \end{gathered} \right. $$ (2) 式中, ${X}_{\mathrm{w}\mathrm{o}\mathrm{r}\mathrm{s}\mathrm{t}} $为最差位置, $ {X}_{\mathrm{p}} $为最佳位置。A是随机元素为–1或1的矩阵, A+=AT(AAT)–1。种群规模为n, 当i>n/2时的麻雀适应度差, 则会迁徙以寻找能量。
警戒者的位置更新:
$$ X_{i,j}^{t + 1} = \left\{ \begin{gathered} X_{best}^t + \beta \cdot \left| {X_{i,j}^t - X_{best}^t} \right|,\begin{array}{*{20}{c}} {}&{}&{} \end{array}if\begin{array}{*{20}{c}} {} \end{array}{f_i} > {f_g} \\ X_{i,j}^i + K \cdot \left( {\frac{{\left| {X_{i,j}^t - X_{worst}^t} \right|}}{{\left( {{f_i} - {f_w}} \right) + \varepsilon }}} \right),\begin{array}{*{20}{c}} {}&{} \end{array}if\begin{array}{*{20}{c}} {} \end{array}{f_i} = {f_g} \\ \end{gathered} \right. $$ (3) 式中, $ {X}_{\mathrm{b}\mathrm{e}\mathrm{s}\mathrm{t}} $为全局最佳位置记, β为步长控制参数, 服从单位方差的正态分布。$ {f}_{i} $为第i只麻雀的适应度值, $g$和$ {f}_{\mathrm{w}} $分别为全局最佳和最差适应度值。K为[–1, 1]内的随机数, ε为防除零的极小值。若$g$, 则麻雀边缘易受攻击; 若$g$, 则中心麻雀四处游走。
1.4 模型评价指标
本文利用模型从预测值和实测值之间的平均绝对误差(Mean Absolute Error, MAE)、预测集的均方根误差(Root Mean Square Error of Prediction, RMSEP)、决定系数(Coefficient of Determination, ${R^2}$)、相对百分比差异(Relative Percent Difference, RPD)和平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)来进行分析评价。
${\text{MAE}}$的计算公式:
$$ {\text{MAE}} = \frac{1}{n}\sum\nolimits_{i = 1}^n {\left| {{y_i} - {{\hat y}_i}} \right|} $$ (4) RMSEP衡量预测值与真实值之间差的平方的平均值的平方根, 其表达公式:
$$ {\text{RMSEP}} = \sqrt {\frac{{\sum\limits_{i = 1}^n {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} }}{{n - 1}}} $$ (5) ${{\text{R}}^{\text{2}}}$是判断回归模型拟合程度高低最常用的指标, 其表达公式:
$$ {R^2} = 1 - \frac{{\sum\limits_{i = 1}^n {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} }}{{\sum\limits_{i = 1}^n {{{\left( {{y_i} - {{\bar y}_i}} \right)}^2}} }} $$ (6) RPD评估模型预测的准确性相对于数据自然变异的大小, 其表达公式:
$$ {\text{RPD}} = \frac{{{\text{SD}}}}{{{\text{RMSEP}}}} $$ (7) MAPE计算了预测值与真实值之间差的绝对值与真实值的比例的平均, 其表达公式如下:
$$ {\text{MAPE}} = \frac{{100\% }}{n}\sum\limits_{i = 1}^n {\left| {\frac{{{y_i} - {{\hat y}_i}}}{{{y_i}}}} \right|} $$ (8) 式中, n为数据的总个数, $ {y}_{i} $为反演模型估测的叶绿素值, ${\hat y_i}$为实测的叶绿素值, ${\bar y_i}$为实测叶绿素平均值。
2. 结果
2.1 叶绿素a浓度与光谱波段的相关性
叶绿素a浓度与光谱波段的相关系数如图 3所示, 在700—900 nm波长区间内存在与叶绿素a浓度最大相关性波段。叶绿素a浓度在712.7 nm处达到峰值, 相关系数P值达到了局部最大值0.32。
2.2 光谱预处理方法
采样点原始光谱数据以及处理后的光谱数据对应的曲线特征如图 4所示。其中图 4a为原始光谱数据的曲线特征, 图 4b—4f分别为经过D1、MC、MCS、SG和SNV处理后的光谱曲线特征。将原始光谱数据和经不同预处理方法处理后的光谱数据, 分别训练BP和SSA-BP模型, 同时计算叶绿素a浓度反演结果和实测值的决定系数R2和均方根误差RMSE。叶绿素a浓度对应不同预处理方法的BP和SSA-BP模型评价结果如表 1所示。
表 1 BP和SSA-BP模型及光谱预处理方法比较Table 1. Comparison of BP and SSA-BP models and spectral pretreatment methods区域
Region模型
Model评价指标
Evaluation Index预处理方法Pretreatment Method 归一化 D1 MCX MSC SG SNV MAE 2.3572 3.0845 1.7763 2.106 1.3199 1.8712 RMSEP 2.4932 4.3058 2.1856 2.6287 1.5979 2.6898 SSA-BP R2 0.95514 0.82758 0.96742 0.94652 0.97487 0.95473 RPD 4.7254 2.4104 6.144 4.3788 6.3136 4.704 MAPE 0.053826 0.06776 0.03602 0.04388 0.03254 0.04375 QM MAE 2.1446 7.8347 3.0951 3.0401 3.2305 5.7849 RMSEP 2.8452 8.9763 3.6434 4.1275 4.0741 6.7402 BP R2 0.90973 0.67639 0.73801 0.91032 0.93604 0.72059 RPD 3.3422 1.8805 1.9604 4.3334 4.0132 1.952 MAPE 0.043334 0.21282 0.06716 0.07729 0.13373 0.12939 MAE 1.9676 2.954 2.4532 1.9519 1.4026 2.1022 RMSEP 2.4408 3.4461 3.2868 2.2003 2.051 2.8688 SSA-BP R2 0.92249 0.62817 0.84753 0.90903 0.94879 0.90369 RPD 4.0574 1.6399 2.7661 3.3235 4.5566 3.276 MAPE 0.10975 0.25805 0.20731 0.16217 0.12099 0.12754 GY MAE 2.864 4.1071 2.5727 2.9092 1.6346 2.5189 RMSEP 3.7608 4.9562 2.9529 3.8957 2.3909 3.1298 BP R2 0.83707 0.62619 0.85016 0.79983 0.91853 0.85359 RPD 2.4909 1.6429 2.5866 2.3262 3.5046 2.903 MAPE 0.22711 0.29904 0.17983 0.20639 0.13894 0.28308 MAE 0.53218 1.065 0.68832 0.39329 0.3053 0.4573 RMSEP 0.59886 1.3948 0.87756 0.45195 0.39288 0.53745 SSA-BP R2 0.88499 0.53494 0.77597 0.91034 0.96852 0.83141 RPD 2.9526 1.4945 2.3422 3.7329 6.227 2.4378 MAPE 0.061797 0.12891 0.08751 0.04979 0.03456 0.04939 HS MAE 0.57029 1.2976 0.57965 0.86522 0.58747 0.91092 RMSEP 0.75499 1.4863 0.81558 1.099 0.83065 1.1727 BP R2 0.72308 0.4345 0.77105 0.72215 0.76364 0.7368 RPD 2.0086 1.3976 2.0904 2.8485 2.0589 2.5097 MAPE 0.069112 0.16383 0.06806 0.08869 0.07557 0.09026 从表 1中可以看出: 经过SG平滑预处理的反演精度最佳。以渠马为例, 经过SG平滑处理后的BP模型, R2和RMSEP分别为0.94和4.07; 同样在SG平滑处理后的SSA-BP模型, R2和RMSEP分别为0.98和1.59。
2.3 模型对比
如图 5所示, SSA-BP模型相较于传统的BP模型在精度方面均实现了改进。特别是在黄石区域, 其中MAE降低了48.05%, RMSEP提升了52.67%, R2增加了26.82%, RPD提高了301.94%, MAPE降低了53.89%, 从而验证了SSA-BP提升模型精度和稳定性方面的有效性。
为了探究面对不同叶绿素a浓度水体模型的适用性。实测叶绿素a浓度(QM>GY>HS), 随着叶绿素a浓度的下降, BP神经网络模型的R2呈现持续下降的趋势(R2: QM=0.94, GY=0.92, HS=0.73), 但是对于SSA-BP神经网络模型, R2一直维持在较高的反演精度(R2: QM=0.98, GY=0.95, HS=0.97)。这证明SSA-BP模型在不同叶绿素a浓度的水体均有好的适用性。
为了比较在不同叶绿素a浓度水体中, 训练集和验证集的预测值与实测值的接近程度。本文选择了BP与SSA-BP模型对渠马、高阳和黄石地区的叶绿素a浓度进行了训练集和验证集的预测。预测值与实测值的对比结果如图 6所示。
2.4 叶绿素a浓度的空间分布
使用SSA-BP模型计算得到叶绿素α浓度分布(图 7)。渠马01和渠马02, 为重度富营养水体, 水流较快水中叶绿素呈带状分布; 高阳01、高阳02和水华点为中度富营养水体。水域面积较大浮游植物容易聚集, 靠近岸边和湖心叶绿素a浓度高; 黄石01、黄石02和双江点为轻富营养水体, 黄石01叶绿素a浓度整体较低仅在河流交汇处浓度较高, 黄石02和双江点受外界干扰较小叶绿素浓度分布均匀。
3. 讨论
3.1 数据预处理与SSA-BP模型的应用
高光谱数据采集受多种不确定因素的影响, 导致数据呈现出非平稳趋势, 影响模型准确性[31]。因此, 对原始数据进行预处理显得尤为重要。王春玲等[32]通过采用SG平滑、多元散射校正(MSC)以及两者结合的方法对原始光谱进行预处理, 显著提高了反演模型XGBoost的精度(R2=0.92)。王彩玲等[33]运用7种不同高光谱预处理技术对水体生化需氧量(BOD)光谱透射率数据进行了处理, 证实了预处理技术在剔除冗余信息和优化光谱数据方面的功效, 可增强了BP神经网络回归模型的性能。本文采用五种光谱预处理方法(D1、MC、MSC、SG平滑和SNV), 并通过反演精度比较, 验证了SG平滑预处理在优化光谱数据和增强SSA-BP神经网络模型反演性能方面的优越性。
另一方面, SSA-BP模型作为一种先进的神经网络模型, 已在多个领域展现出其卓越的预测能力, 包括PM2.5浓度预测[34]、地下水污染源反演识别[35]以及河流溶解氧浓度预测[36], 其在水质参数反演方面的应用也有报道, 已有研究指出, 与传统BP神经网络相比, SSA-BP模型在反演电导率和浊度等水质参数时, 能够提高模型精度。电导率由(R2=0.76, RMSE=35.56)提升到(R2=0.83, RMSE=27.76): 浊度由(R2=0.80, RMSE=0.57)提升到(R2=0.81, RMSE=0.48)[37]。本研究进一步扩展了SSA-BP模型的应用范围, 将其应用于水体富营养化的关键指标——叶绿素a浓度的反演, 结果表明: SSA-BP模型在渠马数据集的决定系数(R2)较BP神经网络提高了约4.15%, 高阳数据集的R2提升了约3.20%, 黄石数据集的R2增幅达到了26.82%; SSA-BP模型相较于BP神经网络, 在处理非线性和高维数据时展现出更高的反演精度。
在叶绿素反演模型的建立方面, 以往研究多集中于水体叶绿素a含量空间差异不大的湖泊, 例如太湖[38]、鄱阳湖[39]和洱海[9]等。对于营养水平和叶绿素a浓度空间差异显著的水体, 不同估算模型的结果差异显著。黄启会等[40]通过对比分析不同营养状态下的估算模型, 发现在中营养化和轻度富营养化水体中, 荧光峰位置模型和基线荧光峰高度模型的算法表现优于其他算法; 而在中度富营养化和重度富营养化水体中, 比值模型和三波段模型的反演效果更为理想。这一发现强调了开发一种能够适应不同营养水体高反演性能模型的必要性。本文采用的SSA-BP神经网络模型, 通过结合麻雀搜索算法(SSA)的优化能力, 显著提高了模型在不同叶绿素a含量水体中的反演精度。结果显示, SSA-BP模型在不同水体条件下均展现出较高的预测精度, R2值最高达到0.98, 这不仅验证了模型的高预测性能, 也显示了其在不同水体条件下的广泛适用性。这一结果对于水环境遥感领域具有重要意义, 因为它提供了一个强大的工具, 可以在多种水体环境中准确预测叶绿素a浓度, 从而更好地理解和管理水体的营养状态。
3.2 小江叶绿素a浓度的空间特征
在小江回水区叶绿素a浓度的反演研究中, 李优[41]通过结合实测水体叶绿素a浓度和GF-1 WFV影像数据, 构建了基于B4/B3比值的11种不同曲线模型, 并发现指数模型具有最佳的反演精度(R2=0.69)。王会等[42]则利用大疆P4M无人机多光谱数据与原位测量叶绿素浓度数据, 采用叶绿素指数(MTCI)建立了多种回归模型, 其中线性模型表现最为出色(R2=0.89)。本文采用SSA-BP模型对小江叶绿素a浓度进行反演, 结果显示, 相较于传统BP神经网络, SSA-BP模型通过优化权重和阈值选择, 有效提升了反演精度(R2=0.98), 并在不同富营养化水平的水体中均显示出高反演精度。
小江叶绿素a浓度的空间分布特征显示, 从渠马—高阳—黄石, 叶绿素a浓度逐渐降低, 体现明显的三峡回水区的藻类生物量空间分布特征。另一方面, 小江回水区作为湖泊型水体[43], 其叶绿素a的分布在沿岸带出现富集现象, 主泓区域的浓度较低[44]。这种分布特征在高阳区域尤为明显。相比之下, 其他区域的叶绿素a从沿岸带到主泓的空间分布较为均匀, 且浓度低, 无人机监测时正处于三峡水位调度期间, 水位抬升过程有助于缓解水华[45]。可见, 无人机监测能够敏感捕获水体叶绿素的空间分布特征, 具有应用优越性。
4. 结论
(1)对比五种光谱预处理方法D1、MC、MSC、SG平滑和SNV在小江回水区叶绿素含量反演中的表现, 发现SG平滑预处理可优化光谱数据和提升SSA-BP神经网络模型的性能。(2)基于麻雀搜索算法(SSA)的BP神经网络SSA-BP模型, 相较于BP神经网络, 在处理非线性和高维数据时展现出更高的精度。以渠马为例MAE降低了59.14%, RMSEP降低了60.78%, R2提高了4.15%, RPD提高了57.32%, MAPE减少了75.67%。确认了SSA-BP模型在处理复杂环境数据时的优越性。(3) BP神经模型的R2随叶绿素a含量下降呈下降趋势, R2从0.94降至0.76。SSA-BP神经网络模型, R2一直维持在较高精度, R2最高达到0.98。体现了SSA-BP模型在不同叶绿素a含量水体的更好适用性。
-
表 1 BP和SSA-BP模型及光谱预处理方法比较
Table 1 Comparison of BP and SSA-BP models and spectral pretreatment methods
区域
Region模型
Model评价指标
Evaluation Index预处理方法Pretreatment Method 归一化 D1 MCX MSC SG SNV MAE 2.3572 3.0845 1.7763 2.106 1.3199 1.8712 RMSEP 2.4932 4.3058 2.1856 2.6287 1.5979 2.6898 SSA-BP R2 0.95514 0.82758 0.96742 0.94652 0.97487 0.95473 RPD 4.7254 2.4104 6.144 4.3788 6.3136 4.704 MAPE 0.053826 0.06776 0.03602 0.04388 0.03254 0.04375 QM MAE 2.1446 7.8347 3.0951 3.0401 3.2305 5.7849 RMSEP 2.8452 8.9763 3.6434 4.1275 4.0741 6.7402 BP R2 0.90973 0.67639 0.73801 0.91032 0.93604 0.72059 RPD 3.3422 1.8805 1.9604 4.3334 4.0132 1.952 MAPE 0.043334 0.21282 0.06716 0.07729 0.13373 0.12939 MAE 1.9676 2.954 2.4532 1.9519 1.4026 2.1022 RMSEP 2.4408 3.4461 3.2868 2.2003 2.051 2.8688 SSA-BP R2 0.92249 0.62817 0.84753 0.90903 0.94879 0.90369 RPD 4.0574 1.6399 2.7661 3.3235 4.5566 3.276 MAPE 0.10975 0.25805 0.20731 0.16217 0.12099 0.12754 GY MAE 2.864 4.1071 2.5727 2.9092 1.6346 2.5189 RMSEP 3.7608 4.9562 2.9529 3.8957 2.3909 3.1298 BP R2 0.83707 0.62619 0.85016 0.79983 0.91853 0.85359 RPD 2.4909 1.6429 2.5866 2.3262 3.5046 2.903 MAPE 0.22711 0.29904 0.17983 0.20639 0.13894 0.28308 MAE 0.53218 1.065 0.68832 0.39329 0.3053 0.4573 RMSEP 0.59886 1.3948 0.87756 0.45195 0.39288 0.53745 SSA-BP R2 0.88499 0.53494 0.77597 0.91034 0.96852 0.83141 RPD 2.9526 1.4945 2.3422 3.7329 6.227 2.4378 MAPE 0.061797 0.12891 0.08751 0.04979 0.03456 0.04939 HS MAE 0.57029 1.2976 0.57965 0.86522 0.58747 0.91092 RMSEP 0.75499 1.4863 0.81558 1.099 0.83065 1.1727 BP R2 0.72308 0.4345 0.77105 0.72215 0.76364 0.7368 RPD 2.0086 1.3976 2.0904 2.8485 2.0589 2.5097 MAPE 0.069112 0.16383 0.06806 0.08869 0.07557 0.09026 -
[1] Mishra S, Mishra D R. Normalized difference chlorophyll index: A novel model for remote estimation of chlorophyll-a concentration in turbid productive waters [J]. Remote Sensing of Environment, 2012(117): 394-406.
[2] 罗婕纯一, 秦龙君, 毛鹏, 等. 水质遥感监测的关键要素叶绿素a的反演算法研究进展 [J]. 遥感技术与应用, 2021, 36(3): 473-488.] Luo J C Y, Qin L J, Mao P, et al. Research progress in the retrieval algorithms for chlorophyll-a, a key element of water quality monitoring by remote sensing [J]. Remote Sensing Technology and Application, 2021, 36(3): 473-488. [
[3] 李泽军. 从水体叶绿素含量评价于桥水库富营养化程度 [J]. 河北水利水电技术, 2001(6): 44-45.] Li Z J. Rich nutrition estimate of Yuqiao reservoir from the content of water body chlorobhyll [J]. Hebei Water Sciences and Engineering Technology, 2001(6): 44-45. [
[4] 陈艳, 刘绥华, 王堃, 等. 基于Landsat卫星影像的草海水质遥感反演及营养状态评价 [J]. 水生态学杂志, 2020, 41(3): 24-31.] Chen Y, Liu S H, Wang K, et al. Remote sensing of Caohai Lake water quality using landsat satellite images [J]. Journal of Hydroecology, 2020, 41(3): 24-31. [
[5] 沈蔚, 纪茜, 邱耀炜, 等. 基于高光谱遥感的长江口叶绿素a浓度反演推算 [J]. 水生态学杂志, 2021, 42(3): 1-6.] Shen W, Ji Q, Qiu Y W, et al. Estimation of chlorophyll-a concentrations in the Yangtze River Estuary obtained from hyperspectral remote sensing images [J]. Journal of Hydroecology, 2021, 42(3): 1-6. [
[6] 王思梦, 秦伯强. 湖泊水质参数遥感监测研究进展 [J]. 环境科学, 2023, 44(3): 1228-1243.] Wang S M, Qin B Q. Research progress on remote sensing monitoring of lake water quality parameters [J]. Environmental Science, 2023, 44(3): 1228-1243. [
[7] 李苗, 臧淑英, 吴长山. 基于TM影像的克钦湖叶绿素a浓度反演 [J]. 农业环境科学学报, 2012, 31(12): 2473-2479.] Li M, Zang S Y, Wu C S. Inversion of Chlorophyll-a Concentration Based on TM Remote Sensing Image in Keqin Lake [J]. Journal of Agro-Environment Science, 2012, 31(12): 2473-2479. [
[8] 封红娥, 李家国, 朱云芳, 等. GF-1与Landsat8水体叶绿素a浓度协同反演——以太湖为例 [J]. 国土资源遥感, 2019, 31(4): 182-189.] Feng H E, Li J G, Zhu Y F, et al. Synergistic inversion method of chlorophyll a concentration in GF-1 and Landsat8 imagery: A case study of the Taihu Lake [J]. Remote Sensing for Land and Resources, 2019, 31(4): 182-189. [
[9] 谢恩弘, 吴骏恩, 杨昆. 基于Sentinel-2影像的洱海叶绿素a质量浓度反演 [J]. 环境工程学报, 2022, 16(9): 3058-3069.] Xie E H, Wu J E, Yang K. Mass concentration inversion for chlorophyll a in Erhai lake based on Sentinel-2 [J]. Chinese Journal of Environmental Engineering, 2022, 16(9): 3058-3069. [
[10] 沈娟, 周治刚, 张彤辉, 等. 基于Sentinel-3A的北部湾海域叶绿素a浓度遥感反演研究 [J]. 遥感技术与应用, 2024, 39(1): 110-119.] Shen J, Zhou Z G, Zhang T H, et al. Inversion of Beibu Gulf chlorophyll a concentration based on Sentinel-3A Satellite [J]. Remote Sensing Technology and Application, 2024, 39(1): 110-119. [
[11] 徐鹏飞, 毛峰, 金平斌, 等. 基于GF1_WFV的千岛湖水体叶绿素a浓度时空变化 [J]. 中国环境科学, 2020, 40(10): 4580-4588.] Xu P F, Mao F, Jin P B, et al. Spatial-temporal variations of chlorophyll-a in Qiandao lake using GF1_WFV data [J]. China Environmental Science, 2020, 40(10): 4580-4588. [
[12] 吴迪, 于文金, 谢涛. 高分二号卫星数据在粤港澳大湾区水体有机污染监测中的应用 [J]. 热带地理, 2020, 40(4): 675-683.] Wu D, Yu W J, Xie T. Application of GF-2satellite data for monitoring organic pollution delivered to water bodies in the Guangdong-Hong Kong-Macao greater bay area [J]. Tropical Geography, 2020, 40(4): 675-683. [
[13] 黄启会, 贺中华, 梁虹, 等. 基于HJ-1A CCD数据的湖泊叶绿素a浓度反演——以贵阳市百花湖为例 [J]. 人民长江, 2019, 50(3): 66-72.] Huang Q H, He Z H, Liang H, et al. Inversion of chlorophyll-a concentration in baihua lake in Guiyang City based on HJ-1A CCD data [J]. Yangtze River, 2019, 50(3): 66-72. [
[14] 杜娟, 杨国范, 李佳奇. 基于环境小卫星的凌河叶绿素a浓度定量反演 [J]. 节水灌溉, 2014(9): 50-53.] Du J, Yang G F, Li J Q. Quantitative retrieval of Chlorophyll-A by remote sensing in Linghe River based on HJ-1B data [J]. Water Saving Irrigation, 2014(9): 50-53. [
[15] 张永杰, 王卷乐, 冉盈盈, 等. 基于实测光谱分析和MODIS数据鄱阳湖叶绿素a浓度估算 [J]. 长江流域资源与环境, 2013, 22(8): 1081-1089.] Zhang Y J, Wang J L, Ran Y Y, et al. Estimating chlorophyll-a concentration in Poyang lake using modis based on measured reflectance spectra [J]. Resources and Environment in the Yangtze Basin, 2013, 22(8): 1081-1089. [
[16] 姚华鑫, 肖潇, 陈品祥, 等. 新一代国产高光谱ZY1-02E卫星在内陆水体水质参数反演中的应用 [J]. 华北水利水电大学学报(自然科学版), 2024, 45(1): 11-20.] Yao H X, Xiao X, Chen P X, et al. Application of China’s new generation of ZY1-02E hyperspectral satellite in the inversion of water quality parameters in inland waters [J]. Journal of North China University of Water Resources and Electric Power (Natural Science Edition), 2024, 45(1): 11-20. [
[17] 冯天时, 庞治国, 江威. 基于珠海一号高光谱卫星的巢湖叶绿素a浓度反演 [J]. 光谱学与光谱分析, 2022, 42(8): 2642-2648.] Feng T S, Pang Z G, Jiang W. Remote sensing retrieval of chlorophyll-a concentration in Lake Chaohu based on Zhuhai-1hyperspectral satellite [J]. Spectroscopy and Spectral Analysis, 2022, 42(8): 2642-2648. [
[18] 童小华, 谢欢, 仇雁翎, 等. 基于多光谱遥感的水质监测处理方法与分析 [J]. 同济大学学报(自然科学版), 2007, 35(5): 675-680.] Tong X H, Xie H, Qiu Y L, et al. Multi-spectral remote sensing data based processing method and analysis of water quality monitor [J]. Journal of Tongji University (Natural Science), 2007, 35(5): 675-680. [
[19] 林剑远, 张长兴. 航空高光谱遥感反演城市河网水质参数 [J]. 遥感信息, 2019, 34(2): 23-29.] Lin J Y, Zhang C X. Inversion of water quality parameters of urban river network using airborne hyperspectral remote sensing [J]. Remote Sensing Information, 2019, 34(2): 23-29. [
[20] Vander Woude A, Ruberg S, Johengen T, et al. Spatial and temporal scales of variability of cyanobacteria harmful algal blooms from NOAA GLERL airborne hyperspectral imagery [J]. Journal of Great Lakes Research, 2019, 45(3): 536-546. doi: 10.1016/j.jglr.2019.02.006
[21] Saberioon M, Khosravi V, Brom J, et al. Examining the sensitivity of simulated EnMAP data for estimating chlorophyll-a and total suspended solids in inland waters [J]. Ecological informatics, 2023, 75: 102058. doi: 10.1016/j.ecoinf.2023.102058
[22] 马启良, 原居林, 张爱华, 等. 基于无人机高光谱技术的水质预测反演系统设计与实现 [J]. 湖州师范学院学报, 2022, 44(2): 56-62.] Ma Q L, Yuan J L, Zhang A H, et al. Design and implementation of water quality prediction and inversion system based on UAV hyperspectral technology [J]. Journal of Huzhou University, 2022, 44(2): 56-62. [
[23] 冯翠杰, 方晨琦, 袁亘宇, 等. 基于无人机高光谱和BP神经网络的城市水体污染监测 [J]. 环境工程学报, 2023, 17(12): 3996-4006.] doi: 10.12030/j.cjee.202308120 Feng C J, Fang C Q, Yuan G Y, et al. Water pollution monitoring based on unmanned aerial vehicle(UAV) hyperspectral and BP neural network [J]. Chinese Journal of Environmental Engineering, 2023, 17(12): 3996-4006. [ doi: 10.12030/j.cjee.202308120
[24] 马启良, 刘梅, 祁亨年, 等. 基于CSA-PLS算法的养殖水体水质快速高光谱预测反演模型研究 [J]. 海洋与湖沼, 2024, 55(2): 375-385.] Ma Q L, Liu M, Qi H N, et al. Fast hyperspectral prediction and inversion model of aquaculture water quality based on csa-pls Algorithm [J]. Oceanologia et Limnologia Sinica, 2024, 55(2): 375-385. [
[25] Rundquist D C, Han L, Schalles J F, et al. Remote measurement of algal chlorophyll in surface waters: the case for the first derivative of reflectance near 690 nm [J]. Photogrammetric Engineering and Remote Sensing, 1996, 62(2): 195-200.
[26] Gordon H R, Clark D K, Mueller J L, et al. Phytoplankton pigments from the Nimbus-7 coastal zone color scanner: comparisons with surface measurements [J]. Science, 1980, 210(4465): 63-66. doi: 10.1126/science.210.4465.63
[27] 曹红业, 龚涛, 袁成忠, 等. 基于RBF模型的太湖北部叶绿素a浓度定量遥感反演 [J]. 环境工程学报, 2016, 10(11): 6499-6504.] Cao H Y, Gong T, Yuan C Z, et al. Quantitative retrieval of chlorophyll-a concentration in northern part of Lake Taihu based on RBF model [J]. Chinese Journal of Environmental Engineering, 2016, 10(11): 6499-6504. [
[28] 朱云芳, 朱利, 李家国, 等. 基于GF-1 WFV影像和BP神经网络的太湖叶绿素a反演 [J]. 环境科学学报, 2017, 37(1): 130-137.] Zhu Y F, Zhu L, Li J G, et al. The study of inversion of chlorophyll a in Taihu based on GF-1 WFV image and BP neural network [J]. Acta Scientiae Circumstantiae, 2017, 37(1): 130-137. [
[29] 张雪, 郑小慎. 基于BP神经网络渤海湾表层叶绿素浓度反演方法探讨 [J]. 海洋技术学报, 2018, 37(6): 79-87.] Zhang X, Zheng X S. Discussion on retrieval method of surface chlorophyll concentration of the Bohai Bay based on BP neural network [J]. Journal of Ocean Technology, 2018, 37(6): 79-87. [
[30] Xue J, Shen B. A novel swarm intelligence optimization approach: sparrow search algorithm [J]. Systems Science & Control Engineering, 2020, 8(1): 22-34.
[31] 程晓钰. 机载高光谱数据处理关键技术研究[D]. 上海: 中国科学院大学(中国科学院上海技术物理研究所), 2019: 15-16.] Cheng X Y. Research on The Key Technologies of Airborne Hyperspectral Data Processing[D]. Shanghai: Shanghai Institute of Technical Physics, Chinese Academy of Sciences, 2019: 15-16.
[32] 王春玲, 史锴源, 明星, 等. 基于机器学习的水体化学需氧量高光谱反演模型对比研究 [J]. 光谱学与光谱分析, 2022, 42(8): 2353-2358.] Wang C L, Shi K Y, Ming X, et al. A comparative study of the COD hyperspectral inversion models in water based on the maching learning [J]. Spectroscopy and Spectral Analysis, 2022, 42(8): 2353-2358. [
[33] 王彩玲, 王一鸣. 基于高光谱与改进BP神经网络的水体生化需氧量(BOD)估算 [J]. 中国无机分析化学, 2023, 13(9): 986-992.] Wang C L, Wang Y M. Estimation of biochemical oxygen demand(BOD) content in water bodies based on hyperspectral and improved BP neural network [J]. Chinese Journal of Inorganic Analytical Chemistry, 2023, 13(9): 986-992. [
[34] 赵侃, 师芸, 牛敏杰, 等. 基于改进麻雀搜索算法优化BP神经网络的PM2.5浓度预测 [J]. 测绘通报, 2022(10): 44-48.] Zhao K, Shi Y, Niu M J, et al. Prediction of PM2.5 concentration based on optimized BP neural network with improved sparrow search algorithm [J]. Bulletin of Surveying and Mapping, 2022(10): 44-48. [
[35] 葛渊博, 卢文喜, 白玉堃, 等. 基于SSA-BP与SSA的地下水污染源反演识别 [J]. 中国环境科学, 2022, 42(11): 5179-5187.] doi: 10.3969/j.issn.1000-6923.2022.11.024 Ge Y B, Lu W X, Bai Y K, et al. Inversion and identification of groundwater pollution sources based on SSA-BP and SSA [J]. China Environmental Science, 2022, 42(11): 5179-5187. [ doi: 10.3969/j.issn.1000-6923.2022.11.024
[36] 陶志勇, 胡启振, 任晓奎. 基于二层分解技术和改进神经网络的河流溶解氧预测研究 [J]. 云南大学学报(自然科学版), 2022, 44(2): 262-270.] doi: 10.7540/j.ynu.20210194 Tao Z Y, Hu Q Z, Ren X K. Prediction of dissolved oxygen in river based on two level decomposition and improved neural network [J]. Journal of Yunnan University (Natural Sciences Edition), 2022, 44(2): 262-270. [ doi: 10.7540/j.ynu.20210194
[37] 任中杰. 基于SSA-BP-SVM模型的云龙湖水质反演研究 [J]. 南京信息工程大学学报, 2024, 16(2): 279-290.] Ren Z J. Water quality retrieval of Yunlong Lake based on SSA-BP-SVM model [J]. Journal of Nanjing University of Information Science & Technology, 2024, 16(2): 279-290. [
[38] 潘鑫, 杨子, 杨英宝, 等. 基于高分六号卫星遥感影像的太湖叶绿素a质量浓度反演 [J]. 河海大学学报(自然科学版), 2021, 49(1): 50-56.] Pan X, Yang Z, Yang Y B, et al. Mass concentration inversion analysis of chlorophyll a in Taihu Lake based on GF-6satellite data [J]. Journal of Hohai University (Natural Sciences), 2021, 49(1): 50-56. [
[39] 韦安娜, 田礼乔, 陈晓玲, 等. 基于穷举法的鄱阳湖叶绿素a浓度高光谱反演模型与应用研究——以GF-5卫星AHSI数据为例 [J]. 华中师范大学学报(自然科学版), 2020, 54(3): 447-453.] Wei A N, Tian L Q, Chen X L, et al. Retrieval and application of chlorophyll-a concentration in the Poyang Lake based on exhaustion method: a case study of Chinese Gaofen-5 Satellite AHSI data [J]. Journal of Central China Normal University (Natural Sciences), 2020, 54(3): 447-453. [
[40] 黄启会, 贺中华, 梁虹, 等. 基于高光谱数据的百花湖叶绿素a浓度估算 [J]. 环境科学与技术, 2019, 42(1): 134-141.] Huang Q H, He Z H, Liang H, et al. Estimation of chlorophyll-a concentration in baihua lake water based on hyspectral data [J]. Environmental Science & Technology, 2019, 42(1): 134-141. [
[41] 李优. 三峡库区回水区叶绿素a浓度遥感反演方法研究[D]. 北京: 中国地质大学(北京), 2017: 28-30.] Li Y. Remote Sensing Retrieval Model for Chlorophyll-a Concentration of Water in Backwater Area, Three Gorges Reservoir[D]. Beijing: China University of Geosciences (Beijing), 2017: 28-30.
[42] 王会, 王永前, 李剑锋, 等. 基于无人机多光谱数据的三峡库区支流叶绿素a浓度估算——以小江为例 [J]. 成都信息工程大学学报, 2024, 39(2): 233-239.] Wang H, Wang Y Q, Li J F, et al. Estimation of chlorophyll a concentration in Three Gorges Reservoir branch based on UAV multispectral data —— a case study of Xiaojiang River [J]. Journal of Chengdu University Of Information Technology, 2024, 39(2): 233-239. [
[43] 郑丙辉, 张远, 富国, 等. 三峡水库营养状态评价标准研究 [J]. 环境科学学报, 2006, 26(6): 1022-1030.] Zheng B H, Zhang Y, Fu G, et al. On the assessment standards for nutrition status in the Three Gorge Reservoir [J]. Acta Scientiae Circumstantiae, 2006, 26(6): 1022-1030. [
[44] 朱冰川, 尤凯, 石浚哲, 等. 基于GOCI数据的太湖叶绿素a浓度反演和蓝藻水华遥感监测 [J]. 环境污染与防治, 2020, 42(8): 1021-1025.] Zhu B C, You K, Shi J Z, et al. Retrieval of chlorophyll-a and remote sensing monitoring of cyanobacteria blooms in Taihu Lake based on GOCI data [J]. Environmental Pollution & Control, 2020, 42(8): 1021-1025. [
[45] 黄宇波, 曹光荣, 范向军, 等. 汛期水库调度对小江水华的影响 [J]. 长江科学院院报, 2024, 41(1): 52-58.] doi: 10.11988/ckyyb.20221549 Huang Y B, Cao G R, Fan X J, et al. Influence of reservoir operation in flood season on water bloom of Xiaojiang River [J]. Journal of Changjiang River Scientific Research Institute, 2024, 41(1): 52-58. [ doi: 10.11988/ckyyb.20221549