一、基本原理
长江、黄河流域面源污染日益突出,成为流域水质持续改善的瓶颈。由于面源污染空间分散、时段集中,污染监测、来源识别、负荷核算及监管难度大。污染源识别作为流域面源污染“测-溯-算-治-管”全链条防控的重要环节,是落实“精准治污、科学治污和依法治污”的关键。研发光谱指纹污染精准溯源技术,为污染负荷核算提供技术支撑以及落实“属地属事”提供抓手。
基于流域面源污染特征解析与关键源区识别,从污染源产生、排放、进入水体方式等方面确定典型污染源,建立IV级+III区的典型污染源光谱指纹图库;应用“III维-II维”数据转换耦合机器学习等方法,对光谱指纹数据进行清洗、转化、融合,识别出典型污染源光谱重要区域与关键节点,利用人工智能算法,构建污染源识别数学模型,甄别污染“路径-端元-主体”。利用数理统计和数学模型,识别出该污染源的关键氨基酸和微生物,结合两者的环境标记,对光谱指纹溯源结果进行联合注释,进一步校验光谱指纹溯源技术。
二、工艺流程
技术流程分为两部分(图1):光谱指纹溯源技术研发与氨基酸-DNA联合注释,其中,光谱指纹溯源技术流程为光谱指纹库→数据挖掘→模型比选→溯源数学模型→溯源技术,氨基酸-DNA联合精准注释为氨基酸环境标记→典型氨基酸识别→污染源注释+微生物环境标记→肠道微生物识别→原核微生物识别→污染源注释=氨基酸-DNA联合精准注释。

图1 光谱指纹与氨基酸-DNA联用精准注释污染溯源技术示意图
技术流程具体如下:
①典型污染源筛选、光谱指纹检测、数据标准化,构建IV级III区的典型污染源光谱指纹库。
②数据清洗、转化、融合,结合机器学习,识别出典型污染源光谱指纹重要区域与关键节点。
③利用人工智能技术,比选、优化模型,结合典型污染源光谱指纹关键节点,建立光谱指纹溯源模型。
④利用数量统计学方法,识别出典型氨基酸和微生物,结合氨基酸和微生物环境标志特征,对典型污染源进行精准注释。
⑤基于氨基酸和DNA对典型污染源的精准注释,对光谱指纹污染溯源技术进行校验。
三、技术创新点及主要技术经济指标
3.1 技术创新点
针对面源污染溯源不精确问题,攻克光谱峰重叠、散射及淬灭等多异质污染物表征难点,结合人工智能处理图谱指纹信息,构建自然径流、种植、畜禽养殖及城镇面源的IV级III区光谱指纹库;创新采用氨基酸-DNA联合注释校验,研发光谱指纹与氨基酸-DNA联用精准注释污染溯源技术,甄别污染端元,打通面源污染“路径-端元-主体”全过程精准解析,实现水质监测断面混合源识别的准确率达到50%,技术就绪度达到5级。
3.2 主要技术经济指标
IV级III区光谱指纹数据库:基于流域面源污染特征解析与关键源区识别,筛选典型污染源,检测光谱指纹,构建IV级III区光谱指纹库。其中:I级数据库2个,包括外源数据库1个,内源数据库1个。在I级的外源数据库中,包括农业面源、水产养殖、生活废水、工业废水、特征源、地下水等II级数据库;在I级内源数据库中,包括底泥、藻类、水生植物等II级数据库。在II级工业废水数据库中,包括普通工业废水和化工废水等III级数据库;化工废水包括制药、中间体、煤化工、农药、多晶硅等IV级数据库。在农业面源II级数据库中,包括水田和旱田两个III级数据库;在畜禽养殖II级数据库中,涉及牲畜和家禽两个III级数据库,牲畜数据库包括猪牛羊三个IV级数据库,家禽数据库包括鸡鸭鹅三个IV级数据库。在生活污水II级数据库中,包括城镇生活污水和农村生活污水两个III级数据库。III区是指长江平原河网区、山地丘陵区和大型灌溉区。
一套污染源识别模型:利用人工智能算法,结合典型污染源光谱指纹的关键节点,建立污染源识别模型。根据典型污染源光谱指纹数据库的级别与区域特征,结合流域面源污染特征,开展递进式溯源:先基于II级光谱指纹库,对流域污染进行污染溯源;基于前者溯源结果,可对潜在比重的污染源,选择III级数据库,进行污染溯源,以此类推到IV级数据库溯源。
两种污染源注释:利用水环境中有机质氨基酸和微生物的环境标记作用,即氨基酸-DNA可以提供生物源污染物的特定标识信息。利用数理统计学方法,识别出污染源中典型的氨基酸和微生物,获得典型污染源生物学特性信息,对光谱指纹溯源技术进行校准,提高溯源技术精度。
时效性指标:目前,研究者利用典型污染物的光谱指纹特征,比对水环境中混合源光谱指纹图谱,可以识别出一种或两种为主的污染源。利用本技术可以适配II-IV级典型污染源光谱指纹库,至少识别出5种以上的潜在污染端元,识别精度提高了50%-70%。在时间尺度上,手动溯源4小时以内,自动0.5小时以内。
四、技术来源及知识产权概况
4.1 专利
(1)自主研发:地表水断面数据处理方法、状况访问方法及相关装置,发明专利,授权号:ZL 2022 1 0219981.3
(2)自主研发:Rainwater collection and purification device,发明专利,授权号2023/02512。
4.2 论文
(1)Liu D, Yang F, Qian F, Song Y*, Yu H*. Novel insights into sources identification of fluvial dissolved organic matter in intricate plain river networks using optical indices with grey influence analysis and Bayesian model. Analytica Chimica Acta, 2025: 344543.
(2)Liu D, Gao H, Yu H*, Song Y*. Applying EEM-PARAFAC combined with moving-window 2DCOS and structural equation modeling to characterize binding properties of Cu (II) with DOM from different sources in an urbanized river. Water Research, 2022, 227: 119317.
(3)Liu D, Nie L, Xi B*, Hongjie Gao, Fang Yang, Huibin Yu*. A novel-approach for identifying sources of fluvial DOM using fluorescence spectroscopy and machine learning model. npj Clean Water, 2024, 7(1), 79.
(4)Liu D, Hao Y, Gao H*, Yu H*, Li Q. Applying synchronous fluorescence spectra with Gaussian band fitting and two-dimensional correlation to characterize structural composition of DOM from soils in an aquatic-terrestrial ecotone. Science of the Total Environment, 2023, 859: 16008.
(5)Wang J, Liu D, Yu H*, Song Y*. Insight into suppression of dibutyl phthalate on DOM removal during municipal sewage treatment using fluorescence spectroscopy with PARAFAC and moving-window 2D-COS. Science of the Total Environment, 2023, 878: 163210.
(6)Zhao Z, Zhang M, Chen Y, Ti C, Tian J, He X, Yu K, Zhu W, Yan X, Wang Y*. Traceability of nitrate polluted hotspots in plain river networks of the Yangtze River delta by nitrogen and oxygen isotopes coupling bayesian model. Environmental Pollution, 2022, 315: 120438.
4.3 数据库
建立复杂多级多源多异质污染物的光谱指纹数据库。
4.4 软件著作权
基于人工智能的三维荧光光谱水环境污染溯源系统V1.0。
五、技术在示范工程应用概况
①常州市金坛区丹金溧漕河示范区
丹金溧漕河是太湖以西地区主要引排水骨干河道,由北向南流经金坛区农村-城市-城镇区域,流域面源污染问题突出,直接影响断面水质的稳定达标。利用该技术,对丹金溧漕河(金坛段)进行污染溯源。结果表明:上游河段污染主要以农村生活污水、水田面源污染为主,中游河段以城市生活污水和工业废水为主,下游河段以农村生活污水、水田面源和工业废水为主。城市生活污水通过管网排放入河,农村生活污水以散排方式入河,水田以面源污染的形式入河,工业废水以漏排、混排、直排为主。
②重庆市永川区临江河示范区
临江河是长江一级支流,贯穿永川全区,干流由北向南流经城区和农村/农业区,流域内工业企业、城市生活、农业、畜禽养殖等对河流水生态质量存在潜在的影响。利用光谱指纹技术,对永川河进行典型污染源溯源,结果显示:城区以城市生活污水和工业废水污染为主,农村/农业区以农村生活污水、畜禽养殖废水和农业面源污染为主。城市生活污水通过管网排放入河或雨季污水溢流入河,工业废水以漏排、混排、直排为主,农村生活污水和畜禽养殖废水以散排方式入河,农田以面源污染的形式入河。
③巴彦淖尔市五原县六排和七排干沟示范区
六干沟全长46.76 km,排域控制面积5.13×104 hm2,承接着5个乡镇3个场部大部分土地的排水任务。七排干沟均在巴盟五原县境内,排域总土地面积2.83×104 hm2,排域内排水全部为明沟,流经五原县城城区。利用光谱指纹技术,对六排和七排干沟进行典型污染源溯源,结果显示:六排干以畜禽养殖为主,七排干以畜禽养殖、生活污水以及旱田污染为主。