化学化工基础数据库及工业污染控制专题数据库构建技术

来源项目
中国科学院院级科研项目
技术分类
资源化与综合利用-其它
适用对象及范围
适用于化学化工领域的科研人员,用于化合物性质查询、反应路径设计、化学物质的环境行为研究、材料选择等需求等。环境管理部门用于环境保护、化合物风险管控政策制定、企业化合物风险管理和公众环境教育等多个方面

解决的难点问题

针对数据库数据资源,建立统一的数据标准和规范,对数据的格式、单位、精度等进行统一规定,提高了数据的可比性和可用性,为后续的数据分析和应用提供便利。针对典型工业过程重点生产单元“减污降碳”需求,开发出生产单元建模工具,工具多种经典机器学习算法用于模型开发,同时支持用户上传算法;采用多种模型评估指标进行训练模型评估,以帮助用户选择最佳模型;支持迁移学习,方便用户在现有工作模型基础上进一步训练模型,提升模型开发效率和质量

基本原理

依托Fairman系列科学数据软件,根据化学数据的特点建立了以化合物结构为基础的化合物目录系统,开展本领域数据资源归档保存;通过设立化学数据来源标识号,方便数据问题的回溯与追踪保证数据质量。针对领域工业生产单元机理模型很难描述实际工业生产问题且求解困难的难题,利用数据驱动方法具有处理复杂问题的优势,开发领域大数据分析建模工具。利用软件开发了典型工业废水处理单元模型,如萃取、蒸氨、生化等,构建模型库,并用于废水处理过程的集成优化研究;基于化学主题数据库,利用RDKit化学信息学的开源工具包,设计开发含分子结构文件格式批量转换和批量获取化合物基本信息功能的软件工具。

技术描述(创新点及优势)

本数据库构建技术创新在于在化学化工基础数据建设和研究的基础上,结合我国重点工业生产流程及生产单元现状,突出工业全过程污染控制强化应用驱动的专题特色数据资源建设及相关数据分析挖掘研究,提升化学化工数据库的数据规模、数据质量和数据应用水平,如利用软件开发了典型工业废水处理单元模型,如萃取、蒸氨、生化等,构建了模型库,并用于废水处理过程的集成优化研究。从而可以更好地服务于科研和生产。

技术推广应用情况

数据库提供在线数据开放共享—检索、浏览、下载。除部分面向专题应用,具有较大潜在经济价值的专题数据库尚未在线服务外,数据资源均通过数据库门户对外提供免费的数据共享服务,其中部分数据访问要用户注册后免费访问。目前开放共享数据量占总数据量98%以上,数据服务方式以在线数据查询、浏览及下载为主。目前,独立ip访问人次达到30万人次/年,累计在线资源访问量约为500万人次;共计为160余个课题/项目提供数据支撑,涉及10余个国家重点研发计划/重大科技专项等国家级科研项目,30多项国家自然科学基金项目、中国科学院项目和省部级科研项目。

应用案例名称

为氮肥行业全过程污染防控相关标准提供数据支撑

案例地址

不涉及此项

案例规模

不涉及此项

项目投运时间

不涉及此项

验收情况

不涉及此项

工艺流程

明确数据库目标与需求 调研包括科研人员、环境管理部门、企业从业人员等对数据内容、使用方法的需求,确定数据库包含的数据类型、具体信息与指标,以及数据内容。 (2)确定数据库的结构 根据需求,设计化学化工基础数据库及工业污染控制专题数据库的架构,包括数据表结构、字段、数据类型、索引等,设计数据库的安全和权限管理策略。 (3)数据资源收集与加工 进行多源数据资源收集,对收集到的数据进行清洗、去重、标准化等预处理操作。对数据库中的数据进行抽样验证,确保数据的准确性和一致性和数据质量。 (4)数据分析挖掘工具研究

污染防治效果和达标情况

化学化工基础数据库及工业污染控制专题数据库共计为160余个各级各类科研项目/课题提供数据支撑,涉及10余个国家重点研发计划/重大科技专项等国家级科研项目,30多项国家自然科学基金、中国科学院和省部级科研项目。服务科技计划项目的领域包括煤化工、钢铁、有色、氮肥、新能源、废水处理、危废处置等行业。

二次污染治理情况

不涉及此项

碳排放情况

不涉及此项

能源、资源节约和综合利用情况

不涉及此项

投资费用

结合具体工程

运行费用

结合具体工程