CN115206444A - 基于fcm-anfis模型的最佳投药量预测方法 - Google Patents
基于fcm-anfis模型的最佳投药量预测方法 Download PDFInfo
- Publication number
- CN115206444A CN115206444A CN202210382307.7A CN202210382307A CN115206444A CN 115206444 A CN115206444 A CN 115206444A CN 202210382307 A CN202210382307 A CN 202210382307A CN 115206444 A CN115206444 A CN 115206444A
- Authority
- CN
- China
- Prior art keywords
- fcm
- anfis
- fuzzy
- model
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 239000003814 drug Substances 0.000 title claims abstract 3
- 229940079593 drug Drugs 0.000 title claims abstract 3
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 122
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 83
- 239000003651 drinking water Substances 0.000 claims abstract description 62
- 235000020188 drinking water Nutrition 0.000 claims abstract description 62
- 239000000701 coagulant Substances 0.000 claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000007621 cluster analysis Methods 0.000 claims abstract description 4
- 238000013528 artificial neural network Methods 0.000 claims description 47
- 230000006870 function Effects 0.000 claims description 27
- 230000000694 effects Effects 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000003044 adaptive effect Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 230000015271 coagulation Effects 0.000 claims description 8
- 238000005345 coagulation Methods 0.000 claims description 8
- 230000001537 neural effect Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 238000010220 Pearson correlation analysis Methods 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000005284 excitation Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000013277 forecasting method Methods 0.000 claims 3
- 238000009795 derivation Methods 0.000 claims 1
- 238000011065 in-situ storage Methods 0.000 claims 1
- 238000000746 purification Methods 0.000 description 14
- 238000003062 neural network model Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000011430 maximum method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000008235 industrial water Substances 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 239000008239 natural water Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000000714 time series forecasting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Chemical & Material Sciences (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medical Informatics (AREA)
- Water Supply & Treatment (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Automation & Control Theory (AREA)
- Analytical Chemistry (AREA)
- Fuzzy Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Development Economics (AREA)
Abstract
本发明提出基于FCM‑ANFIS模型的最佳投药量预测方法,包括以下步骤;步骤S1、以历史运营中的整年原水水质样本数据作为数据集;步骤S2、对数据集进行预处理;步骤S3、对水质数据分析以描述水质数据之间的相关性,并将预处理后的样本数据进行聚类分析,进行迭代循环求解,得到聚类中心和隶属度矩阵;步骤S4、建立ANFIS预测模型;步骤S5、对ANFIS模型的参数进行学习和训练,建立用于投药量预测的FCM‑ANFIS模糊推理系统;步骤S6、将预处理的数据集经由FCM聚类算法聚类后分成N类并输入到ANFIS模糊推理系统中,进行训练学习以得到最优模糊推理系统;步骤S7、以原水水质为样本数据,通过模糊推理系统进行预测;本发明可有效实现饮用水处理厂的混凝剂的最佳投药量的在线预测。
Description
技术领域
本发明涉及净水工艺技术领域,尤其是基于FCM-ANFIS模型的最佳投药量预测方法。
背景技术
混凝剂投药作为净水工艺的一个重要环节,由于其过程具有非线性和大时滞等特点,传统的投药方法如烧杯试验等方法难以根据原水水质进行投药量的实时调整。尽管也出现了一些如BP算法和Elman算法等传统的智能算法,但由于其具有学习效率不高、预测精度差等问题,难以满足饮用水处理厂的要求。
随着人们的用水需求越来越大,饮用水处理厂的规模也日益增大。而混凝剂投药作为净水工艺的一个重要环节,将直接影响饮用水处理厂的出水品质、净水投药成本和饮用水处理厂的利润。混凝投药是一个复杂的物理和化学反应过程,该过程具有复杂性、时变性、非线性和大时滞等特点。在达到出厂水水质的要求下,如何降低混凝剂的投药量,实现混凝剂投药量的最佳控制,成为了净水行业亟待解决的重点。
对于传统的饮用水处理厂来说,主要依靠人工经验法和烧杯试验法来确定混凝剂的投药量。人工经验法是根据加药后絮体形成情况或者沉淀池出水浊度人工调整混凝剂的剂量,该方法工作量大,在原水水质变化频繁时,需要及时调整混凝剂的剂量,实时观察出水情况,易造成水质波动,难以保证出水水质。烧杯试验法则是根据原水水质,模拟实际生产混凝和消毒的水力条件,对比不同混凝剂及其投加量的实际效果,确定最优的混凝剂投加量。虽然烧杯试验降低了工作强度,但难以真实模拟实际条件,最优投加量与实际情况存在偏差,而且无法及时调整混凝剂的投量,显然存在结果滞后,及时性较差的问题。
近年来,一些人工神经网络算法(ANN)也应用到饮用也应用到了饮用水处理过程等领域。一般来说,人工神经网络模型由网络拓扑、节点特点和学习规则来表示,主要通过调节加权系数等学习过程从而使得输出达到期望值。连接权值、激活函数,网络拓扑结构等都可以影响神经网络模型的性能。常见的ANN算法有BP神经网络算法和Elman神经网络算法。
BP神经网络算法是一种多层前馈神经网络,BP神经网络算法由正向传播和反向传播两个过程组成。在正向传播过程中,训练样本从输入层经由隐层单元层层处理,各层神经元的输出仅对下一层神经元的状态产生影响,直至输出层。若网络输出与其期望输出之间存在偏差,则进入反向传播过程。反向传播过程中,误差信号由原正向传播途径反向回传,并按最小均方误差函数的负梯度方向,对各层神经元的权系数和阈值进行修正,最终使期望的误差函数趋向最小。因此, BP神经网络算法是一种以梯度法为基础的搜索算法。
在实际的饮用水处理厂的混凝剂投药量预测过程中,BP神经网络算法在训练学习时存在很长的学习周期,模型需要的参数较多,且参数的选择没有有效的方法,只能凭借经验对BP神经网络模型的隐含层的个数进行确定。若初始权重选择不当,则容易导致BP神经网络模型陷入局部最小值。而且当样本的个数较少时,BP神经网络不具有很好的泛化能力。
与BP神经网络算法不同,Elman神经网络算法在隐含层和输出层之间加了个上下承接单元。Elman神经网络算法是一种动态的递归神经网络模型,一般由输入层、隐含层、承接层和输出层四个部分组成,采用误差纠正学习算法来更新各神经元间的权值和阈值。该神经网络算法的前一隐含层元素的输出值可输出至承接层进行存储。由于隐含层既要接收输入层的数据,也要接收承接层中的存储数据,因此对于相同的输入数据,不同时刻产生的输出也可能不同。承接层作为延迟算子,使网络具有动态记忆功能,适合时间序列预测等问题。
Elman神经网络只有一个隐含层,当输入层的信息、输出层的反馈信息和隐含层的自身反馈信息都输入至隐含层时,由于隐含层处理不了巨大的信息量,会造成数据冗余,对Elman神经网络模型的训练效率以及训练效果造成不利的影响。
显然,BP神经网络算法和Elman神经网络算法在饮用水处理厂的混凝剂投药量的预测上均不能达到很好的效果,大都存在时延和滞后的问题,且预测精度不高,难以满足饮用水处理厂的日常需求。
发明内容
本发明提出基于FCM-ANFIS模型的最佳投药量预测方法,基于模糊C均值聚类自适应神经模糊推理系统,将FCM聚类算法与ANFIS模糊推理系统有效结合起来,不仅综合了FCM聚类算法与ANFIS模糊推理系统的各自的优点,同时也克服了BP神经网络算法和Elman神经网络算法的收敛慢、预测精度差和易陷入局部最小值等难题,本发明提出的FCM-ANFIS混合模型算法收敛速度较快,预测精度较高,可有效实现饮用水处理厂的混凝剂的最佳投药量的在线预测。
本发明采用以下技术方案。
基于FCM-ANFIS模型的最佳投药量预测方法,用于水处理厂的混凝剂投放量预测,所述方法包括以下步骤;
步骤S1、选择根据混凝池的出水浊度来控制混凝剂的投加的饮用水处理厂,以历史运营中的整年原水水质样本数据作为数据集;
步骤S2、对数据集进行预处理,选取温度对原水浊度有阈值以上影响的年份数据;
步骤S3、对原水水质数据变量间的相似度进行分析以描述水质数据之间的相关性,并将预处理后的样本数据利用模糊C均值聚类算法进行聚类分析,采用 FCM聚类算法进行迭代循环求解,最终得到所需的聚类中心和隶属度矩阵;
步骤S4、引入内部模糊聚类有效性指标对聚类后的结果进行评价,建立 ANFIS预测模型;
步骤S5、采用BP算法和最小二乘法的混合算法对ANFIS模型的参数进行学习和训练,若误差满足要求或者达到最大迭代次数,则终止训练,建立用于投药量预测的FCM-ANFIS模糊推理系统;
步骤S6、将预处理的数据集经由FCM聚类算法聚类后分成N类并输入到 ANFIS模糊推理系统中,进行训练学习以得到基于ANFIS预测模型的最优模糊推理系统;
步骤S7、以饮用水处理厂的原水水质为样本数据,通过模糊推理系统进行预测。
步骤S2中,通过插值的方法将样本数据中的噪声和异常点进行剔除和修正。
步骤S3中,采用皮尔森相关系数和基于欧几里得距离的差异矩阵,利用“统计产品与服务解决方案”软件SPSS对饮用水处理厂的原水水质数据进行Pearson 相关性分析和基于欧几里得距离的差异矩阵分析,利用Z评分对欧几里得距离进行数据转换以看出数据间的相似度强弱,Z评分的值越小,则变量间的相似度越大,反之则越小。
步骤S3中,将预处理后的样本数据利用模糊C均值聚类算法FCM进行聚类分析;所述模糊C均值聚类算法采用隶属度函数确定采样点的隶属聚类中心;算法基于循环计算,通过修正属于隶属度函数的聚类中心和分类矩阵从而完成聚类分类,具体为:FCM将n个数据矢量Xi(i=1,2,...,n)分解为C个模糊组,在满足衡量代价函数最小的条件下,计算各模糊组的聚类中心;FCM使用[0-1]之间的隶属度值确定采样数据的隶属度程度;通过数据的初始化处理,使一个采样数据组合的隶属度总和为1,即
FCM的代价函数表示为:
公式二中,Hi为i聚类中心点,U为隶属矩阵;dij=||Hi+-Xi||为第i类中心至第 j个采样数据点的欧氏距离;m为>1的加权数;采用拉格朗日最值法解算得到代价函数J达到最小值的必要条件,并对uij和Xj进行求导,然后采用FCM聚类算法进行迭代循环求解,最终得到所需的聚类中心和隶属度矩阵。
步骤S4中采用的评价指标包括Bezdek划分系数、Xie-Beni系数、重构错误率VRE和PBM指标;
Bezdek划分系数是VPC,用于重新刻画划分后的数据的隶属度,即所有元素隶属于各个分类隶属度的平方和,定义如下:
式中,u为数据的元素,n是元素的个数;VPC越大,说明聚类的效果越好;
Xie-Beni系数是VXB,其定义为:
式中,x为划分前的元素,v为划分后的元素。
VRE是数据的重构错误率,其定义如下:
式中,I(t)和I’(t)分别是重构前和重构后第i个数据的数值;VRE的值越小,则聚类算法的划分效果越好;
PBM指标是一种聚类有效性指标,定义如下:
式中,K是给定的划分类数,E1则是给定的数据集,为一常值;Ek则是待分类数据与个体中聚类中心的模糊距离之和,PBM的值会随着Ek的减小而增大。 Dk则是个体中的所有聚类中心对之间的最大距离;PBM的值越大,则划分的效果越好;
据上述相关指标的计算公式,对FCM聚类算法进行相关指标的计算,由计算结果进行评价,若VRE的值很小,而PBM的值很大,说明FCM模糊聚类算法的聚类效果较佳。
步骤S5中,ANFIS预测模型为自适应模糊神经推理系统,具体是一种基于 Sugeno型模糊神经网络推理系统,采用If-Then模糊规则,其输出表示为输入量模糊子集的线性组合,以公式表述为:
If x is A1 and y is B1,Then f1=p1x+q1y+r1 公式七;
If x is A2 and y is B2,Then f2=p2x+q2y+r2 公式八;
所述自适应模糊神经推理系统由五层前馈神经网络表示,网络包含两个输入 (x,y)和一个输出f,其体系结构自动产生If-Then模糊规则,在逼近非线性函数的过程中达到任意精度;
所述五层前馈神经网络中,第一层为模糊化层,该层的节点将精确输入模糊化为若干个模糊子集,并用隶属度函数来描述其隶属于某个子集的程度,以公式表述为
其中,xj(j=1,2)为节点j的精确输入,Ai(或Bi)为其对应的模糊子集,μAi(或μBi)为隶属度函数,其形状由前件参数决定;
第二层为规则推理层,负责计算模糊规则的激励强度,以公式表述为
第三层为归一化层,负责将激励强度归一化,以公式表述为
第四层为模糊规则输出层,自适应地产生If-Then模糊规则,以公式表述为
其中,{pi,qi,ri}为后件参数。
第五层为输出层,负责将模糊输出转换为精确输出,以公式表述为
ANFIS模型以反向传播算法或者反向传播法和线性最小二乘的混合算法来进行学习;当选择混合算法时,若先固定前件参数,则ANFIS模型的系统输出可表示为后件参数的线性组合,即:
其中,向量θ构成后件参数集合{p1,q1,r1,p2,q2,r2},利用最小二乘法进行估计调整;接下来是固定后件参数,模糊规则中的前件参数以及连接权值的更新可通过BP算法来完成;相比于单一的反向传播算法,混合算法的训练速度和参数学习效率均有所提高。
步骤S6中,所述FCM-ANFIS体系结构包含数据划分单元、FCM聚类算法单元、模糊系统生成器、模糊推理系统和自适应模糊神经网络;步骤S6中,将数据集按照训练集、验证集和测试集划分好后,分别分配给FCM聚类算法完成聚类,接着将其输入到ANFIS模型进行训练学习,最终的得到最优的模糊推理系统;所述FCM-ANFIS预测模型的建模在MATLAB软件上完成。
步骤S7中,模糊推理系统为FCM-ANFIS混合模型;
所述预测方法还包括步骤S8,将原水的PH值、温度、进水流量和浑浊度作为 FCM-ANFIS混合模型的输入,混凝剂投药量则作为FCM-ANFIS混合模型预测结果的输出;
所述预测方法还包括步骤S9,将FCM-ANFIS模型预测出来的混凝剂的投加量与实际饮用水处理厂的混凝剂投加量作差,得到FCM-ANFIS模型的预测误差值;将这些预测误差值绘成散点图,评估FCM-ANFIS预测模型的预测效果。
所述预测方法还包括步骤S10,即比较所选预测模型的预测准确度,具体方法是引入均方根误差RMSE、标准差SD和绝对误差MAE作为预测模型的预测结果评价标准,其计算式为:
所述预测方法根据天气预报的数据来预测出饮用水处理厂的进水浑浊度,从而根据FCM-ANFIS模型进一步预测出饮用水处理厂未来多天的混凝剂的投加量,具体方法为:
步骤A1、首先收集饮用水处理厂所在地的全年的气象观测站的天气预报数据,选取的气象条件包括露点温度,大气压强、能见度、平均风速和降雨量;
步骤A2、利用FCM聚类算法对气象天气预报数据进行聚类,并将聚类好的气象数据分为训练集、测试集和验证集作为ANFIS模型的模糊输入;
步骤A3、利用ANFIS模型进行训练,将ANFIS模型训练好后以该模型预测出饮用水处理厂全年的进水浑浊度,并将其输出到MATLAB的工作空间,并与原来选取的样本数据的“混凝剂投加量”合并作为一个新的样本数据集;
步骤A4、将步骤A3中得到的新的样本数据集输入到ANFIS预测模型中,使模糊规则根据模糊输入自适应调整,得到基于天气预报数据的净水厂混凝剂投药量预测构建的模型,即二次模型,在该二次模型的基础上进一步对净水厂的混凝剂投加量进行预测。
本发明的优点在于:
1、本发明通过将FCM模糊聚类算法与ANFIS自适应模糊推理系统进行有效的结合,从而综合了FCM聚类算法和ANFIS自适应模糊推理系统的优点;与 BP神经网络算法和Elman神经网络算法相比,本发明提出的FCM-ANFIS混合预测模型的预测效率更快,预测精度更高。同时,本发明提出的FCM-ANFIS模型可具有更广泛的适用性,可以根据露点温度,大气压强、能见度、平均风速和降雨量等天气预报的气象数据来预测出饮用水处理厂的进水浑浊度,从而根据 FCM-ANFIS模型进一步预测出饮用水处理厂未来多天的混凝剂的投加量。
2、本发明提出了基于天气预报数据的对净水厂的混凝剂投药量的预测构建的模型,其属于二次模型,即在气象数据预测模型的基础上进一步对净水厂的混凝剂投加量进行预测。本发明提出的FCM-ANFIS混合预测模型的优点在于,只需要将预处理好的带时间序列的气象数据集输入到FCM-ANFIS混合预测模型中,模糊规则会根据模糊输入自适应调整。同时,本发明提出的FCM-ANFIS混合预测模型根据天气预报的气象数据来预测出饮用水处理厂的未来多天的混凝剂的投加量属于首次尝试。
3、本发明针对于传统的BP神经网络模型易陷入局部最小值和Elman神经网络模型易造成数据冗余等问题,提出了一种基于模糊C均值聚类自适应神经模糊推理系统的最佳投药量预测模型,模糊C均值聚类(FCM)算法是一种基于划分的聚类算法,其思想使得同一簇的对象间的相似度最大,不同簇间的相似度最小。自适应模糊神经推理系统(ANFIS)是模糊神经推理系统中的一种,与ANN相比,ANFIS没有陷入局部最优值这一限制。一般来说,ANFIS的训练效果都比 ANN的要好。ANFIS由于具有模糊系统的决策判断能力和神经网络的自学能力,被广泛应用在控制系统识别、模式识别和一些非线性复杂系统等领域,本发明将FCM模糊聚类算法与ANFIS自适应模糊推理系统有效结合,是在饮用水处理领域中的首次尝试,能根据原水的水质性质,该模型首先采用FCM聚类算法将原水的水质数据分成四类并生成初始模糊推理系统,通过BP算法和最小二乘法混合算法对自适应模糊神经网络中的前件参数和后件参数进行训练。仿真结果表明,该模型的算法与传统的BP神经网络算法和Elman神经网络算法相比,模型的预测效率高,且具有更高的预测精度。
4、本发明提出的FCM-ANFIS混合预测模型,同时克服了BP神经网络算法和Elman神经网络算法的收敛慢、预测精度差和易陷入局部最小值等难题。该混合模型采用FCM聚类算法获取模糊规则的数量,并采用BP算法和最小二乘估计算法的混合算法对ANFIS模型的参数进行训练学习。实验的仿真结果表明,与BP神经网络算法和Elman神经网络算法相比,本发明提出的FCM-ANFIS混合模型算法收敛速度较快,预测精度较高,可有效实现饮用水处理厂的混凝剂的最佳投药量的在线预测。
附图说明
下面结合附图和具体实施方式对本发明进一步详细的说明:
附图1是本发明的FCM-ANFIS混合预测模型的框架示意图;
附图2是水处理厂的净水工艺流程示意图;
附图3是ANFIS网络结构示意图;
附图4是FCM-ANFIS混合预测模型的预测值与实际值的对比示意图;
附图5是FCM-ANFIS模型预测误差散点示意图;
附图6是不同算法下混凝剂投药量的预测效果对比示意图;
附图7是FCM-ANFIS混合模型出水浑浊度对比示意图;
附图8是混凝剂投加量的二次预测示意图;
具体实施方式
如图所示,基于FCM-ANFIS模型的最佳投药量预测方法,用于水处理厂的混凝剂投放量预测,所述方法包括以下步骤;
步骤S1、选择根据混凝池的出水浊度来控制混凝剂的投加的饮用水处理厂,以历史运营中的整年原水水质样本数据作为数据集;
步骤S2、对数据集进行预处理,选取温度对原水浊度有阈值以上影响的年份数据;
步骤S3、对原水水质数据变量间的相似度进行分析以描述水质数据之间的相关性,并将预处理后的样本数据利用模糊C均值聚类算法进行聚类分析,采用 FCM聚类算法进行迭代循环求解,最终得到所需的聚类中心和隶属度矩阵;
步骤S4、引入内部模糊聚类有效性指标对聚类后的结果进行评价,建立 ANFIS预测模型;
步骤S5、采用BP算法和最小二乘法的混合算法对ANFIS模型的参数进行学习和训练,若误差满足要求或者达到最大迭代次数,则终止训练,建立用于投药量预测的FCM-ANFIS模糊推理系统;
步骤S6、将预处理的数据集经由FCM聚类算法聚类后分成N类并输入到ANFIS模糊推理系统中,进行训练学习以得到基于ANFIS预测模型的最优模糊推理系统;
步骤S7、以饮用水处理厂的原水水质为样本数据,通过模糊推理系统进行预测。
步骤S2中,通过插值的方法将样本数据中的噪声和异常点进行剔除和修正。
步骤S3中,采用皮尔森相关系数和基于欧几里得距离的差异矩阵,利用“统计产品与服务解决方案”软件SPSS对饮用水处理厂的原水水质数据进行Pearson 相关性分析和基于欧几里得距离的差异矩阵分析,利用Z评分对欧几里得距离进行数据转换以看出数据间的相似度强弱,Z评分的值越小,则变量间的相似度越大,反之则越小。
步骤S3中,将预处理后的样本数据利用模糊C均值聚类算法FCM进行聚类分析;所述模糊C均值聚类算法采用隶属度函数确定采样点的隶属聚类中心;算法基于循环计算,通过修正属于隶属度函数的聚类中心和分类矩阵从而完成聚类分类,具体为:FCM将n个数据矢量Xi(i=1,2,...,n)分解为C个模糊组,在满足衡量代价函数最小的条件下,计算各模糊组的聚类中心;FCM使用[0-1]之间的隶属度值确定采样数据的隶属度程度;通过数据的初始化处理,使一个采样数据组合的隶属度总和为1,即
FCM的代价函数表示为:
公式二中,Hi为i聚类中心点,U为隶属矩阵;dij=||Hi+-Xi||为第i类中心至第 j个采样数据点的欧氏距离;m为>1的加权数;采用拉格朗日最值法解算得到代价函数J达到最小值的必要条件,并对uij和Xj进行求导,然后采用FCM聚类算法进行迭代循环求解,最终得到所需的聚类中心和隶属度矩阵。
步骤S4中采用的评价指标包括Bezdek划分系数、Xie-Beni系数、重构错误率VRE和PBM指标;
Bezdek划分系数是VPC,用于重新刻画划分后的数据的隶属度,即所有元素隶属于各个分类隶属度的平方和,定义如下:
式中,u为数据的元素,n是元素的个数;VPC越大,说明聚类的效果越好;
Xie-Beni系数是VXB,其定义为:
式中,x为划分前的元素,v为划分后的元素。
VRE是数据的重构错误率,其定义如下:
式中,I(t)和I’(t)分别是重构前和重构后第i个数据的数值;VRE的值越小,则聚类算法的划分效果越好;
PBM指标是一种聚类有效性指标,定义如下:
式中,K是给定的划分类数,E1则是给定的数据集,为一常值;Ek则是待分类数据与个体中聚类中心的模糊距离之和,PBM的值会随着Ek的减小而增大。 Dk则是个体中的所有聚类中心对之间的最大距离;PBM的值越大,则划分的效果越好;
据上述相关指标的计算公式,对FCM聚类算法进行相关指标的计算,由计算结果进行评价,若VRE的值很小,而PBM的值很大,说明FCM模糊聚类算法的聚类效果较佳。
步骤S5中,ANFIS预测模型为自适应模糊神经推理系统,具体是一种基于 Sugeno型模糊神经网络推理系统,采用If-Then模糊规则,其输出表示为输入量模糊子集的线性组合,以公式表述为:
If x is A1 and y is B1,Then f1=p1x+q1y+r1 公式七;
If x is A2 and y is B2,Then f2=p2x+q2y+r2 公式八;
所述自适应模糊神经推理系统由五层前馈神经网络表示,网络包含两个输入 (x,y)和一个输出f,其体系结构自动产生If-Then模糊规则,在逼近非线性函数的过程中达到任意精度;
所述五层前馈神经网络中,第一层为模糊化层,该层的节点将精确输入模糊化为若干个模糊子集,并用隶属度函数来描述其隶属于某个子集的程度,以公式表述为
其中,xj(j=1,2)为节点j的精确输入,Ai(或Bi)为其对应的模糊子集,μAi(或μBi)为隶属度函数,其形状由前件参数决定;
第二层为规则推理层,负责计算模糊规则的激励强度,以公式表述为
第三层为归一化层,负责将激励强度归一化,以公式表述为
第四层为模糊规则输出层,自适应地产生If-Then模糊规则,以公式表述为
其中,{pi,qi,ri}为后件参数。
第五层为输出层,负责将模糊输出转换为精确输出,以公式表述为
ANFIS模型以反向传播算法或者反向传播法和线性最小二乘的混合算法来进行学习;当选择混合算法时,若先固定前件参数,则ANFIS模型的系统输出可表示为后件参数的线性组合,即:
其中,向量θ构成后件参数集合{p1,q1,r1,p2,q2,r2},利用最小二乘法进行估计调整;接下来是固定后件参数,模糊规则中的前件参数以及连接权值的更新可通过BP算法来完成;相比于单一的反向传播算法,混合算法的训练速度和参数学习效率均有所提高。
步骤S6中,所述FCM-ANFIS体系结构包含数据划分单元、FCM聚类算法单元、模糊系统生成器、模糊推理系统和自适应模糊神经网络;步骤S6中,将数据集按照训练集、验证集和测试集划分好后,分别分配给FCM聚类算法完成聚类,接着将其输入到ANFIS模型进行训练学习,最终的得到最优的模糊推理系统;所述FCM-ANFIS预测模型的建模在MATLAB软件上完成。
步骤S7中,模糊推理系统为FCM-ANFIS混合模型;
所述预测方法还包括步骤S8,将原水的PH值、温度、进水流量和浑浊度作为 FCM-ANFIS混合模型的输入,混凝剂投药量则作为FCM-ANFIS混合模型预测结果的输出;
所述预测方法还包括步骤S9,将FCM-ANFIS模型预测出来的混凝剂的投加量与实际饮用水处理厂的混凝剂投加量作差,得到FCM-ANFIS模型的预测误差值;将这些预测误差值绘成散点图,评估FCM-ANFIS预测模型的预测效果。
所述预测方法还包括步骤S10,即比较所选预测模型的预测准确度,具体方法是引入均方根误差RMSE、标准差SD和绝对误差MAE作为预测模型的预测结果评价标准,其计算式为:
所述预测方法根据天气预报的数据来预测出饮用水处理厂的进水浑浊度,从而根据FCM-ANFIS模型进一步预测出饮用水处理厂未来多天的混凝剂的投加量,具体方法为:
步骤A1、首先收集饮用水处理厂所在地的全年的气象观测站的天气预报数据,选取的气象条件包括露点温度,大气压强、能见度、平均风速和降雨量;
步骤A2、利用FCM聚类算法对气象天气预报数据进行聚类,并将聚类好的气象数据分为训练集、测试集和验证集作为ANFIS模型的模糊输入;
步骤A3、利用ANFIS模型进行训练,将ANFIS模型训练好后以该模型预测出饮用水处理厂全年的进水浑浊度,并将其输出到MATLAB的工作空间,并与原来选取的样本数据的“混凝剂投加量”合并作为一个新的样本数据集;
步骤A4、将步骤A3中得到的新的样本数据集输入到ANFIS预测模型中,使模糊规则根据模糊输入自适应调整,得到基于天气预报数据的净水厂混凝剂投药量预测构建的模型,即二次模型,在该二次模型的基础上进一步对净水厂的混凝剂投加量进行预测。
实施例1:
本例的步骤S1中:饮用水处理厂通过将江水、海水等自然界的水进行一系列的物理化学方法处理,去除水中的杂质以及一些有害物质,从而使得水质符合生活或工业用水的要求。饮用水处理厂的净水工艺流程图如图2所示。由净水工艺流程图可以看出,混凝投药控制系统主要是根据混凝池的出水浊度来控制混凝剂的投加。
本例的步骤S2中:数据集选择福建省某饮用水处理厂的2021年全年的水厂运行数据。在构建FCM-ANFIS预测模型之前,要对饮用水处理厂的全年运行数据集的数据进行预处理。将饮用水处理厂的原水水质样本数据进行预处理,通过插值的方法将样本数据中的噪声和异常点进行剔除和修正。
在对样本数据进行预处理后,通过对这些原水水质数据进行统计分析可以看出,饮用水处理厂的原水浊度整体波动较大,体现在温度对原水浊度有一定的影响,在冬季原水浊度值较小,而在夏季则较大。饮用水处理厂的2021年全年数据集的整体统计特征如下表
表4.1饮用水处理厂2021年全年运行数据的统计特征
本例的步骤S3中:为了描述原水水质数据之间的相关性,可采用皮尔森相关系数(Pearson)和基于欧几里得距离(Euclidean distance)的差异矩阵对变量间的相似度进行分析。Pearson相关系数描述的是两个变量之间的线性相关关系,取值为,在显著性的前提下,绝对值越大,两个变量的相关性越强。欧几里得距离指的是其在欧几里得空间中两点间的距离,可用来描述变量间相似度的强弱。利用Z评分对欧几里得距离进行数据转换,可更加直观地看出数据间的相似度强弱。一般来说,做差异矩阵分析时,Z评分的值越小,则变量间的相似度越大,反之则越小。利用“统计产品与服务解决方案”软件(StatisticalProduct and Service Solutions,SPSS)对饮用水处理厂的原水水质数据进行Pearson相关性分析和基于欧几里得距离的差异矩阵分析,分析结果如下表所示。
表4.2皮尔森相关性分析
表4.3原水水质数据的差异矩阵分析
由SPSS软件计算出来的Pearson相关系数和差异矩阵分析的结果可以得知,原水的PH值、温度、进水流量和浊度对混凝剂的投药量影响较大。
实施例2:
本例中,整个FCM-ANFIS预测模型的建模步骤如下:
1)对饮用水处理厂的混凝剂投药量的原水水质数据进行相关分析,确定预测模型的输入变量个数为4个,输出变量个数为1个,生成初始ANFIS预测模型;
2)将饮用水处理厂的原水水质数据按照6:3:1进行划分,分为训练集、测试集和验证集。其中,训练集用于对ANFIS预测模型的系统仿真训练以及数据的拟合,验证集则用来验证ANFIS预测模型的模型性能,最后测试集用来测试ANFIS 预测模型的训练效果。
3)采用FCM聚类算法进行原水水质数据的分析聚类,进而得到样本的聚类中心和个数,确定预测模型的模糊规则数。本发明模糊C均值聚类算法的初始聚类中心数为28个,最大迭代次数为200次,分割矩阵指数为3,目标误差准则为 10-6。
4)采用BP算法和最小二乘法的混合算法对ANFIS模型的参数进行学习和训练,若误差满足要求或者达到最大迭代次数,则终止训练。
5)通过训练得到最优的ANFIS预测模型后,采用饮用水处理厂的原水水质样本数据进行仿真预测。
将原水的PH值、温度、进水流量和浑浊度作为FCM-ANFIS混合模型的输入,混凝剂投药量则作为FCM-ANFIS混合模型的输出。为了更加直观的观察到 FCM-ANFIS预测模型的预测效果,图8画出了FCM-ANFIS预测模型的混凝剂投药量的预测值与实际值。其中,一条曲线代表FCM-ANFIS预测模型的混凝剂投加量的预测值,另一条曲线代表饮用水处理厂的混凝剂的实际投加量。
从图8可看出,FCM-ANFIS预测模型与实际的混凝剂投药量误差较小,预测精度较高。
为了更加直观地看出FCM-ANFIS预测模型的预测效果,通过将FCM-ANFIS 模型预测出来的混凝剂的投加量与实际饮用水处理厂的混凝剂投加量作差,得到 FCM-ANFIS模型的预测误差值。将这些预测误差绘成散点图如图5所示。
由FCM-ANFIS预测误差散点图可以得知,FCM-ANFIS模型的预测误差普遍在±2mg/L以内,预测精度较高,说明训练出来的FCM-ANFIS模型是可靠的,可以准确预测出饮用水处理厂的混凝剂和净水剂的最佳投药量,可以满足饮用水处理厂的日常需求。
为了进一步验证本发明的算法与其他算法相比具有一定的先进性,选取了 Elman神经网络算法和BP神经网络算法与之作比较,在同一个样本数据条件下,通过将Elman神经网络算法、BP神经网络算法和FCM-ANFIS模型算法的预测值与饮用水处理厂的混凝剂实际投药量作比较,画出图像如图6所示。
实施例3:
本例中,在同一个饮用水处理厂的原水水质样本数据集下,分别算出BP神经网络算法、Elman神经网络算法和FCM-ANFIS预测模型的RMSE、MAE和 SD,相关计算结果如下表所示。
表4.4模型性能指标表
由表4.4的计算结果可以看出,FCM-ANFIS预测模型的RMSE值和MAE值均比另外两种算法的值要小,说明该FCM-ANFIS预测模型的预测误差比另外两种算法的误差小,系统仿真结果在一定程度上验证了对于饮用水处理厂的混凝剂投药量的适用性,表明 FCM-ANFIS模型可为饮用水处理厂的混凝剂的最佳投药量提供一个有效的解决方案,可以很大程度上减少饮用水处理厂的投药成本和人工成本,为饮用水处理厂的持续发展开辟了一条新的道路。
Claims (10)
1.基于FCM-ANFIS模型的最佳投药量预测方法,用于水处理厂的混凝剂投放量预测,其特征在于:所述方法包括以下步骤;
步骤S1、选择根据混凝池的出水浊度来控制混凝剂的投加的饮用水处理厂,以历史运营中的整年原水水质样本数据作为数据集;
步骤S2、对数据集进行预处理,选取温度对原水浊度有阈值以上影响的年份数据;
步骤S3、对原水水质数据变量间的相似度进行分析以描述水质数据之间的相关性,并将预处理后的样本数据利用模糊C均值聚类算法进行聚类分析并进行迭代循环求解,最终得到所需的聚类中心和隶属度矩阵;
步骤S4、引入内部模糊聚类有效性指标对聚类后的结果进行评价,建立ANFIS预测模型;
步骤S5、采用BP算法和最小二乘法的混合算法对ANFIS模型的参数进行学习和训练,若误差满足要求或者达到最大迭代次数,则终止训练,建立用于投药量预测的FCM-ANFIS模糊推理系统;
步骤S6、将预处理的数据集经由FCM聚类算法聚类后分成N类并输入到ANFIS模糊推理系统中,进行训练学习以得到基于ANFIS预测模型的最优模糊推理系统;
步骤S7、以饮用水处理厂的原水水质为样本数据,通过模糊推理系统进行预测。
2.根据权利要求1所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:步骤S2中,通过插值的方法将样本数据中的噪声和异常点进行剔除和修正。
3.根据权利要求1所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:步骤S3中,采用皮尔森相关系数和基于欧几里得距离的差异矩阵,利用“统计产品与服务解决方案”软件SPSS对饮用水处理厂的原水水质数据进行Pearson相关性分析和基于欧几里得距离的差异矩阵分析,利用Z评分对欧几里得距离进行数据转换以看出数据间的相似度强弱,Z评分的值越小,则变量间的相似度越大,反之则越小。
4.根据权利要求1所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:步骤S3中,将预处理后的样本数据利用模糊C均值聚类算法FCM进行聚类分析;所述模糊C均值聚类算法采用隶属度函数确定采样点的隶属聚类中心;算法基于循环计算,通过修正属于隶属度函数的聚类中心和分类矩阵从而完成聚类分类,具体为:FCM将n个数据矢量Xi(i=1,2,...,n)分解为C个模糊组,在满足衡量代价函数最小的条件下,计算各模糊组的聚类中心;FCM使用[0-1]之间的隶属度值确定采样数据的隶属度程度;通过数据的初始化处理,使一个采样数据组合的隶属度总和为1,即
FCM的代价函数表示为:
公式二中,Hi为i聚类中心点,U为隶属矩阵;dij=||Hi+-Xi||为第i类中心至第j个采样数据点的欧氏距离;m为>1的加权数;采用拉格朗日最值法解算得到代价函数J达到最小值的必要条件,并对uij和Xj进行求导,然后采用FCM聚类算法进行迭代循环求解,最终得到所需的聚类中心和隶属度矩阵。
5.根据权利要求1所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:步骤S4中采用的评价指标包括Bezdek划分系数、Xie-Beni系数、重构错误率VRE和PBM指标;
Bezdek划分系数是VPC,用于重新刻画划分后的数据的隶属度,即所有元素隶属于各个分类隶属度的平方和,定义如下:
式中,u为数据的元素,n是元素的个数;VPC越大,说明聚类的效果越好;
Xie-Beni系数是VXB,其定义为:
式中,x为划分前的元素,v为划分后的元素。
VRE是数据的重构错误率,其定义如下:
式中,I(t)和I’(t)分别是重构前和重构后第i个数据的数值;VRE的值越小,则聚类算法的划分效果越好;
PBM指标是一种聚类有效性指标,定义如下:
式中,K是给定的划分类数,E1则是给定的数据集,为一常值;Ek则是待分类数据与个体中聚类中心的模糊距离之和,PBM的值会随着Ek的减小而增大;Dk则是个体中的所有聚类中心对之间的最大距离;PBM的值越大,则划分的效果越好;
据上述相关指标的计算公式,对FCM聚类算法进行相关指标的计算,由计算结果进行评价,若VRE的值很小,而PBM的值很大,说明FCM模糊聚类算法的聚类效果较佳。
6.根据权利要求1所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:步骤S5中,ANFIS预测模型为自适应模糊神经推理系统,具体是一种基于Sugeno型模糊神经网络推理系统,采用If-Then模糊规则,其输出表示为输入量模糊子集的线性组合,以公式表述为:
If x is A1 and y is B1,Then f1=p1x+q1y+r1 公式七;
If x is A2 and y is B2,Then f2=p2x+q2y+r2 公式八;
所述自适应模糊神经推理系统由五层前馈神经网络表示,网络包含两个输入(x,y)和一个输出f,其体系结构自动产生If-Then模糊规则,在逼近非线性函数的过程中达到任意精度;
所述五层前馈神经网络中,第一层为模糊化层,该层的节点将精确输入模糊化为若干个模糊子集,并用隶属度函数来描述其隶属于某个子集的程度,以公式表述为
其中,xj(j=1,2)为节点j的精确输入,Ai(或Bi)为其对应的模糊子集,μAi(或μBi)为隶属度函数,其形状由前件参数决定;
第二层为规则推理层,负责计算模糊规则的激励强度,以公式表述为
第三层为归一化层,负责将激励强度归一化,以公式表述为
第四层为模糊规则输出层,自适应地产生If-Then模糊规则,以公式表述为
其中,{pi,qi,ri}为后件参数。
第五层为输出层,负责将模糊输出转换为精确输出,以公式表述为
ANFIS模型以反向传播算法或者反向传播法和线性最小二乘的混合算法来进行学习;当选择混合算法时,若先固定前件参数,则ANFIS模型的系统输出可表示为后件参数的线性组合,即:
其中,向量θ构成后件参数集合{p1,q1,r1,p2,q2,r2},利用最小二乘法进行估计调整;接下来是固定后件参数,模糊规则中的前件参数以及连接权值的更新可通过BP算法来完成;相比于单一的反向传播算法,混合算法的训练速度和参数学习效率均有所提高。
7.根据权利要求6所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:步骤S6中,所述FCM-ANFIS体系结构包含数据划分单元、FCM聚类算法单元、模糊系统生成器、模糊推理系统和自适应模糊神经网络;步骤S6中,将数据集按照训练集、验证集和测试集划分好后,分别分配给FCM聚类算法完成聚类,接着将其输入到ANFIS模型进行训练学习,最终的得到最优的模糊推理系统;所述FCM-ANFIS预测模型的建模在MATLAB软件上完成。
8.根据权利要求7所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:步骤S7中,模糊推理系统为FCM-ANFIS混合模型;
所述预测方法还包括步骤S8,将原水的PH值、温度、进水流量和浑浊度作为FCM-ANFIS混合模型的输入,混凝剂投药量则作为FCM-ANFIS混合模型预测结果的输出;
所述预测方法还包括步骤S9,将FCM-ANFIS模型预测出来的混凝剂的投加量与实际饮用水处理厂的混凝剂投加量作差,得到FCM-ANFIS模型的预测误差值;将这些预测误差值绘成散点图,评估FCM-ANFIS预测模型的预测效果。
10.根据权利要求7所述的基于FCM-ANFIS模型的最佳投药量预测方法,其特征在于:所述预测方法根据天气预报的数据来预测出饮用水处理厂的进水浑浊度,从而根据FCM-ANFIS模型进一步预测出饮用水处理厂未来多天的混凝剂的投加量,具体方法为:
步骤A1、首先收集饮用水处理厂所在地的全年的气象观测站的天气预报数据,选取的气象条件包括露点温度,大气压强、能见度、平均风速和降雨量;
步骤A2、利用FCM聚类算法对气象天气预报数据进行聚类,并将聚类好的气象数据分为训练集、测试集和验证集作为ANFIS模型的模糊输入;
步骤A3、利用ANFIS模型进行训练,将ANFIS模型训练好后以该模型预测出饮用水处理厂全年的进水浑浊度,并将其输出到MATLAB的工作空间,并与原来选取的样本数据的混凝剂投加量合并作为一个新的样本数据集;
步骤A4、将步骤A3中得到的新的样本数据集输入到ANFIS预测模型中,使模糊规则根据模糊输入自适应调整,得到基于天气预报数据的净水厂混凝剂投药量预测构建的模型,即二次模型,在该二次模型的基础上进一步对净水厂的混凝剂投加量进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210382307.7A CN115206444A (zh) | 2022-04-12 | 2022-04-12 | 基于fcm-anfis模型的最佳投药量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210382307.7A CN115206444A (zh) | 2022-04-12 | 2022-04-12 | 基于fcm-anfis模型的最佳投药量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115206444A true CN115206444A (zh) | 2022-10-18 |
Family
ID=83574459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210382307.7A Pending CN115206444A (zh) | 2022-04-12 | 2022-04-12 | 基于fcm-anfis模型的最佳投药量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115206444A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117903913A (zh) * | 2024-03-20 | 2024-04-19 | 黑龙江省农业机械工程科学研究院牡丹江分院 | 一种环保型农业废弃物处理系统及方法 |
CN118276500A (zh) * | 2024-06-04 | 2024-07-02 | 贵州楠泰成套设备有限公司 | 一种水厂混凝投药预测控制系统及使用方法 |
CN118619429A (zh) * | 2024-08-07 | 2024-09-10 | 厦门市政工程有限公司 | 一种基于实时反馈控制的污水处理精准加料系统 |
-
2022
- 2022-04-12 CN CN202210382307.7A patent/CN115206444A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117903913A (zh) * | 2024-03-20 | 2024-04-19 | 黑龙江省农业机械工程科学研究院牡丹江分院 | 一种环保型农业废弃物处理系统及方法 |
CN117903913B (zh) * | 2024-03-20 | 2024-06-04 | 黑龙江省农业机械工程科学研究院牡丹江分院 | 一种环保型农业废弃物处理系统及方法 |
CN118276500A (zh) * | 2024-06-04 | 2024-07-02 | 贵州楠泰成套设备有限公司 | 一种水厂混凝投药预测控制系统及使用方法 |
CN118619429A (zh) * | 2024-08-07 | 2024-09-10 | 厦门市政工程有限公司 | 一种基于实时反馈控制的污水处理精准加料系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117035201B (zh) | 平原河网水工程集群多目标调度规则制定方法及系统 | |
CN115206444A (zh) | 基于fcm-anfis模型的最佳投药量预测方法 | |
CN113705877B (zh) | 基于深度学习模型的实时月径流预报方法 | |
CN112884056A (zh) | 基于优化的lstm神经网络的污水水质预测方法 | |
CN110322933A (zh) | 一种基于动态误差补偿机制的聚丙烯熔融指数混合建模方法 | |
CN108346293B (zh) | 一种实时交通流短时预测方法 | |
CN109919356B (zh) | 一种基于bp神经网络区间需水预测方法 | |
CN116542382A (zh) | 基于混合优化算法的污水处理溶解氧浓度预测方法 | |
CN111553535A (zh) | 一种基于ae-lstm-bo车流量预测的导航参考方法 | |
CN110045771A (zh) | 一种鱼塘水质智能监测系统 | |
CN117291069A (zh) | 一种基于改进de与注意力机制的lstm污水水质预测方法 | |
Buragohain | Adaptive network based fuzzy inference system (ANFIS) as a tool for system identification with special emphasis on training data minimization | |
CN113205214A (zh) | 一种基于并行树突状神经网络的光伏功率超短期预测方法 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
Shang et al. | Research on intelligent pest prediction of based on improved artificial neural network | |
He et al. | A novel neural network-based multiobjective evolution lower upper bound estimation method for electricity load interval forecast | |
CN109408896B (zh) | 一种污水厌氧处理产气量多元智能实时监控方法 | |
Su et al. | Hybrid GA based online support vector machine model for short-term traffic flow forecasting | |
CN118171136A (zh) | 基于rf-c-som聚类算法的水质监测布点优化方法 | |
CN118174294A (zh) | 一种短期电力负荷预测方法 | |
CN115412332B (zh) | 基于混合神经网络模型优化的物联网入侵检测系统及方法 | |
CN110543942A (zh) | 一种多时空长短记忆深度网络精准预测方法 | |
CN115860208A (zh) | 一种基于模糊神经网络的间歇性电源出力预测方法 | |
CN115618725A (zh) | 一种基于机器学习的综合能源系统多元负荷预测方法 | |
Chen et al. | A bidirectional context-aware and multi-scale fusion hybrid network for short-term traffic flow prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |