CN110334869A - 一种基于动态群优化算法的红树林生态健康预测训练方法 - Google Patents
一种基于动态群优化算法的红树林生态健康预测训练方法 Download PDFInfo
- Publication number
- CN110334869A CN110334869A CN201910612175.0A CN201910612175A CN110334869A CN 110334869 A CN110334869 A CN 110334869A CN 201910612175 A CN201910612175 A CN 201910612175A CN 110334869 A CN110334869 A CN 110334869A
- Authority
- CN
- China
- Prior art keywords
- algorithm
- group
- population
- mangrove
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Operations Research (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于动态群优化算法的红树林生态健康预测训练方法,包括步骤A,数据预处理;步骤A1,基于PSO算法的数据生成模块;步骤A2,基于相对熵和余弦相似度的相似性评估模块;步骤B,基于DGO算法进行模型训练;步骤B1,组内合作;步骤B2,每一组的质心与其他组的质心进行通信;步骤B3,每一组的成员与种群内的其他成员进行随机交叉;步骤B4,在每一质心之间的通信和每一成员的随机交叉过程中,搜寻所述突变情况,基于该突变情况查出与此对应的成员,将该成员随机转移到其它组;步骤C,结合BP算法和DGO算法配合步骤B进行前馈神经网络的训练。本发明提高了预测数据的准确性以及训练模型的完整度。
Description
技术领域
本发明涉及红树林生态保护技术领域及数据挖掘技术领域,尤其涉及一种 基于动态群优化算法的红树林生态健康预测训练方法。
背景技术
红树林是生长于热带和亚热带海岸潮间带、兼具陆地和海洋生态系统特 性的木本植物群落,有着“造陆先锋”、“海岸卫士”、“生物净化筛”之称, 在防浪护堤、净化污染等方面发挥着至关重要的作用。红树林湿地生态系统素 有“物种基因库”之称,保护好红树林生态系统的完整性是维持生物多样性的 重要基础之一。
红树林湿地生态环境的监测、保护及病虫害控制对于支撑我国东南沿海 的近海海洋生态安全和可持续发展具有重要战略意义。然而近年来,由于人类 活动的破坏,红树林资源急剧减少,建立起一个可靠的红树林生态健康监测和 评估系统以此加快生态环境监测网络的建设,进而为环保标准的制定和政府决 策提供重要依据,促进环境保障工作的有序高效进行,从而提升环境质量是必 需的。
为此,现有技术中出现了主要通过神经网络算法而进行的生态监测。基于 神经网络的结构建设,其包括一种学习训练方法,该训练方法主要分为梯度法 和启发法两类:梯度法是指通过计算目标函数的一阶导数、甚至二阶导数快速 求得局部最小值的方法,其是根据梯度下降的方向去寻找最小值,因此它能快 速收敛到最近的最小值,即目标最优值,梯度法中目前应用最广泛的是反向传 播(BP)算法,它是1986年由Rumelhart和McClelland为首的科学家提出的概 念,是一种按照误差逆向传播算法训练的多层前馈神经网络;启发式算法是一 个基于直观或经验构造的算法,在可接受的花费(指计算时间和空间)下给出待解决组合优化问题每一个实例的一个可行解,该可行解与最优解的偏离程度 一般不能被预计。
目前,启发式算法以仿自然体算法为主,主要有遗传算法、模拟退火法、 粒子群优化算法等。与启发式算法相比,梯度法局部搜索能力强,能快速收敛 到最优值。但是,其很难找到全局的最优值,同样地,在该梯度法原理下,初 始点的位置显得至关重要,如图2所示,如果红点所在位置是初始值,那么该 算法会带着它向黑色线条所标注的方向去找最小值,然后就会找到右边的局部 最小值并且停滞不前,可见,该点并不是目标全局最优值。梯度算法在具体训 练中存在以下问题:1)算法对初始值敏感,不同的初始值会得到不同的结果; 2)容易陷入局部最优值;3)学习率是梯度法中一个很重要的超参数,如果学 习率过大,算法难以收敛,太小又可能过早收敛,而调节参数是一件比较困难 的事情;4)如果搜索空间很复杂,容易出现震荡的现象。
与梯度法相比,启发式算法非单一地按照特定的方向更新,其允许随机突 变,并三类算法:基于单个解的算法,基于种群的算法和其他相关算法。大多 数启发式算法主要是通过模拟动物的行为,从而形成一种寻找全局最优解的搜 索方法。比如早期的遗传算法,它是通过模拟大自然中生物进化的历程来解决 问题的。大自然中一个种群经历过若干代的自然选择后,剩下的种群必定是适 应环境的。把一个问题所有的解看做一个种群,经历过若干次的自然选择以后, 剩下的解便问题的最优解。遗传算法大致过程分为初始化编码、个体评价、选 择、交叉、变异。启发式算法的优点就在于,它克服了梯度法对初始值敏感和 容易陷入局部最优值的缺陷,在全局探索上更有优势。但也由于它的随机性, 它的收敛速度就要慢一些,而且在局部搜索方面都有一定的限制。
而对于红树林生态系统而言,其监测数据涉及时间、空间及其数值变化, 同时预测模型属于非线性模式,复杂程度和不完整性较高,利用神经网络结构 以及上述训练方法得到的模型与现实差异较大,预测准确率偏低。因此,一种 新的方法或模型用于红树林生态系统健康的预测。
发明内容
本发明的目的在于提供了一种基于动态群优化算法的红树林生态健康预 测训练方法,提供了科学的训练模型,提高了预测数据的准确性以及训练模型 的完整度。
本发明解决其技术问题所采用的技术方案是:一种基于动态群优化算法的 红树林生态健康预测训练方法,所述方法包括以下步骤:
步骤X,建立红树林生态数据集;
步骤A,数据预处理,基于粒子群优化和信息熵的算法进行数据生成;
步骤A1,基于PSO算法的数据生成模块;
步骤A2,基于相对熵和余弦相似度的相似性评估模块;
步骤B,基于DGO算法进行模型训练,其模型包括种群,种群内包括若 干个由质心和成员所组成的组;
步骤B1,组内合作,其用于成员更新,以组合适应度最大的成员并得出 最优解,该成员更新包括正常更新和突变;
步骤B2,每一组的质心与其他组的质心进行通信;
步骤B3,每一组的成员随机与种群内的其他成员进行交叉;
步骤B4,在步骤B2和B3中,搜寻所述突变情况,基于该突变情况查出 与此对应的成员,将该成员随机转移到其它组;
步骤C,结合BP算法和DGO算法配合步骤B进行前馈神经网络的训练。
优选的,所述步骤C中的训练过程包括以下步骤:
步骤C1,基于DGO算法,通过组间通信和组内合作进行种群中每组内的 个体成员之间适应度的计算,该计算是基于BP算法,其包括首先参数初始化, 而后对其进行梯度下降训练,最后通过函数损失值的计算得出所述适应度;
步骤C2,基于步骤B4更新每一组的质心;
步骤C3,是否满足迭代终止条件,若是,则根据当前数据信息得出相关 参数及适应度;若否,则返回步骤C1并依次重复前述步骤,直到满足迭代终 止条件为止。
优选的,所述步骤A2还包括计算种群内每个个体成员之间的适合度,并 根据该适合度更新种群内的个体,同时得到最大适应度的个体,将其结果添加 到数据集中,以此对数据集进行评估,该评估过程包括:
S1,将数据集编码为种群
P=(g1,g2,...,gn)
g=(x1,x2,...,xm)
其中,P为种群,g为种群中的组,n为设置的种群组数,m为组内个体的 长度;
S2,通过PSO算法进行种群扩充,PSO中包括与其每一个个体对应的粒 子,该粒子存在于d维空间中,在其种群扩充过程中,包括对粒子在该d维空 间中的位置、速度和其经过的历史最优点位置,以及种群所经过的最优点位置, 上述表达式如下:
粒子i的位置,xi=(xi1,xi2,...,xid),i=1,2,...,m;
粒子i的速度,vi=(vi1,vi2,...,vid),i=1,2,...,m;
粒子i经过的最优点位置,pi=(pi1,pi2,...,pid),i=1,2,...,m;
种群所经过的最优点位置,pg=(pg1,pg2,...,pgd);
其中,每个粒子以当前的位置和速度进行位置更新,所述更新公式如下:
t时刻到t+1时刻的速度,
t时刻到t+1时刻的位置,
其中,为当前粒子所经过的最优点位置,为当前粒子所经过的最优点 位置,ω为惯性权重,c1c2为学习因子,r1r2为[0,1]之间的随机数;
S3,评估所扩充的新个体,其包括对相对熵和余弦相似度的计算,计算公 式如下:
f(PO,PG)=fE(PO,PG)+fK(PO,PG)+fC(PO,PG)
其中,PO,PG分别表示原始的红树林生态监测数据和生成数据,f(PO,PG)表 示相似度;
fE(PO,PG)=|H(PG)-H(Po)|
其中,H(PG)表示生成数据的信息熵,H(Po)表示原始数据的信息熵;
和分别表示PO,PG在第i位置的概率值;
PG(Xi)和PO(Xi)分别表示PO,PG在第i位置的值;
依次重复步骤S2和步骤S3,以配合所述步骤C3,直到满足迭代终止条 件为止。
优选的,所述步骤B1包括更新公式:
其中,xi,j,k表示第k代第i组的第j个成员,w是决定移动方向的权重,r为0 到1之间的随机数,Ci为第i组的质心,Gbest为全局最优值,μ是服从μ~(0,s2)的随 机数,s为步长。
优选的,所述步骤B2中每一组的质心与其他组的质心进行通信包括质心 的移动,其质心移动采用Lévy随机游走,该Lévy随机游走的公式如下:
其中,α为其步长,表示第k代第i组的质心,表示一种entry-wise乘法, Lévy(λ)是一个服从Lévy分布的随机数。
优选的,所述步骤B3还包括随机选择交叉算子和偏置随机游走算子,并 以如下公式进行选择:
随机选择算子,
偏置随机游走算子,
其中,r是随机数生成器,Cr是交叉概率。
优选的,所述步骤C将MSE作为BP算法中的学习误差函数,其计算公 式为:
DGO算法中的适应度计算公式为:
其中,表示第i个训练样本的第j个输出值,yi,j表示第i个训练样本的第j个 期望输出值,n是训练样本的个数,m是输出维数。
本发明的有益效果在于:通过BP算法与DGO算法的结合,实现了复杂 度较高的红树林生态健康数据的预测模型训练;通过基于粒子群优化和信息熵 的算法,进而基于红树林生态的原始数据生成规模可控的仿真数据,从而为训 练模型提供了可靠的数据支撑;通过数据预处理,提高了数据生成效率,同时, 对传统数据集采集后的不完整性和预测分类的不准确性进行了有效解决,增强 了训练模型的抗过拟合能力;通过BP算法和动态群优化算法训练前馈神经网 络,将两种算法的优势相结合,既在避免全局探索时陷入局部最优点的条件下 使得局部搜索收敛速度较快,进而对复杂的训练模型能够发挥高效的训练能力,从而在红树林生态保护技术领域之外的数据挖掘技术领域也能得到较好的 应用,增强了实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附 图及实施例对本发明作进一步说明,下面描述中的附图仅仅是本发明的部分实 施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他附图:
图1为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 训练模型的训练流程图;
图2为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 全局最优质搜寻示意图;
图3为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 群主变异的转移示意图;
图4为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 LF和CA在训练数据集上的最小值和平均值的列表;
图5为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 LF和CA在测试数据集上的最小值和平均值的列表;
图6为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 反映适应度如何随迭代次数变化的适应度收敛曲线的示意图;
图7为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 的数据集特征表;
图8为本发明一种基于动态群优化算法的红树林生态健康预测训练方法中 的数据集标签表。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发 明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发 明的部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术 人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明 的保护范围。
需要注意的是,本申请所述的“步骤A1”和“步骤A2”属于“步骤A” 中的两部分构成内容,其没有定向的先后关系,具体流程关系以说明书中的实 施例为准,另外,它们之间的实施顺序不会对数据预处理造成影响。
在实施例1中,如图1所示,一种基于动态群优化算法的红树林生态健康 预测训练方法,所述方法包括以下步骤:
步骤X,建立红树林生态数据集;
步骤A,数据预处理,基于粒子群优化和信息熵的算法进行数据生成;
步骤A1,基于PSO算法的数据生成模块;
步骤A2,基于相对熵和余弦相似度的相似性评估模块;
步骤B,基于DGO算法进行模型训练,其模型包括种群,种群内包括由 质心和成员所组成的若干个组;
步骤B1,组内合作,其用于成员更新,以组合适应度最大的成员并得出 最优解,该更新包括正常更新和突变;
步骤B2,每一组的质心与其他组的质心进行通信;
步骤B3,每一组的成员与种群内的其他成员进行随机交叉;
步骤B4,在每一质心之间的通信和每一成员的随机交叉过程中,搜寻所 述突变情况,基于该突变情况查出与此对应的成员,将该成员随机转移到其它 组;
步骤C,结合BP算法和DGO算法配合步骤B进行前馈神经网络的训练。
首先,在步骤X中,建立红树林数据集,如图该红树林数据集包括不同特 征,其中每一个特征对应一个预测指标:盐度年度变化、PH值、活性磷酸盐 /(μg/L)、无机氮/(μg/L)、汞/(μg/g)、镉/(μg/g)、铅/(μg/g)、砷/(μg/g)、油 类/(μg/g)、硫化物/(μg/g)、有机碳(%)、浮游植物密度/(x105个/m3)、浮游动 物密度/(x103个/m3)、浮游动物生物量/(mg/m3)、底栖动物密度/(个/m2)和底栖 动物生物量/(g/m2),与前述指标依次对应的数据为1.534、9.25、11.833、298.333、 0.12、0.119、1.6667、1.0067、48.333、44.7、0.96、2.39、0.813、27.68、360 和365.35。根据该数据建立特征集X:
其中,n为样本个数,m为特征数,一个样本包含1个以上的特征。如图 8所示,根据指标数据进行标签划分,数据值以下的指标归为标签“0”,等于 数据值的指标归为标签“1”,数据值以上的指标归为标签:“2”,标签“0” 对应的等级为健康,标签“1”对应的等级为亚健康,标签“2”对应的等级为 不健康。最终按照标签表进行预测结果的输出,输出标签集为Y:
具体的,在所述步骤A中,粒子群优化和信息熵的算法是用于生成数据, 以通过模拟少量的原始红树林生态监测数据生成规模性的与原始数据分布相 近的数据集,并形成包含d维空间的训练模型。在步骤A1和步骤A2所结合 的两种算法中,所有原始数据处于一个数据群体中,其数据群体中包含与每一 单位数据所对应的个体。其中,对群体中的所有个体进行随机初始化,其每个 个体构成一条生成数据。在其算法中,包括迭代机制,在其每次迭代过程中, 首先对每个个体相互的适合度进行计算,包括适应度函数的设置,该适应度函 数是指相似度评估函数;而后根据适应度大小更新种群个体,并以其得出适应 度最高的个体及该适应度;最后,将适应度最高的个体作为结果并添加至数据 集中。
PSO算法为粒子群优化算法,该PSO算法中包括粒子群集,粒子群集由 规模化的粒子组成,每一粒子对应为种群中的一个个体。其中,每一个粒子均 在d维空间中进行最优点位置的搜索,每一个粒子均匹配适应度函数确定适应 值以判断当前位置与最优点的接近程度。所述粒子具有最优点记忆,在其搜索 过程中,会对所经过的最优点位置进行记录。每个粒子在搜索过程中的速度会 决定其运动的距离和方向,该速度是根据它本身的运动习惯以及相伴粒子的运 动习惯进行动态调整。所述运动习惯为粒子以往到达最优点位置所取的速度, 以及与种群以往所经过的最优点位置的对应关系,以其惯性参数相模拟所形成的训练经验。
DGO算法为动态群优化算法,其主要通过群算法和进化算法相结合而进 行计算,其中,群算法用于全局的粒子探索;进化算法用于局部的粒子最优点 开发。在此计算过程的训练模型中,包括每个组由两部分组成的质心和成员, 若干个组可构成一个种群,其中,每组的质心记录该组所发现的最优解,即与 个体间相对应的最大适合度。
在所述步骤B4中,如图3所示,所述突变情况属于群组变异,该群组变 异是为了节约计算资源和避免陷入局部最优而设置的。其中,如果某一组中的 某一个成员在给定的尝试次数内无法改进自己,就将它随机转移到其他组。与 其他启发式算法算法相比,DGO算法对于训练神经网络更有效,因为它既考 虑了全局探索,也考虑了局部开发。上述四个步骤过程确保了这些良好的性能, 在解决复杂问题时有效地避免了收敛慢、对初始值敏感以及容易陷入局部最优 的问题。
进一步地,所述步骤C中的训练过程包括以下步骤:
步骤C1,基于DGO算法,通过组间通信和组内合作进行种群中每组内的 个体成员之间适应度的计算,该计算是基于BP算法,其包括首先参数初始化, 而后对其进行梯度下降训练,最后通过函数损失值的计算得出所述适应度;
步骤C2,基于步骤B4更新每一组的质心;
步骤C3,是否满足迭代终止条件,若是,则根据当前数据信息得出相关 参数及适应度;若否,则返回步骤C1并依次重复前述步骤,直到满足迭代终 止条件为止。
其中,在初始化阶段,参数会被初始化。将部分参数预先设定阈值,例如 种群大小和每组所含成员个数;而另一些参数是随机生成的,比如种群的出发 点,即所有个体的初始状态。每一次迭代,通过DGO算法将得到的个体作为 BP算法的参数初始值,再经过BP算法的训练得到适应度,然后DGO算法会 根据所有个体的适应度大小对种群进行更新。如此循环迭代,得到最终的最佳 参数和最佳适应度。所述迭代终止条件为组合适应度最大的成员并得出最优 解,即组内成员更新的完成。
进一步地,所述步骤A2还包括计算种群内每个个体成员之间的适合度, 并根据该适合度更新种群内的个体,同时得到最大适应度的个体,将其结果添 加到数据集中,以此对数据集进行评估,该评估过程包括:
S1,将数据集编码为种群
P=(g1,g2,...,gn)
g=(x1,x2,...,xm)
其中,P为种群,g为种群中的组,n为设置的种群组数,m为组内个体的 长度;
S2,通过PSO算法进行种群扩充,PSO中包括与其每一个个体对应的粒 子,该粒子存在于d维空间中,在其种群扩充过程中,包括对粒子在该d维空 间中的位置、速度和其经过的历史最优点位置,以及种群所经过的最优点位置, 上述表达式如下:
粒子i的位置,xi=(xi1,xi2,...,xid),i=1,2,...,m;
粒子i的速度,vi=(vi1,vi2,...,vid),i=1,2,...,m;
粒子i经过的最优点位置,pi=(pi1,pi2,...,pid),i=1,2,...,m;
种群所经过的最优点位置,pg=(pg1,pg2,...,pgd);
其中,每个粒子以当前的位置和速度进行位置更新,所述更新公式如下:
t时刻到t+1时刻的速度,
t时刻到t+1时刻的位置,
其中,为当前粒子所经过的最优点位置,为当前粒子所经过的最优点 位置,ω为惯性权重,c1c2为学习因子,r1r2为[0,1]之间的随机数;
S3,评估所扩充的新个体,其包括对相对熵和余弦相似度的计算,计算公 式如下:
f(PO,PG)=fE(PO,PG)+fK(PO,PG)+fC(PO,PG)
其中,PO,PG分别表示原始的红树林生态监测数据和生成数据,f(PO,PG)表 示相似度;
fE(PO,PG)=|H(PG)-H(Po)|
其中,H(PG)表示生成数据的信息熵,H(Po)表示原始数据的信息熵;
和分别表示PO,PG在第i位置的概率值;
PG(Xi)和PO(Xi)分别表示PO,PG在第i位置的值;
依次重复步骤S2和步骤S3,以配合所述步骤C3,直到满足迭代终止条 件为止。
进一步地,所述步骤B1包括更新公式:
其中,xi,j,k表示第k代第i组的第j个成员,w是决定移动方向的权重,r为0 到1之间的随机数,Ci为第i组的质心,Gbest为全局最优值,μ是服从μ~(0,s2)的随 机数,s为步长。
上述计算过程用于成员更新,包括正常更新和突变。更新过程根据每组最 优解和全局最优解进行计算。突变可以保证种群的多样性,从而避免陷入局部 最优。
进一步地,所述步骤B2中每一组的质心与其他组的质心进行通信包括质 心的移动,其质心移动采用Lévy随机游走,该Lévy随机游走的公式如下:
其中,α为其步长,表示第k代第i组的质心,表示一种entry-wise乘法, Lévy(λ)是一个服从Lévy分布的随机数。
Lévy随机游走适用于上述计算过程,该计算过程提供了种群多样性和扩 大搜索范围的能力,Lévy游走的数更新在这个过程中,各组的质心与其他组 的质心进行通信,进而提高了通信效率,以此节省通讯成本。
进一步地,所述步骤B3还包括随机选择交叉算子和偏置随机游走算子, 并以如下公式进行选择:
随机选择算子,
偏置随机游走算子,
其中,r是随机数生成器,Cr是交叉概率。
在上述过程中,每个成员以随机概率与种群内的其他成员进行交叉。该交 叉动作是一种高效的全局优化方式,旨在快捷地解决陷入局部最优的问题。
进一步地,所述步骤C将MSE作为BP算法中的学习误差函数,其计算 公式为:
DGO算法中的适应度计算公式为:
其中,表示第i个训练样本的第j个输出值,yi,j表示第i个训练样本的第j个 期望输出值,n是训练样本的个数,m是输出维数。
在上述训练过程中,将BP和DGO算法结合起来作为前馈神经网络的训 练方法。将DGO算法添加到传统的BP神经网络中进行优化训练,由于BP神 经网络存在对初始值敏感和容易陷入局部最优的缺陷,而DGO算法的高度随 机性和多样性能够较好地弥补所述缺陷。前馈神经网络包括各个神经元,其每 一个神经元分层排列,神经元之间具有上下层的连接关系,而本实施例中前馈 神经网络的优化主要是找到一组各层连接的权重和偏置,以此丰富训练参数, 进而提高模型预测的结果的准确率。其中,预测结果的准确性又与学习损失相 关,故此,通过设定学习损失函数,以最小化损失函数进行数据目标的优化。 其中,前馈神经网络中的权重和偏置均转化为一个向量,每个向量表示一个个 体的位置。
具体地,在本实施例中通过4个不同的训练模型进行比对,其中,DGBPNN 模型为本申请所提供的训练模型。同时包括2种评价技术效果的指标,如下:
1)定量的统计性能:
A.LF:20次独立运行的损失函数(LF)的最小值和平均值,其计算公式 是为所述适应度计算公式.
B.CA:20次独立运行的健康状况分类准确率的最大值和平均值,其计算 公式为
其中是分类正确的样本数,是用于分类的总样本数。
如图4及5所示,从这两个表中可以看出,DGBPNN在拟合和泛化能力 方面的表现优于其他三种算法。损失函数的平均值和最小值均是三种算法中最 小的,在分类准确率方面,平均值和最佳值也都是最好的。
2)反映适应度如何随迭代次数变化的适应度收敛曲线:如图6所示,相比之 下,DGBPNN的收敛速度是最快,它的收敛速度与DGEFNN接近。虽然两种 算法的收敛速度相近,但DGBPNN的适应度更小。在曲线位置上,DGBPNN 的曲线接近PSBNN,但收敛速度又比PSBNN快。由此结果表明DGBPNN在 解决红树林生态系统健康的预测训练模型上具有最佳性能。
Claims (8)
1.一种基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述方法包括以下步骤:
步骤X,建立红树林生态数据集;
步骤A,数据预处理,基于粒子群优化和信息熵的算法进行数据生成;
步骤A1,基于PSO算法的数据生成模块;
步骤A2,基于相对熵和余弦相似度的相似性评估模块;
步骤B,基于DGO算法进行模型训练,其模型包括种群,种群内包括若干个由质心和成员所组成的组;
步骤B1,组内合作,其用于成员更新,以组合适应度最大的成员并得出最优解,该成员更新包括正常更新和突变;
步骤B2,每一组的质心与其他组的质心进行通信;
步骤B3,每一组的成员随机与种群内的其他成员进行交叉;
步骤B4,在步骤B2和B3中,搜寻所述突变情况,基于该突变情况查出与此对应的成员,将该成员随机转移到其它组;
步骤C,结合BP算法和DGO算法配合步骤B进行前馈神经网络的训练。
2.根据权利要求1所述的基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述步骤C中的训练过程包括以下步骤:
步骤C1,基于DGO算法,通过组间通信和组内合作进行种群中每组内的个体成员之间适应度的计算,该计算是基于BP算法,其包括首先参数初始化,而后对其进行梯度下降训练,最后通过函数损失值的计算得出所述适应度;
步骤C2,基于步骤B4更新每一组的质心;
步骤C3,是否满足迭代终止条件,若是,则根据当前数据信息得出相关参数及适应度;若否,则返回步骤C1并依次重复前述步骤,直到满足迭代终止条件为止。
3.根据权利要求1或2所述的基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述步骤A2还包括计算种群内每个个体成员之间的适合度,并根据该适合度更新种群内的个体,同时得到最大适应度的个体,将其结果添加到数据集中,以此对数据集进行评估,该评估过程包括:
S1,将数据集编码为种群
P=(g1,g2,...,gn)
g=(x1,x2,...,xm)
其中,P为种群,g为种群中的组,n为设置的种群组数,m为组内个体的长度;
S2,通过PSO算法进行种群扩充,PSO中包括与其每一个个体对应的粒子,该粒子存在于d维空间中,在其种群扩充过程中,包括对粒子在该d维空间中的位置、速度和其经过的历史最优点位置,以及种群所经过的最优点位置,上述表达式如下:
粒子i的位置,xi=(xi1,xi2,...,xid),i=1,2,...,m;
粒子i的速度,vi=(vi1,vi2,...,vid),i=1,2,...,n;
粒子i经过的最优点位置,pi=(pi1,pi2,...,pid),i=1,2,...,m;
种群所经过的最优点位置,pg=(pg1,pg2,...,pgd);
其中,每个粒子以当前的位置和速度进行位置更新,所述更新公式如下:
t时刻到t+1时刻的速度,
t时刻到t+1时刻的位置,
其中,为当前粒子所经过的最优点位置,为当前粒子所经过的最优点位置,ω为惯性权重,c1c2为学习因子,r1r2为[0,1]之间的随机数;
S3,评估所扩充的新个体,其包括对相对熵和余弦相似度的计算,计算公式如下:
f(PO,PG)=fE(PO,PG)+fK(PO,PG)+fC(PO,PG)
其中,PO,PG分别表示原始的红树林生态监测数据和生成数据,f(PO,PG)表示相似度;
fE(PO,PG)=|H(PG)-H(Po)|
其中,H(PG)表示生成数据的信息熵,H(Po)表示原始数据的信息熵;
和分别表示PO,PG在第i位置的概率值;
PG(Xi)和PO(Xi)分别表示PO,PG在第i位置的值;
依次重复步骤S2和步骤S3,以配合所述步骤C3,直到满足迭代终止条件为止。
4.根据权利要求1或2所述的基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述步骤B1包括更新公式:
其中,xi,j,k表示第k代第i组的第j个成员,w是决定移动方向的权重,r为0到1之间的随机数,Ci为第i组的质心,Gbest为全局最优值,μ是服从μ~(0,s2)的随机数,s为步长。
5.根据权利要求4所述的基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述步长的计算公式如下:
其中,Γ为gamma函数,β为一个常数。
6.根据权利要求1或2所述的基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述步骤B2中每一组的质心与其他组的质心进行通信包括质心的移动,其质心移动采用Lévy随机游走,该Lévy随机游走的公式如下:
其中,α为其步长,表示第k代第i组的质心,表示一种entry-wise乘法,Lévy(λ)是一个服从Lévy分布的随机数。
7.根据权利要求1或2所述的基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述步骤B3还包括随机选择交叉算子和偏置随机游走算子,并以如下公式进行选择:
随机选择算子,
偏置随机游走算子,
其中,r是随机数生成器,Cr是交叉概率。
8.根据权利要求1或2所述的基于动态群优化算法的红树林生态健康预测训练方法,其特征在于,所述步骤C将MSE作为BP算法中的学习误差函数,其计算公式为:
DGO算法中的适应度计算公式为:
其中,表示第i个训练样本的第j个输出值,yi,j表示第i个训练样本的第j个期望输出值,n是训练样本的个数,m是输出维数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910612175.0A CN110334869A (zh) | 2019-08-15 | 2019-08-15 | 一种基于动态群优化算法的红树林生态健康预测训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910612175.0A CN110334869A (zh) | 2019-08-15 | 2019-08-15 | 一种基于动态群优化算法的红树林生态健康预测训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110334869A true CN110334869A (zh) | 2019-10-15 |
Family
ID=68143300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910612175.0A Pending CN110334869A (zh) | 2019-08-15 | 2019-08-15 | 一种基于动态群优化算法的红树林生态健康预测训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334869A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113571134A (zh) * | 2021-07-28 | 2021-10-29 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 基于骨干粒子群算法的基因数据特征选择方法及装置 |
CN116680637A (zh) * | 2023-08-02 | 2023-09-01 | 北京世纪慈海科技有限公司 | 社区居家老年人传感数据分析模型的构建方法及装置 |
CN118823589A (zh) * | 2024-09-18 | 2024-10-22 | 北京林业大学 | 一种人工林健康程度的监测方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0379436A1 (fr) * | 1989-01-20 | 1990-07-25 | CNRS, Centre National de la Recherche Scientifique | Dispositif et procédé d'arbitrage des requêtes et de résolution des conflits liés à l'accès aux mémoires à bancs indépendants pour les machines informatiques |
US20050031237A1 (en) * | 2003-06-23 | 2005-02-10 | Masato Gomyo | Hydrodynamic bearing device and a recording disk drive equipped with it |
CN1860211A (zh) * | 2003-08-01 | 2006-11-08 | 巴斯福植物科学有限公司 | 用于在转基因生物中产生多不饱和脂肪酸的方法 |
JP2008206421A (ja) * | 2007-02-23 | 2008-09-11 | Kansai Electric Power Co Inc:The | マングローブの生長予測システム、マングローブの植林適地判定システム、マングローブの生長予測方法、及びマングローブの植林適地判定方法 |
WO2013139889A1 (en) * | 2012-03-23 | 2013-09-26 | Omya Development Ag | Preparation of pigments |
US20140222398A1 (en) * | 2011-06-14 | 2014-08-07 | Florida State University Research Foundation, Inc. | Methods and apparatus for double-integration orthogonal space tempering |
WO2016094338A1 (en) * | 2014-12-09 | 2016-06-16 | Schlumberger Canada Limited | Sustainability screeing tool with gaussian plume model screeing module |
CN106446765A (zh) * | 2016-07-26 | 2017-02-22 | 重庆大学 | 一种基于多维生理大数据深度学习的健康状态评价系统 |
CN107817466A (zh) * | 2017-06-19 | 2018-03-20 | 重庆大学 | 基于堆叠受限玻尔兹曼机和随机森林算法的室内定位方法 |
CN109726705A (zh) * | 2019-01-24 | 2019-05-07 | 中国科学院地理科学与资源研究所 | 红树林信息的提取方法、装置及电子设备 |
-
2019
- 2019-08-15 CN CN201910612175.0A patent/CN110334869A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0379436A1 (fr) * | 1989-01-20 | 1990-07-25 | CNRS, Centre National de la Recherche Scientifique | Dispositif et procédé d'arbitrage des requêtes et de résolution des conflits liés à l'accès aux mémoires à bancs indépendants pour les machines informatiques |
US20050031237A1 (en) * | 2003-06-23 | 2005-02-10 | Masato Gomyo | Hydrodynamic bearing device and a recording disk drive equipped with it |
CN1860211A (zh) * | 2003-08-01 | 2006-11-08 | 巴斯福植物科学有限公司 | 用于在转基因生物中产生多不饱和脂肪酸的方法 |
JP2008206421A (ja) * | 2007-02-23 | 2008-09-11 | Kansai Electric Power Co Inc:The | マングローブの生長予測システム、マングローブの植林適地判定システム、マングローブの生長予測方法、及びマングローブの植林適地判定方法 |
US20140222398A1 (en) * | 2011-06-14 | 2014-08-07 | Florida State University Research Foundation, Inc. | Methods and apparatus for double-integration orthogonal space tempering |
WO2013139889A1 (en) * | 2012-03-23 | 2013-09-26 | Omya Development Ag | Preparation of pigments |
WO2016094338A1 (en) * | 2014-12-09 | 2016-06-16 | Schlumberger Canada Limited | Sustainability screeing tool with gaussian plume model screeing module |
CN106446765A (zh) * | 2016-07-26 | 2017-02-22 | 重庆大学 | 一种基于多维生理大数据深度学习的健康状态评价系统 |
CN107817466A (zh) * | 2017-06-19 | 2018-03-20 | 重庆大学 | 基于堆叠受限玻尔兹曼机和随机森林算法的室内定位方法 |
CN109726705A (zh) * | 2019-01-24 | 2019-05-07 | 中国科学院地理科学与资源研究所 | 红树林信息的提取方法、装置及电子设备 |
Non-Patent Citations (4)
Title |
---|
LEI ZHANG,等: "Estiination of Flow Patterns by Applying Artificial Neural Networks", 《IEEE》 * |
张汝波,等: "计算智能基础", 哈尔滨工程出版社 * |
杨绮雯,等: "基于改进PSR和灰色预测的湛江红树林生态系统健康评价", 《南方农业》 * |
邹庆红,等: "Study of Dynamic Group Evolution for Health Prediction of Mangrove Ecosystem", 《2019 8TH INTERNATIONAL CONGRESS ON ADVANCED APPLIED INFORMATICS (IIAI-AAI)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113571134A (zh) * | 2021-07-28 | 2021-10-29 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 基于骨干粒子群算法的基因数据特征选择方法及装置 |
CN116680637A (zh) * | 2023-08-02 | 2023-09-01 | 北京世纪慈海科技有限公司 | 社区居家老年人传感数据分析模型的构建方法及装置 |
CN116680637B (zh) * | 2023-08-02 | 2023-11-03 | 北京世纪慈海科技有限公司 | 社区居家老年人传感数据分析模型的构建方法及装置 |
CN118823589A (zh) * | 2024-09-18 | 2024-10-22 | 北京林业大学 | 一种人工林健康程度的监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110597240B (zh) | 一种基于深度学习的水轮发电机组故障诊断方法 | |
Li et al. | A survey on firefly algorithms | |
Zhu et al. | Coke price prediction approach based on dense GRU and opposition-based learning salp swarm algorithm | |
CN102496077B (zh) | 林业有害生物灾害预测系统和方法 | |
CN109829541A (zh) | 基于学习自动机的深度神经网络增量式训练方法及系统 | |
CN106503802A (zh) | 一种利用遗传算法优化bp神经网络系统的方法 | |
CN116542382A (zh) | 基于混合优化算法的污水处理溶解氧浓度预测方法 | |
Gill et al. | Training back propagation neural networks with genetic algorithm for weather forecasting | |
CN111371607A (zh) | 一种基于决策灰狼算法优化lstm的网络流量预测方法 | |
CN109214503B (zh) | 基于kpca-la-rbm的输变电工程造价预测方法 | |
Emami | Seasons optimization algorithm | |
CN117454124A (zh) | 一种基于深度学习的船舶运动预测方法及系统 | |
Xu et al. | A hybrid model of stacked autoencoder and modified particle swarm optimization for multivariate chaotic time series forecasting | |
CN110334869A (zh) | 一种基于动态群优化算法的红树林生态健康预测训练方法 | |
CN116468181A (zh) | 一种基于改进鲸鱼优化方法 | |
CN114154401A (zh) | 基于机器学习和观测数据的土壤侵蚀模数计算方法及系统 | |
CN117114915A (zh) | 一种基于改进粒子群算法的水产养殖ph值预测方法 | |
CN111144666A (zh) | 一种基于深度时空残差网络的海洋温跃层预测方法 | |
Beiranvand et al. | A systematic review of optimization of dams reservoir operation using the meta-heuristic algorithms | |
CN118536391A (zh) | 基于改进蜣螂算法的智能刀具磨损状态监测方法和系统 | |
CN115661546A (zh) | 一种特征选择与分类器联合设计的多目标优化分类方法 | |
CN115169215A (zh) | 考虑硝酸盐污染与海水入侵过程的多目标优化方法及系统 | |
Ma et al. | Optimized deep extreme learning machine for traffic prediction and autonomous vehicle lane change decision-making | |
Lu et al. | Dynamic evolution analysis of desertification images based on BP neural network | |
Guo et al. | Improved CS algorithm and its application in parking space prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191015 |