APP下载

神经网络计算与VCR智能融合技术

2010-11-13叶球孙

湖南科技学院学报 2010年4期
关键词:极小值全局误差

叶球孙

(武夷学院 数学与计算机科学工程系,福建 武夷山 354300)

0 引 言

应用最广、结构简单、工作状态较稳定的BP网络,它无需建立系统的数学模型,只需借助于有限的样本数据就有很强非线性的映射能力。20世纪90年代末就有许多国内外学者进行过卓有成效的研究。BP网络的主要缺点是学习算法极易陷入局部极小值,很难获得全局极小值,并且其收敛速度极慢。若采用梯度下降算法,易使网络训练过程中时常出现麻痹和振荡现象。华中科技大学杨叔子院士等人曾提出了两种相应的改进算法,即快速算法和全局最优求解法[1]。

1.进算法

1.1.速算法

对一个3层BP网络

1.2.局最优算法

鉴于BP网络学习算法极易陷入局部极小值,以及具体实施时参数αη、选取靠实验的经验性,尽管模拟退火和遗传算法能在一定程度上克服一些缺陷,但如何得到新的搜索状态,确定新状态的拓扑特征数据或共性条件(标准),如确定退火温度下降过程尚存在众多能否正确指导实践的理论问题。所以,能否找到一种明确的理论指导依据,需要比较规范的应用步聚、较高学习效率等,是保证得到全局最优解的BP网络学习算法。杨院士等人曾提出的全局最优解法的基本思路是:先建立一个比较合理的BP网络误差度量函数E(ω),再利用当时求E(ω)总体极值较成熟的方法,得到ω值,进而完成BP网络的学习过程。为此,其考滤了一个合适的误差函数

使用蒙特·卡罗(Monto-Corlo)的方法来计算Uk[ E(ϖ) ,Ck],与传统方法比较,不存在局部极小值问题,也不存在由于η,α等参数选择不当而导致振荡不收敛问题,更不需要大量经验和实验才能确定的问题,一旦写出误差函数,便可在计算机上求解,也有实例[2]说明了此方法的有效性。

图1.

2.进制(VCR)数值计算技术

数(N,Numbers)就是人类用以描述各种客观物质量值多少或物质现象发生频率高低的量化的抽象概念。比如,可以这样描述说:1条鱼,2吨水,3场大火,4回声响,5个城市,6次洪灾,如此等等。人类社会[3]发展早期,大多数采用了离散计数制(DCR,Dispersed Computation Rules)的方法来描述客观物质量值的多与少或物质现象发生频率的高与低,即采用一些离散的标志物(小石子、小黄豆和小绿豆之类)或标志符(1、2、3…,A、B、C…,克、公斤、市斤、石、吨,星期、打数,如此等等)来表示不同物质的量值或物质现象发生的频率。一个不曾上过学堂而无文化底蕴的牧童清点他的羊群时,可以用1粒小石子表示5只羊,1粒小黄豆表示5粒小石子(25只羊),1粒小绿豆表示5粒小黄豆(75只羊),如此等等。由于标志物保持有困难或标志符共识有障碍,在不同的国家和地区难以推广普及,DCR渐被淘汰,但不同标志物或标志符之间的倍乘关系却是后来得以推广普及的进位计数制(CCR,Carrying Computation Rules)思想的萌芽和基础。使用CCR来表示的数就称为进制数(CCN,Carrying Computation Numbers),或简称为数(N)。

1995年叶球孙[4]提出CCR两个重要研究分支:恒进制(FCR,Fixed Carrying Rules)和变进制(VCR,Variable Carrying Rules);用FCR表示的数称恒进数(FCN,Fixed Carrying Numbers),用 VCR表示的数称变进数(VCN,Variable Carrying Numbers);FCR是VCR的特例,VCR是FCR的拓展。FCR计数换算规则是:在同一进制数中,相邻即位数字进退换算关系恒守“同一”规则,即位数字模(FM,Figures’ Module)均等,如十进数(D,Decimal numbers)恒守“逢十进一,借一当十”规则,二进数(B,Binary numbers)恒守“逢二进一,借一当二”规则,八进数(Q,Octonal numbers)恒守“逢八进一,借一当八”规则,十六进数(H,Hexadecimal numbers)恒守“逢十六进一,借一当十六”规则,如此等等。VCR计数换算规则是:在同一进制数中,相邻即位数字进退换算关系不守或不尽守“同一”规则,如表示日期时间量纲单位不同的年、月、日、时、分和秒:60秒=1分,60分=1时,24时=1天(日),30天(月大)或31天(月小)=1月,12月=1年;中国古历(农历或阴历)含润月的年称润年,不含润月的年称平年,30天(月大)或29天(月小)=1月,13月=1润年,12月=1平年;公历(阳历)平年的二月=28天,非平年的二月=29天。此外,7天=1星期,10斗=1石,1000克=1公斤,1000公斤=1吨,12=1打……,诸如此类,均是地地道道的不恒守“同一”计数规则的变进数(VCN)。

2.1.进制FCR特性及其计算

2.1.1.模性(SFM,Same FM)

FCN中任意位上即位数字的模iFM 均等,即

2.2.进制(VCR)特性及其计算

2.2.1.拓性与压缩性(E&C)

如觉得10个阿拉伯数值字符不够用,还可将26个英文字母 A,B,C,…,X,Y,Z等半角字符拓展表示为10,11,12, …,33,34,35等数值,即可取FMi∈{2 ,,34,35,36},将可得到 2-36任意进制的VCN(含2-36进制的FCN)。所以VCR中使用的 F Mi是可以任意向上拓展(Extensive)的,这就是 VCR变化潜力无限的可拓性(E,Extensibility )。当相同数值大小的数由低进制向高进制转换时,其数据的外在表示形式可以得到压缩(字符数减少),从而节约不少计算机内使用的存储空间,因而其数据的表示是可压缩(Compressible)的,这就是VCR施尽魔力的可压缩性(C,Compressibility)。因其表示信息容量存储既是可拓(Extensive)的,其容量溢出特性又是可变的,称其为容量的变溢性(VCO,Variable Capacities of Overflowing)。

2.2.2.糊性与保密性(F&PKS)

VCN 中任意位上的权值(简称权)为其系列相邻低位即位数字模的卷积(连乘积值),其外表组合排列数字的数值大小也是难以精确估算而模糊的,颇具模糊性, 外在数据表示的数值大小模糊性越强,其对外保密性就越好。故VCR构成VCN的模糊性(F,Fuzziness)和保密性(PKS,Properties of Keeping a Secret)的呈现是连成一体的。

2.2.3.能性与设密性(I&PMS)

n位VCN中相邻位即位数字 ( Figures)间的进退换算规则(VCR)既是可以事先人工智能[5,6](AI,Artificial Intelligence)地设定的,又是可以不为人知晓而隐蔽的。所以,VCR构成该数的精确换算关系是智能性(I,Intellectuality)的,也是权限性(PMS,Properties of Making a Secret)的[7]。VCR中嵌入AI特性而设置成模糊的变进数称智能模糊变进数(AI-Fuzzy VCN),简称智模数(IFN)。

2.2.4.CN数值计算公式(VNC,VCN formula of Numbers’ Computation )

设DVCN=Fn−1Fn−2F1F0.F−1F−2F−m+1F−m为一个任意n位整数和m位小数的任意 ( ri+1)进制的变进制实数,则有

3.模数(IFN)抗扰动特性及其实现

根据VCN可嵌入智能设置VCR特性,IFN既可以将常用十进数D转换为2≦FM<10的任意低模(基)值FCN或VCN,又可以转换为FM>10的任意高模(基)值FCN或VCN。数学家可以保证:任何一种FCN或VCN均可以用来准确描述任意物质量值的大小或多少, 任意循环或非循环的数也均可用某种逼近的分式,或开奇偶次方根函数,或其它数学函数诸如各种插值/分段函数法来较精确地描述。

但是,在高频数学运算(加、减、乘和除等)过程中,一旦出现任意循环数(如1/3,2/3)或非循环数(如圆周密率π值)的中间结果(数据),导致最终运算结果的数字扰动的误差,将不可避免。IFN中可通过智能动态改变FM的值来消除某些循环数[8],如:79.625=1001111.101B=117.5Q=4F.AH=(304.3030…)5=(261.343)6,将 79.625转换为FM=5的五进数时出现了2位无限循环体小数30,为消除运算过程中新增的数字扰动,可取FM≠5的其它值。

4.经网络计算与VCR智能技术的融合

4.1.络层节点计算与VCR中FM设置

一个3层BP网络:其输入层、隐含层(或称为内部存储的记忆层[9]或中间层)和输出层可以用一个3位VCN来模拟表示。输入层表示最低位(或最高位),记忆层表示次低位(或次高位),输出层表示最高位(或最低位);每层网络节点数分别用来表示该 VCN 三个即位数字的模FMi(i =0,1,2);输出层就是输入层和记忆层这二维复杂性节点为自变量的复杂函数(Sigmoid)。该函数计算的复杂度受输入层节点采样优先级别决定因素和中间层节点数据处理技术影响。输入层节点采样优先级别梯度值越大或越陡峭,以及中间层节点数据处理技术越先进(即访问数据节点数尽可能少,但以不丢失目标节点为前提),则该算法实现速度越快。

4.2.局最优算法与VCN中NM设定

BP网络学习算法极易陷入局部极小值,参数η、α选取又普遍受制于实践经验性,能否找到一种创新实用的方法来指导实践,需要建立一种数学模型、计算实现可行性等,才是保证得到全局最优解的BP网络学习算法。杨院士等人曾提出的全局最优解法,是建立一个比较合理的BP网络误差度量函数E(ω),利用当时求E(ω)总体极值较成熟的逐步逼近法得到ω值而完成BP网络算法过程。其误差度量函数E(ω)的求解,是由FCN实现的,并较高频率地用到了加、减、乘、除和乘方等数学运算来逐步逼近,新增数字扰动误差不可避免。

VCN中任意即位数字 ( Figures)权值为其相邻低位系列 F Mi的卷积值,n位VCN进制数的模值NM即为宽度优先搜索状态树的全部节点数:含已拓展或可拓展的所有枝节点和叶节点。当修改 F Mi值而做剪枝技术处理时,必须以不丢失目标节点为前提;当修改 F Mi值而做接枝技术处理时,须以不增加伪目标节点数和较高时间复杂性为条件。

5.束语

BP神经网络算法改进研究的终极任务,就是如何规避学习算法陷入局部极小值、找回全局极小值和降低搜索算法时间复杂性。一个拥有输入层、记忆层和输出层而普通3层BP网络节点路径的快速算法及其全局最优算法的实现,尤其是在计算机上求解实现,将会遇到或极可能遇到诸多可预知和不可预知的影响成功实现的决定因素。如想要得到较快的搜索算法速度,就必须设法减少访问数据集的网络节点数,但有时又与不能轻易丢失目标节点的初衷相互矛盾;要想得到全局最优,就必须设法条件增加访问数据集的网络节点数,但有时又会极大地增加了搜索算法时间的复杂性(让计算机上难以实现)。即便是算法时间复杂性增加后计算机上也可以接受(即仍可实现算法),但有时也会莫名地增加不少伪目标节点数,故尚须继续做“去伪存真”的筛选算法工作。如去伪存真的筛选工作没有到位,所得到的全局最优也就自然可能陷入局部最优即局部极小值中去了。杨叔子院士等人提出的改进算法,即快速算法和全局最优求解法,是先建立一个比较合适的BP网络误差度量函数 E(ω)后,使用蒙特·卡罗(Monto-Corlo)法来计算Uk[E(ω),Ck)],与传统方法比较,不存在局部极小值问题,也不存在由于η,α等参数选择不当而导致振荡不收敛问题,更不需要大量经验和实验才能确定的问题,即可在计算机上求解,有效性不错,但较精确度量的网络误差函数 E(ω)的写出有时比较费劲,而且用传统的FCN来计算E(ω)还会带来一定的数字扰动误差。

本文提出以AI-VCR计算技术揉合进BP网络快速算法和全局最优算法,不失为一种创新实用的技术尝试,用创新的VCN计算技术来实现3层BP网络的快速算法和全局最优,可设法将其数字扰动误差逼近为零。

[1]杨叔子,廖晓昕,史铁林,等. 神经网络若干理论和应用问题的研究[R],1997中国神经计算科学大会论文集(一)[C]. 北京:人民邮电出版社, 1997, 10.

[2]徐宜桂.结构动态智能诊断及其可靠性评估研究[D].华中理工大学博士论文.

[3]Ye Q. S. VCN & Its Role of Engineering in Human Society [J], Engineering Sciences (The Chinese Academy ofEngineering/EnglishEdition/Quarterly),2008,6(1):23-31.

[4]Ye Q. S. Research & Application on The Variable Carrying Numbers [A], IEEE International Conference on Neural Networks & Signal Processing [C]. ICNNSP’95,Nanjing, China, 1995.

[5]吴文俊, 计算机时代的脑力劳动机械化与科学技术现代化[R], 第 10届中国人工智能学术大会(CAAI-10)特邀报告,中国人工智能进展[C],北京:北京邮电大学出版社, 2003.

[6]傅京孙, 蔡自兴, 徐光礻右 等.人工智能及其应用[M].北京: 清华大学出版社, 1988.

[7]叶球孙.智模数(IFN)在密码科学中的研究及应用[J],中国工程科学(中国工程院院刊),2008,10(5): 51-58.

[8]叶球孙.基于 VCN智能技术的除法精确运算[J],南平师专学报,2006,(2): 43-47.

[9]叶球孙.基于AI-VCR特性工业动态测试计量技术的实现[J],湖南科技学院学报,2009,30(8): 147-150.

猜你喜欢

极小值全局误差
Cahn-Hilliard-Brinkman系统的全局吸引子
量子Navier-Stokes方程弱解的全局存在性
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
一道抽象函数题的解法思考与改编*
构造可导解析函数常见类型例析*
压力容器制造误差探究
落子山东,意在全局
极小值原理及应用
基于庞特里亚金极小值原理的多运载体有限时间编队控制