对自然现象分类的量化解析
葛维亚
大千世界千奇百怪,三界五行各有千秋。发生的现象纷繁复杂,头绪繁多。例如自然现象按照产生机制不同,大致可以划为物理现象﹑化学现象,生命现象,地理现象等几大类;而就物理现象分类,可分为地球現象 (4个分类, 14个页面)、傳輸現象 (4个分类, 7个页面)、光学现象 (1个分类, 35个页面)、多普勒效应 (3个页面)、恆星現象 (1个分类, 64个页面)、电现象 (6个分类, 19个页面)。如此等等,要就不同类别、机理、成因等来分类梳理,没有几千种,也有几百种。 从因果关系角度对自然现象的分类就变得比较单一,比较概括和抽象。自然界只存在着确定现象、随机现象和模糊现象三大类。这里仅从工程人员的数学物理角度,而不是单一纯数学角度,对自然现象分类,作量化认识。 现象的因果关系,可以定义如下:
Z=Z(Xi=1-i,PX i=1-i , μA(x) (1)
式中: Z为表示结果的广义依变量, Xi=1-i为表示原因的i个广义自变量(i为正整数,且1≤ i <∞),PXi=1-i 为X概率, μA(x)为隶属函数。
确定现象 确定现象(即必然现象)可以理解为确定的因果关系。即某些特定原因必定导致某种唯一的后果,原因和结果都是确定的。重复的结果,不存在不确定性。这是事前可预言的现象,即在准确地重复某些条件下,它的结果总是肯定的。例如物理学中力学、运动学、动力学等等现象均属于必然现象。其中的定律、公式定量上准确表达了这些现象。 对于确定现象而言, (1)式中PX i=1-i=1 , μA(x)=0,Z=函数Y,Xi=1-i=X,因此它们之间关系的表达式为:
Y=f(X) (2)
这种关系为数学上的函数关系,(2)式满足了确定现象数学表达的必要而充分条件。在函数关系情况下,X与Y的相关系数Φ=1。很明显,(2)式为(1) 式的特例。利用(2)式通过解析、演绎就可以得出想要的结果。同时PX i=1-i=1 , μA(x)=1,这表明确定现象与其他现象的排斥性。 描述与表达确定现象的数学工具,我们一般都比较熟悉,有算数、代数、几何、三角、解析几何、线性代数、微积分、微分方程、数学物理方程等。在水文领域内,多用于研究水循环、水资源、水量平衡、槽蓄曲线、流域产流、汇流、流域确定性数学模型等诸多课题。
随机现象 随机现象是原因中至少有一个预知,而又无法搞清全部原因的事前不可预言现象,它的结果总是未知的。即在相同条件下重复进行试验,每次结果未必相同,或知道事物过去的状况,但未来的发展却不能完全肯定,也就是随机现象中是指事件的结果不确定。例如:以同样的方式投掷骰子时,出现1-6点的哪一点,事先并不知道;一个流域未来每年降水量上是多少不知道 ;一场降雨在流域上产生的径流也不知道。随机现象与确定性现象的共同特点是事物本身的含义确定,区别在于确定性现象的结果具有唯一性,而随机现象当结果具有不确定性。 对于随机现象而言, (1)式中, PXi=1-i=1 , μA(x)=0,Xi=1-i标识为X ,因此它们之间关系的表达式为:
Z=Z (X) (3)
这种两变量的关系为相关关系,X与z的相关系数 0≤ Φ< 1。很明显,(3) 式也为(1) 式的特例。(3)式满足了随机现象数学表达的必要而充分条件。 在z的不确定性情况下,我们常常以它的数学期望值(数学平均值)x̄ 作为不偏估值在实际应用中使用。在概率分布函数相同时,Z 的条件概率P(z/x) i=1-i为定值,而对于正态分布则P(Z/X) i=1-i=0.5)。 从形式上看,(3)式与(2) 几乎相同,实际上(3)式表达的是相关关系,而非函数关系。它与函数关系的相同点是自变量是确定的,不同点是得到的依变量是不确定的。如果以数学平均值x̄作为标准,其误差在±σ(σ为标准差)区间的概率为68.3%;落入±2σ和±3σ区间的概率分别为95.4%和99.7%。许多行业把|3σ|看作最大误差,在考虑实际情况和不同技术领域要求,以此作为参考,确定规范中的允许误差。
鉴于随机现象是由世界中无限多的影响因素造成的,它的本质是世界的无限性。由于任何实数都可以无穷多分解,成为无穷多个无限小份。用数学式表示为: 任何实数=无穷大×无穷小, 即
a= ? × δ (4)
如果将a限定为事件的概率P, 即
P= ? × δ (5)
也就是说P的取值在无穷因素的作用下,任意获得,只是取得机会并不完全一样。这说明无限性,产生随机性。理解该结论时,可以把无穷大看做外部因素,无穷小看做内部因素。因为世界无穷大,所以任何一个存在都受到无穷可能的外因。而任何一存在可以无穷分解,所以也有无穷内因。 如果把概率P定义为P=P(x≥xi ),这就是水文水资源分析计算中经常使用的概率,水文界称为频率。则设计频率Pp= P(x≥xp),此处xp为设计值,Pp为设计频率,1/Pp 为重现期。水文水利规划设计的一项重要使命,就是根据有关规范确定的水利工程设计标准Pp或校核标准Pc,推求有关的设计值xp、xc。 描述与表达随机现象的数学工具,我们一般比较陌生,主要数学工具为概率论、数理统计、条件分布、随机过程。概率论与统计学将数学等应用从必然现象扩展到随机现象。水文业界属于概率论、数理统计使用较多的部门,对它们也比较熟悉。例如在水利水电防洪、发电、除涝、灌溉、航运,城市排水、水质评价和水资源评价中,设计标准的确定和设计值计算推求,均与概率论、数理统计有关。这种利用实验或实测获取的一组数据,例如同一河流断面每年的一次最大年降水量,或每年洪峰流量,被看作是总体序列中被随机抽取的一个容量为n的样本。 水文水资源频率计算中,P与线型及其相应的统计参数有关。在线型已经确定情况下,表达为P= f(γ1,γ2,γ3,………,γi) ,i=1-n, γi为i阶矩。水文现象为随机现象,其随机变量分布曲线的线型也是未知的。凭借实测资料(即样本资料)得知,水文要素的频率分布不是高斯正态分布(或物理上的白噪音分布),而是偏态分布。长期以来凭借职场专业人员的经验、通过试验模拟、统计检验等论证,主流线型接近不完全Γ分布(这是一组曲线族),p-Ⅲ型就是这个大家庭的一员。确定这一曲线的的统计参数取为三个,即一阶矩数学期望值(平均值)x̄,二阶矩变差系数cv 与三阶矩偏态系数 cs。 根据大数定律,样本容量n越大,即用于计算的资料年限越长或次数越多,随机误差越小,计算得出的不偏估值越接近总体真值。从矩法解析中得知,矩的阶数越高,随机误差越大。归纳起来水文统计中参数的随机误差与样本容量、矩阶数、代表概率分布曲线估值的频率曲线线性型等三个因素有关。目前许多教科书和文章里,把Γ分布和皮尔逊Ⅲ型分布曲线,作为两种独立的线型加以介绍,这是一种误解。因为皮尔逊Ⅲ型分布曲线就是不完全Γ函数的一个特例而已,它是Γ分布曲线族当中的一个。此外,在水文资料短缺流域,也经常通过相关分析与计算,建立各种水文要素之间的经验公式、等值线图、综合单位线以及水文单值化处理计算中落差系数和指数的推求,也会经常使用渐消记忆的最小二乘法、线性逐步回归、最优化方法(确定合理的目标函数、优选范围和精度要求是关键)等数学工具。这一切都要求数学和人的经验相互配合。
模糊现象 日常生活里,模糊现象随处可见。人们在思维上、语言上、行为上、文章和书籍里,对大小、长短、粗细、厚薄、高低、轻重、缓急、冷热、强弱、好坏、悲喜、爱恨、丰枯、旱涝、年青与年老、情绪稳定与情绪不稳、健康与不健康等所表达的观点都是模糊的,因为对于它们的判断都没有明确的内涵和外延,只能用模糊集合来描述。再以水库调节径流为例,水库来量大时,为了下游防洪安全,水库要多蓄水;水库来量小时,为了下游灌溉、航运、生活及工业用水的要求,水库要多放一些水。但怎么蓄,何时蓄,怎么放,何时放,几乎处处存在着模糊观念。在没有引入模糊数学前,只能按照技术人员的专业和操作规则进行控制,实现人的要求和愿望。 模糊现象属于事物本身的含义不确定的现象。它与随机现象的共同特点是不确定性,而模糊现象是指事物本身的定义不确定。模糊数学则将数学的应用范围从清晰确定扩大到模糊现象的领域。 日常生活里,受传统思维的影响,把“模糊”看作是糊涂、肤浅、无能的代名词。模糊论创始人,美国L.A.扎德教授曾经有句名言:“模糊不是罪过”。模糊论的出现是数学领域一次革命,使数学的应用跨入一个更高,更新,更有作为的领域。 在多变量、非线性、时变的大系统中,复杂性与精确性形成了尖锐的矛盾。复杂性意味着因素众多,时变性大,其中的某些因素及其变化是人们难以精确掌握的,而且人们又常常不可能对全部因素和过程都进行精确的考察,而只能抓住其中主要部分,忽略掉次要部分。这样,在事实上就给对系统的描述带来了模糊性。模糊数学用精确的数学语言去描述模糊性现象,它代表了一种与基于概率论方法处理不确定性和不精确性的传统不同的思想,不同于传统的新的方法论。 模糊概念不能用普通集合来描述,原因在于不能绝对地区别“属于”或“不属于”,而只能表示属于的程度,就是论域上的元素符合概念的程度不是绝对的0或1,而是介于0和1之间的一个实数。模糊数学是运用数学方法研究和处理模糊性现象的一门数学新分支。模糊集合、模糊逻辑、模糊数学模型等都是模糊数学的重要内容。它以“模糊集合”论为基础。模糊数学提供了一种处理不肯定性和不精确性问题的新方法,是描述人脑思维处理模糊信息的有力工具,把模糊论应用于决策研究,形成了模糊决策技术,风险评估等,用途极为广泛。 对于模糊现象识别与判断而言, (1)式中的X可理解为为论域模糊子集的元素或特征因子集{ x },即X ∈U(U表示某一论域模糊子集,对于X的全部子集F(x)而言,从模糊数学得知,PF(x) = ∫u μA(x)dp,如果μA(x)和f(x)是实数域上可积函数,则PF(x) i=1-i= ∫u μA(x) f(x)dx=P(x, μA(x)),另外,对于迷糊现象。(1)式中的PX i=1-I 变为PF(X),此时由(1)变形得到的模糊现象表达式为:
Z=Z(F(x),μA(x) (6)
上式中,0≤隶属度μA(x) ≤1,Z为模糊判别获得的结果。
模糊计算可以分四个部分:模糊规则库,模糊化,推理方法和去模糊化。模糊规则库是专家提供的一些规则。模糊化是根据隶属度函数从具体的输入,得到对模糊集隶属度的过程。推理方法是从模糊规则和输入,对相关模糊集的隶属度得到模糊结论的方法。去模糊化就是将模糊结论转化为具体的、精确的输出过程。以此得到模糊计算的结果。模糊计算的流程为:开始→输入变量→将输入变量模糊化→利用相关模糊规则获得结论→将结论去模糊化→输出明确的结果→结束。 模糊数学包括模糊集合、模糊拓扑学、模糊群论、模糊图论、模糊概率、模糊语言学、模糊逻辑学等很多内容。对于非数学专业来说,使用比较广泛的是模糊识别判断以及与解决本专业有关的实际问题。模糊评价是模糊数学入门和基础。 模糊评价(识别判断)计算基本内容如下: A研究对象特性指标的抽取,并加以量化。也就是根据实际问题选用特征因子集(即对象因素集) X={X_1, X_2, …, X_n }及每个特征因子集的评判集V={V_(1,) V_2, …, V_m }以及权重子集w(w1,w2…,wc)。 B 建立或选用现成的研究对象隶属函数数学模型μA(x)。依据研究对来确定隶属函数的确定过程,目前尚无一个完全客观的评定标准。
在许多情况下,常是初步确定粗略的隶属函数,然后通过“学习”和时间检验逐步修改和完善化,而实际效果正是检验和调整隶属函数的依据。模糊统计是确定隶属函数的一种主要方法,它需要做大量的试验,因此工作量是比较大的。其中一种方法是隶属函数要直接从给定问题的描述集合出发,利用上、下近似集逼近描述对象,通过信息简约求得最简信息。也可以利用其他优选方法,使它可以从众多相关属性中优选出相关度最高的属性,因而大大简化计算的工作量。模糊数学评价法中,标准等级是一个范围,但是隶属函数的建立需要一个确定的等级值,这一点必须重视。根据定义,我们知道所谓模糊集合,实质上是论域U到 上的一个映射,而对于模糊子集的运算,实际上可以转换称为对隶属函数的运算。
根据隶属函数及元素x,统计或运算求得隶属度μA(x=xk),所谓隶属度是指各种已知性能评价指标隶属于特定的评价等级的概率, 它反映了表征命题的真伪程度。以此选用合适的几个特征因子。确定经反复修改后的特征因子集(即对象因素集)X ,由X和V构成m个指标特征向量。
依据第C步中最后确定的特征因子集 X与指标特征向量,得到特征因子集m×n阶指标特征值矩阵,其中为了在识别时要先消除指标特征值量纲的影响,使指标特征值规格化,即将指标特征值矩阵变换为指标特征值的相对隶属度矩阵。为了在识别时要先消除指标特征值量纲的影响,使指标特征值规格化,即将指标特征值矩阵变换为指标特征值的隶属度矩阵。再将n个特征因子样本依据样本的m个评判指标,按c个级别(或类别)权重加以识别,建立其模糊识别矩阵,通过各种模糊子集的运算得出明确的单项和综合评价结果。这在模糊模识别中是一种常用的方法之一。其他的方法还很多。运算过程是利用最大隶属度原则或贴近度原则对被识别的对象进行归属判决。同样,在模式识别的具体应用中,关键仍是对象的模糊集合的构造,建立刻画模式或刻画模式或对象的模糊集合。根据实际应用来看,通常使用简单模式的识别方法,语言模式的识别方法和统计模式的识别方法,其中模糊优选有其独特优势。
附录:模糊数学在水文水资源应用的有关论文
模糊数学在水文行业管理中的应用; 区域水资源承载力的模糊综合评价分析方法及应用 ; 湖南省水文系统人力资源分析与研究 ; 水污染的工程风险分析; 模糊数学模型在水资源价值评价中的应用*; 水资源短缺风险管理理论与实践 ;水资源管理模型中的气候变化不确定性模拟 ;中长期水文预报方法 ;水资源与防洪系统可变模糊集理论与方法; 水库汛限水位确定方法评述与展望 ;区域水资源价值模糊综合评价 ;模糊数学方法在水质评价中的应用 ;我国水资源配置模型研究现状与展望 ;建立水文水资源水环境管理系统; 模糊综合评价方法在桥涵水文计算中的应用研究 ;模糊数学在水库调度中的应用 ;模糊数学在梯级水库防洪调度决策 ;水库防洪调度风险分析 ;水库群系统防洪联合调度研究进展 ;水库群供水调度预警系统研究及应用 ;水电站水库群模糊优化调度模型与目标协调;水库运行调度; 水电站调度的模糊控制模型; 梯级水电站优化调度 ;水库群供水调度预警系统研究及模糊风险分析应用于大坝安全的研究; 无资料地区洪水计算与不确定性研究 ;模糊模式识别迭代模型及在优选水电装机中的应用。