3.4 模糊逻辑与推理系统
模糊逻辑由加州大学伯克利分校计算机科学教授Lotfi A.Zadeh于1965年提出。从本质上讲,模糊逻辑(FL)是一种多值逻辑,它允许在常规评估之间定义中间值,如真/假、是/否、高/低等。“非常高”或“非常快”的概念可以用数学方法形式化和通过计算机处理,以便在计算机编程中应用更像人类的思维方式。模糊逻辑已经成为一种有利的工具,用于控制系统和复杂的工业过程、家庭和娱乐电子产品,以及其他专家系统和应用,如SAR(合成孔径雷达)数据的分类。
3.4.1 模糊集和清晰集
模糊系统的基本概念是模糊子集。在古典数学中,人们熟悉所谓的清晰集。例如,可能的干涉范围为0~1的所有实数的集合X。从该集合X可以定义子集A。A的特征函数(该函数为X中的每个元素分配数字1或0,取决于元素是否在子集A中),如图3-13所示。
图3-13 清晰集的特征函数
已分配编号1的元素可以解释为集合A中的元素,将编号为0的元素指定为不在集合A中的元素。此概念对于许多应用领域已足够,但很容易看出,它缺乏某些应用的灵活性,如当用于SAR遥感数据分析的分类时。
例如,众所周知,在SAR图像中,水表现出较低的干涉性γ。由于γ从0开始,处于这个集合的较低取值范围,因此上限范围很难定义。作为第一次尝试,可以将上限设置为0.20。因此,得到一个清晰的区间B = [0,0.20]。当γ值为0.20时,干涉性低,γ值取0.21时干涉性高。显然,这是一个结构性问题,因为如果将范围的上边界从γ= 0.20移动到任意点,则面临相同的问题。构建集合B的更自然的方式是放松干涉性高低之间的严格界线。这可以通过不仅允许清晰地决定是/否,而且允许设定更灵活的规则(如“相当低”)来完成。模糊集允许定义这样的概念。
使用模糊集的目的是使计算机更加智能化,上例中的所有元素都使用0或1进行编码,但模糊概念的方法允许0~1的更多值。
现在对分配给所有元素的数字的解释要困难得多。当然,分配给元素数字1仍表示元素在集合B中,0表示该元素肯定不在集合B中。所有其他值表示集合B的逐渐成员资格。例如,图3-14中,用隶属函数表示每个输入的参与程度。它将加权与处理的每个输入相关联,定义输入之间的功能重叠,并最终确定输出响应。规则是使用输入成员资格值作为加权因子来确定它们对最终输出结论的模糊输出集的影响。
图3-14 模糊集的特征函数
在这种情况下,在干涉测量相干的模糊集上操作的隶属函数返回0~1.0的值。例如,0.3的干涉相干值γ对于设定的低相干性具有0.5的隶属度(见图3-14)。
重要的是,需要指出模糊逻辑和概率之间的区别。两者都在相同的数值范围内操作,并具有相似的值:0表示False(或非成员资格),1表示True(或完全成员资格)。然而,两种陈述存在区别:对于图3-14中γ=0.3的情况,概率方法产生自然语言陈述,即“有50%的可能性是低的”,而模糊术语对应成员程度,即在干涉相干的低值集合内是0.5。两者语义差异很大:在概率中,人们认为γ或许不低,只是人们只有50%的机会知道它在哪个集合中;相比之下,模糊术语假设γ“或多或少”低,或者在某个其他术语中对应于0.5。
3.4.2 模糊集的运算
类似于清晰集上的操作,在模糊集中也有交集、并集和补集等操作。在关于模糊集的首篇论文中,Zadeh教授提出了两个模糊集合交集的最小算子和最大算子。可以证明,如果只考虑隶属度0和1,这些算子与清晰集的统一和交叉点重合[4]。例如,如果A是5~8的模糊区间,B是模糊数“大约4”,如图3-15所示。
图3-15 模糊集示例
在这种情况下,模糊集A和B的交集,如图3-16所示。
图3-16 模糊集的交集(AND)
模糊集A和B的并集,如图3-17所示。
图3-17 模糊集的并集(OR)
模糊集A的补集如图3-18所示。
图3-18 模糊集A的补集
3.4.3 模糊分类
模糊分类器是模糊理论的一种应用。其使用专家知识,并且使用语言变量以非常自然的方式表达,语言变量由模糊集描述。例如,极化变量Entropy H和α角度可以建模,如图3-19所示。
图3-19 语言变量
现在,这些变量的专业知识可以表达为类似的规则:如果H为高且α也为高,则Class = class 4。
规则可以在表calles规则库中组合,如表3-5所示。
表3-5 模糊规则库的示例
描述控制系统的语言规则由两部分组成:一个条件块(在IF和THEN之间)和一个结论块(THEN之后)。根据系统的不同,可能没有必要评估每个可能的输入组合,因为有些可能很少或从未发生。通常进行这种类型的评估,是由经验丰富的操作员完成的,由于他们可以评估更少的规则,因此可以简化处理逻辑,甚至可以改善模糊逻辑系统的性能。
使用AND运算符逻辑组合输入,以产生所有预期输入的输出响应值,然后将有效结论合并为每个隶属函数的逻辑和,计算每个输出隶属函数的输出强度。剩下的就是在去模糊化过程中合并这些逻辑和,以产生清晰的输出。例如,对于每个类的规则结果,可以导出所谓的单个或min_max干扰,也是相应集合的特征函数。例如,对于H = 0.35和α=30°的输入对,图3-20所示的方案将适用。
图3-20 干扰律:IF H very low AND α lowTHEN Class = class 1
所有规则的模糊输出最终聚合到一个模糊集。为了从这个模糊输出中获得清晰的决策,必须对模糊集或单个集合进行去模糊化。因此,必须选择一个代表值作为最终输出。有几种启发式方法(去模糊化方法),其中之一是取模糊集的重心(见图3-21),这种方法广泛用于模糊集。对于具有单体的离散情况,通常使用最大方法,即选择具有最大单体的对应点值。
图3-21 使用重心方法去模糊化
模糊逻辑提供了一种不同的方法来处理控制或分类问题。此方法侧重于系统应该执行的操作,而不是尝试模拟其工作方式。如果可能,人们可以集中精力解决问题,而不是试图以数学方式对系统进行建模。另外,模糊方法需要足够的专业知识来制定规则库、集合的组合和去模糊化。一般而言,对于非常复杂的过程,当没有简单的数学模型,并且具有高度非线性过程或要执行专家知识的处理时,模糊逻辑的使用可能是有帮助的。