模式识别两种方法:知识和数据

一:关于框架

       在第三版 张学工编著的 《模式识别》 第一章 概论里面第3页,1.3. 这样写着:模式识别解决问题的的主要方法是基于知识的方法和基于数据的方法两类;

       (每一个作者都希望自己的所见所闻是正确的,这也仅仅是希望而已。因为这个希望后面有更深层的东西,自己的成果,别人的敬重,以及多年辛苦树立的权威,以及科学技术人员不能决定自己命运和方向的自卑感。当然这不是学者的错误,因为每个人的知识只是知识海洋中的一滴)。

       基于数据的模式识别方法,是基于统计的模式识别。自从ML兴起,PR的方法看起来和ES没有太大区别,而ES看似更高一层, 专家系统抽取了语义描述,而基于数据的PR也没能逃出ES的框架。

       现在的模式识别陷入了分类的汪洋大海,至于哪种是模式哪种是特征已经难以区分。或许我们应该区分,行为模式,思维模式或许更高层次的模式才是重点,DL直接使用DNN,如果能产生更好的结果并突破限制,我们就会失去探索黑箱的机会,也将丢失重建知识体系和思维模型的欲望。如果我们需要的只是一个黑箱,我们需要的只是几何墨模型,而非代数规则,这并不是好一些人所期望的。

       模式识别是一种方法,而ES是一种框架。专家系统依靠专家获取规则,ML方法基于专家设定的规则获取规则。模式识别系统也是一种专家系统。

       而真正的AI的实现,靠方法是不行的,应该致力于更好的一种框架。


二:问题域渗透

       模式识别是AI实现的一种方式?当识别了一种模式,便陷入一种行为,模仿出决策过程。相似于触发器原理,非条件反射。

       控制系统才是最终的大头,一个一个 的决策形成繁杂的逻辑,需要一个顶层的控制系统来进行协调。



三:从语法到语义

       C++11最后一章,讲语言设计者接下来的任务:

               OOP方法的基本活动之一是 发明能正在模拟的情形(被称为问题域)的类。语言怎样的描述概念?如何构建强大而简洁的描述规则是着重考虑的问题。

       C++11:不仅是一种语言,更是一个由语法规则延伸到语义规则的桥梁。是否要把他们分开呢?

                由标准建类模型到标准语义模型进化,可实现在计算机内部的 智能基础吧


四:知识专家系统
       专家系统被称为基于知识的模式识别, 是一个基于知识的描述系统和基于知识的推理系统,一般要求语义完备性。知识被定义为语义的确定性语法描述,作为归纳的结果,知识一般是经验性的,局限性(概率正确性)。

        哲学上确定,外部原子系统是可遍历且可完备推理的。但现实的ND系统,由于观测者的系统映射描述局限性和接口局限性,以及遍历能力-计算能力,对于外部系统描述都解析为特定的粒度。

        粒度的大小和划分直接影响到专家系统的概率正确性及是否完备。

        1975年Minsky提出了框架结构,框架被定义为类的槽值集合,槽(slot)等同于对象的属性。一般说来,槽可以包含下列信息:

1、框架名;
2、和其它框架的关系;
3、槽值;
4、默认槽值;
5、槽的取值范围;
6、处理过程。通常有两种处理过程被附加到槽上:WHEN CHANGED和WHEN NEEDED。这样的处理过程被称为demon。
        基于框架的专家系统还通过facet的应用对槽-值结构体进行扩展。facet是提供关于框架属性的扩展知识的一种方法。一般来说,基于框架的专家系统允许我们向属性附加"值"、"提示"、和"推理"等facet。值facet指定属性的默认和初始值。提示facet让终端用户可以在和专家系统的会话里在线输入属性值,推理facet让我们可以在特定属性的值改变时停止推理过程。
        根据问题的本质将其分解成框架,进而分解成槽和facet。框架既可以表示类,也可以表示对象。通常对象直接有三种关系:泛化(a-kind-of或is-a)、聚合和关联。
        继承的缺点在于,基于框架的系统不能区分本质属性(该类必须具备的属性)和偶然属性(该类所有实例刚好都具有的属性)。由于在继承层次的任何地方都可以覆写属性,在多重继承时并不能表示把几个类组合在一起的概念。
       多数基于框架的专家系统里,也会使用规则,这些规则通常使用模式匹配语句。规则在方法调用时触发,比如WHEN CHANGED。


四:ML系统
       基于机器学习的专家系统被称为机器学习系统。机器学习专家系统有相似于知识专家系统的描述。ML系统仍然是一个定义系统,且是封闭的描述系统。

       得知知识的局限性之后,利用数学函数可描述的可学习模型取代专家构建概率知识可用于保持专家系统的完备性。ML专家系统从学习体系中抽取出一般概念,模式识别模型,特征,泛化能力,归纳学习,遍历和完备性。

基于类的ML系统模型:

1.类标签,描述为自然数N的子集;

      ML系统中所有的类可以标记为自然数集合N的真子集,是一个可数集合。在纷覆丛杂的ImageNet上,共有1860个图像类别。在WebNet上的集合,大致有200万个类别。

2.和其他类的关系;

    类的分层模型。参考林奈分类法的生物分类方法。

3.特征;

    类似于框架的槽值,类描述为特征的有序且有结构集合。

4.本征特征;

   能够在一个层次完全分离/区分两类的特征;

5.特征值区间;

   在定义系统内,特征的可取值范围。

6.特征/模式提取;

   对类的操作不仅包含了如何对类进行唯一性标记,即提取类特征;也包含了怎样对类的特征分布进行描述,即类的模式提取。


不同之处:

      根本在于系统构架上。专家系统一般要求固定的槽值,用于描述类和对象。而ML系统,则在合适的时刻可以对特征进行空间变换,进行特征变化和特征选择。

      此外,对于矛盾的处理:专家系统一般使用确定推理方式,在矛盾处进行对象分解,从更小的粒度重新解析矛盾,而ML系统则放松了模型要求,在一定的特征组合层面,满足PAC概率正确性即可。


 后记

      标准建类体系.....

      描述是认知的基础,感知和决策是基于描述的,AI的实现依赖于问题域的统一,基本要求是基于问题的描述方法统一。

  

原文地址:https://www.cnblogs.com/wishchin/p/9200277.html