油气大数据分析 第一章 软计算基础(第二、三节)

1.2. 从柏拉图到亚里士多德的进化

  亚里士多德敏锐的逻辑支撑着当代科学。亚里士多德学派基于二元视角进行观察,例如黑白、是与否、0119世纪数学家乔治·康托(GeorgeCantor)建立了基于亚里士多德二元逻辑的集合论的发展,从而呈现了这一点符合现代科学的逻辑。概率论随后影响了二元逻辑的合理性和可行性。德国人的理论将集合定义为确定的和可区分的对象的集合。

  整个中世纪欧洲的物理科学都受到亚里士多德观点的深刻影响,并将其影响扩展到文艺复兴时期,最终被牛顿物理学所修正。和他的老师柏拉图一样,亚里士多德的哲学也以普遍为目标。而亚里士多德则在特定事物中发现普遍性,他称之为事物的本质,而柏拉图则发现普遍性存在于特定事物之外,并作为原型或范例与它们联系起来。因此,对亚里士多德来说,哲学方法意味着从对特殊现象的研究上升到对本质的认识,而对柏拉图来说,哲学方法意味着从普遍形式(或观念)的知识下降到对这些特定模仿的思考。从某种意义上说,亚里士多德的方法既是归纳的又是演绎的,而柏拉图的方法本质上是从先验原理演绎出来的。

  如果您仔细研究拉斐尔题为梵蒂冈使徒宫中的雅典学院的壁画的中心,您会注意到左侧的柏拉图和亚里士多德是两个无可争议的关注主题。流行的解释表明,他们在不同维度上的姿态表明了他们各自的哲学。柏拉图垂直指向,呼应他的形式论,而亚里士多德则沿着水平面伸出手臂,代表他通过经验观察和经验对知识的信念。

  亚里士多德的逻辑定律深深地植根于古代世界的科学家和哲学家辛勤培育的肥沃的希腊景观中,给科学带来了沉重的负担。他的法则牢牢植根于“X”或“not-X”的根基上有些东西是或不是。当我们对事物进行分类或对事物做出判断时,传统的布尔逻辑会影响我们的思维过程,从而丢失了介于01或真假的经验极端之间的精细细节或过多的可能性。

1.3. 描述性和预测性模型

  数据挖掘有两个不同的分支,预测性和描述性/探索性(图1.2),可以将原始数据转化为可操作的知识。有时您会听到这两个类别,称为定向(预测性)和非定向(描述性)预测模型使用已知结果来开发(或训练或估计)可用于预测不同数据值的模型。描述性模型描述了可能在新数据中发现的现有数据中的模式。对于描述性模型,没有您要努力预测其值的目标变量。当模型在现实环境中运行时,大部分大收益都在预测建模中。

 

1.2原始数据转化为知识的分析生命周期

 

  描述性建模涉及聚类或分段,本质上是将类似的事物(例如井、岩石力学或水力压裂策略)混为一谈。关联是表现出统计相关性的两个测量量之间的关系。

  描述性建模技术涵盖两个主要领域:

  1. 聚类
  2. 关联和序列

  聚类或分数据的目的是将对象放入数据建议的组或集群中,这样给定集群中的对象在某种意义上往往彼此相似,而不同集群中的对象往往不同。术语关联暗示了一种广泛的关系,而不是更有限的相关性,后者指的是两个数量之间的线性关系。因此,在量化O&G中的参数值时,总是采用术语关联来强调明显关系中的非因果关系。

  预测建模有两种形式:

  1. 预测类别成员的分类模型
  2. 2.预测数字的回归模型

  本书详细介绍了四种主要的预测建模技术,作为重要的上游O&G数据驱动分析方法:

  1. 决策树
  2. 回归
    1. 线性回归
    2. 逻辑回归
  3. 神经网络
    1. 人工神经网络
    2. 自组织映射(SOM)
  4. K-means聚类

  决策树因其固有的易于解释而流行。此外,它们可以很好地处理缺失值,为充满缺失值的数据提供简洁有效的解释。决策树算法相对于其他建模技术(例如神经网络方法)的优势在于,它生成的模型可以表示可解释的英语规则或逻辑语句。例如:

    如果月产油与产水的比率小于28%且石油产量呈指数下降且OPEX大于100,000美元,则对井进行增产。

  通过回归分析,我们对预测一个数字感兴趣,称为响应或Y变量。当您进行多元线性回归时,您仍然在预测一个数(Y),但您有多个独立变量或预测变量试图解释Y的变化。

  在逻辑回归中,我们的响应变量是分类的,这意味着它只能假设有限数量的值。因此,如果我们谈论二元逻辑回归,我们的响应变量只有两个值,例如01,打开或关闭。

  在多元逻辑回归的情况下,我们的响应变量可以有多个级别,例如低、中、高或123

  人工神经网络最初是由试图模仿人脑神经生理学的研究人员开发的。通过将许多简单的计算元素(神经元或单元)组合成一个高度互连的系统,这些研究人员希望产生智能等复杂现象。神经网络是非常复杂的建模技术,能够对极其复杂的功能进行建模。

  它们受欢迎的主要原因是它们都非常强大且易于使用。强大的功能在于它们处理数据中非线性关系的能力,随着我们收集越来越多的数据并尝试将这些数据用于预测建模,这种关系变得越来越普遍。

  正在实施神经网络以解决广泛的油气上游问题,工程师努力解决预测、分类或控制问题。

  神经网络在整个E&P价值链中的常见应用包括将地震属性映射到储层特性、计算地表地震静力学,以及在开发非常规储层时确定优化的水力压裂处理策略。

原文地址:https://www.cnblogs.com/gqzxm/p/15260175.html