三.量化分析及技术

1.定量、定性 数据类型

定性数据:不能用数值表达的,以类别的形式出现。分两种:定类和定序

定类数据:按事物的某种特点进行平行分类。

例如 亚洲人,欧洲人

定序数据:是对事物进行分类,但是有顺序的。

例如:中年,老年

定量数据:

能用数值表达的数据,主要有两种:定距数据和定比数据

定距数据:对事物类别或次序之间距离的测度,只能进行加减不能乘除。

例如:温度,30度和20度之间相差10度,-30度和-20之间也相差10度

定比数据:具有三个数据所有特征,不仅可以进行加减运算,还可以进行乘除运算。

定性数据与定量数据在投资中同时其作用

定性投资:

最明显的表现为行业选择上,无论是股票投资还是其他投资形式,行业选择很重要,一般投资会选择处在高速发展前夜或者高速发展阶段,行业内优势企业会跑的更快,更易于带来惊人的财富增值。
目前投资股市的行业可优先选择新能源、信息技术等行业,这些是属于目前具有发展前景的。

定量投资:

通过分析数据来确定投资对象。比如股票选择会利用KDJ,DOLL, MACD等,而公司入股会先看其财务报表和财务数据,如盈利。

2.数据的集中趋势和离散程度

反映集中趋势

  • 平均数
  • 加权平均数:
  • 中位数:排序后,中间的或是正中间的两个数据的平均数。
  • 众数:出现次数最多

3.MACD与平均数在投资理财量化分析中的运用

DIF:

先设定快速移动平均线(一般是12日),再设定慢速移动平均线(一般为26日),分别算出12日、26日移动平均值的基础上,算出离差值(DIF)= 12日移动平均值(快速) - 26日移动平均值(慢速)。收盘价横盘时DIF=0,收盘价上升时DIF > 0,收盘价下降时DIF < 0.

DEA:是DIF的移动平均线,变化趋势比DIF迟钝

BAR:反映了DIF(斜率)的变化速度。

类比图:

4.相关性分析(任意外汇或股票两者的相关性为例)

5.数据的回归性分析(皮尔逊系数,R2决定系数)

R的平方

回归性分析:

多为一元回归分析,指从一组样本数据出发,确定变量之间的数学关系式.

y = ax + b

R2决定系数:

表示回归直线: y = ax + b ,这一回归直线是否能完全表达 x 与 y 的关系,也被叫做拟合的效果.
R2取值范围是[0,1],R2的值越接近1,说明回归直线越能说明两者关系,拟合效果好;

6.学生t分布,卡方分布,Fisher最小显著差异发介绍

1.学生 t 分布:计算损失概率或风险大小

2.卡方分布:检验两组数据是否有差别或联系.

3.Fisher 最小显著差异法: 检验两组或两组以上数据是否有差异或联系

置信度:是指所估计的一组数据所在的区间,默认的置信区间是95%.
自由度:指的是取值不受限制的变量个数.自由度通常用于t分布中.

应用:

7.时间序列与指数概述

时间序列

是指观察或记录到的一组按时间顺序排列的数据.

时间序列可用于对一组数据的变化趋势进行预测.如股票价格的预测.
  • 价格预测方法之一: 移动平均法.

预测16天的价格

  • 指数起源于人们对价格动态的关注.

  • 居民消费价格指数编制:
    将全部商品划分为大类,中类,小类,品种,规格;确定各品种的代表规格品及权数 w;
    按照小类,中类,大类,总指数的顺序逐级计算各级指数.

  • 生产价格指数( PPI)
    各种产品在非零售市场上首次交易价格的动态.
    在我国主要包括工业品出厂价格指数,批发价格指数,农产品收购价格指数等.

  • 股票价格指数:
    反应股市上多重股票价格综合变动趋势的动态相对数.

原文地址:https://www.cnblogs.com/chaoren399/p/5712994.html