沪深股市的数据挖掘(2)

设想终于变成了现实。

今天,经过一系列的计算,终于挖掘出了第一个关系:A股票前一天的涨跌幅与B股票的今日的涨跌幅的关系。

493 SH600001   SH600568   1 2008年      1346.77223095276
1050 SH600001   SZ000587   1 2008年      1342.0274896795
1177 SH600001   SZ000780   1 2008年      1341.52334299219
976 SH600001   SZ000430   1 2008年      1341.01744610644

1代表提前了一天,2008年代表是2008年的数据,1346.772等是关联关系值。根据2008年的A股票交易日期(162天)来进行的比值:10分为精确匹配,0分为不匹配。

算法:10-abs((a.updown-b.updown)*50)   updown是交易的涨跌幅。

缺陷:1,A股票的交易日期较少,没有考虑全部的交易天数。(2008年的交易天数为246日)。
         2,对于算法,没有考虑分级制:如在1%内的权重较低,2-5%权重高等。
         3,未能在BW中进行此操作,而是靠sqlserver2005中写语句进行的。
         4,还未进行对关联关系的业务分析。

收获:1,熟悉了sqlserver2005中的临时表、游标等。
        2,对SQL的语句的熟悉程度得到提升。

原文地址:https://www.cnblogs.com/Beewolf/p/1432424.html