事实表计数比事实表数据量大

事实表:

TweeterID,....。其中TweeterID为业务主键,没设置代理键。数据30万

维度表:

TweeterID,EducateName。EducateName为小学,中学,高中,大学这样的值。TweeterID唯一,即每个人只保留最高学历。数据量70万。

两表通过TweeterID做关联,一做模型,发现,悲剧了。

模型最终出来的事实表记录数为70万!

可以推测出,如果你的事实表用的是业务键,Cube在做处理的时候,处理方式不是left join,是外连接?会遍历中维度表中所有的记录!!!

没办法,本来想偷点懒的,最后还是只能把维度表改成EducateKey,EducateName这样的形式,在事实表中加EducateKey的字段。然后再做关联,就正确了。

原文地址:https://www.cnblogs.com/thinkCoding/p/2257234.html