WALS分解

1.ALS用于显示反馈，即有明确评分的数据。对于隐式反馈，可利用加权ALS，对于有确定偏好的item赋于较大权重，对于没有反馈的item，赋于较小权重。

其中，P矩阵维度：N*K；Q矩阵维度：M*K。前者为User在K维潜因子空间的表示；后者为Item在K维潜因子空间的表示。

2.预测评分，或者説近似评分为

3.损失函数为平方误差+L2正则项，其中是真实值。

这里；，为置信度因子，为实值值，比如观看电影时长，点击次数等，可进行归一化处理。

4.迭代计算，其中。

，对所有用户i，更新其所有隐因子。
，对所有项目j，更新其所有隐因子。
迭代执行，每次迭代可先计算p，再计算q。

5.程序，完整程序(数据为movenlens,100k),https://github.com/jiangnanboy/recommendation_methods/blob/master/com/sy/reco/recommendation/matrix_factorization/als_wr.py

import numpy as np
import math
import copy

#这里使用加权的als交替最小二乘求解U,I矩阵，主要用于隐式反馈
#参考论文Collaborative Filtering for Implicit Feedback Datasets
class ALSWR():
    '''
     初始化ratingMatrix,F, λ
    ratingMatrix:评分矩阵
    F:隐因子数目
    λ:正则化参数，以防过拟合
    alpha:置信因子，用于隐式反馈评分
    '''
    def __init__(self, ratingMatrix, F, λ,alpha):
        self.ratingMatrix = ratingMatrix
        self.F = F
        self.λ = λ
        self.alpha=alpha

    #对U,I矩阵初始化，随机填充，根据经验随机数与1/sqrt(F)成正比,Pui矩阵：rui>0:1;rui=0:0，Cui矩阵是置信度权重因子：Cui=1+alpha*rui或Cui = 1+alphalog(1 + rui/ǫ).
    def __initPQ(self,userSum,itemSum):
        self.Pui=np.zeros((userSum,itemSum))#对项目有过行为：1，未有行为：0，二元
        self.Cui = np.zeros((userSum,itemSum))  # Cui矩阵是置信度权重因子：Cui=1+alpha*rui
        for user in range(userSum):
            for item in range(itemSum):
                self.Cui[user,item]=1.+self.alpha*self.ratingMatrix[user,item]#评分大则加大权重，説明用户喜欢，未评分不代表用户不喜欢，所以权重减小
                if self.ratingMatrix[user,item]>0:
                    self.Pui[user,item]=1
                else:
                    self.Pui[user,item]=0
        self.U=np.zeros((userSum,self.F))
        self.I=np.zeros((itemSum,self.F))
        for i in range(userSum):
            self.U[i]=[np.random.random()/math.sqrt(self.F) for x in range(self.F)]
        for i in range(itemSum):
            self.I[i]=[np.random.random()/math.sqrt(self.F) for x in range(self.F)]

    #使用交替二乘迭代训练分解，max_iter:迭代次数
    def iteration_train(self,max_iter):
        userSum = len(self.ratingMatrix)  # 用户个数
        itemSum = len(self.ratingMatrix[0])  # 项目个数
        self.__initPQ(userSum,itemSum)#初始化U,I矩阵
        for step in range(max_iter):
            #这时固定self.I，求解self.U
            for user in range(userSum):
                for f in range(self.F):
                    sum_1=0.
                    sum_2=0.
                    for item in range(itemSum):
                        #if self.ratingMatrix[user,item]>0:
                            eui=self.Pui[user,item]-self.predict(user,item)#误差
                            sum_1+=(eui+self.U[user,f]*self.I[item,f])*self.I[item,f]*self.Cui[user,item]
                            sum_2+=self.I[item,f]**2*self.Cui[user,item]
                    sum_2+=self.λ
                    self.U[user,f]=sum_1/sum_2
            #这里固定self.U，求解self.I
            for item in range(itemSum):
                for f in range(self.F):
                    sum_1=0.
                    sum_2=0.
                    for user in range(userSum):
                        #if self.ratingMatrix[user,item]>0:
                            eui=self.Pui[user,item]-self.predict(user,item)#误差
                            sum_1+=(eui+self.U[user,f]*self.I[item,f])*self.U[user,f]*self.Cui[user,item]
                            sum_2+=self.U[user,f]**2*self.Cui[user,item]
                    sum_2+=self.λ
                    self.I[item,f]=sum_1/sum_2
        return np.round(np.dot(self.U, self.I.T), 0)  # 返回全部，两个矩阵相乘

    #预测打分，用户的行与项目的列
    def predict(self,user,item):
        I_T=self.I.T#项目矩阵转置
        pui=np.dot(self.U[user,:],I_T[:,item])
        return pui