NMF分解

1.非负矩阵分解

  

   其中,P矩阵维度:N*KQ矩阵维度:M*K。前者为UserK维潜因子空间的表示;后者为ItemK维潜因子空间的表示。

  其中:

  

 2.预测评分,或者説近似评分

  

 3.损失函数为平方误差,其中是真实值。

  a.加入L2正则项

   

  b.加入L1L2正则项

   

 4.针对加入L1L2loss,使用交替最小二乘优化

  其中,以下交替迭代执行

  • PQ初始化为非零

 5.程序,完整代码(数据movielens, ml-100k),https://github.com/jiangnanboy/recommendation_methods/blob/master/com/sy/reco/recommendation/matrix_factorization/nmf.py

import numpy as np
import math

#这里使用非负矩阵求解U,I矩阵,使用交替最小二乘迭代计算,要求元素非负
#这里正则化使用的是L1和L2的融合,alpha是正则化选择参数
#这里可以对原评分矩阵中的缺失值插值处理,如平均值
class NMF():
    '''
     初始化ratingMatrix,F, λ
    ratingMatrix:评分矩阵
    F:隐因子数目
    λ:正则化参数,以防过拟合
    alpha:正则化选择参数,默认正则化是L2,即平方正则化
    '''
    def __init__(self, ratingMatrix, F, λ,alpha=0):
        self.ratingMatrix = ratingMatrix
        self.F = F
        self.λ = λ
        self.alpha=alpha

    #对U,I矩阵初始化,随机填充非零(0,1),根据经验随机数与1/sqrt(F)成正比
    def __initPQ(self,userSum,itemSum):
        self.U=np.zeros((userSum,self.F))
        self.I=np.zeros((itemSum,self.F))
        for i in range(userSum):
            self.U[i]=[np.random.random()/math.sqrt(self.F) for x in range(self.F)]
        for i in range(itemSum):
            self.I[i]=[np.random.random()/math.sqrt(self.F) for x in range(self.F)]

    #使用交替二乘迭代训练分解,max_iter:迭代次数
    def iteration_train(self,max_iter):
        userSum = len(self.ratingMatrix)  # 用户个数
        itemSum = len(self.ratingMatrix[0])  # 项目个数
        self.__initPQ(userSum,itemSum)#初始化U,I矩阵
        for step in range(max_iter):
            #这时固定self.I,求解self.U
            for user in range(userSum):
                for f in range(self.F):
                    sum_1=0.
                    sum_2=0.
                    for item in range(itemSum):
                        if self.ratingMatrix[user,item]>0:
                            eui=self.ratingMatrix[user,item]-self.predict(user,item)#误差
                            sum_1+=(eui+self.U[user,f]*self.I[item,f])*self.I[item,f]
                            sum_2+=self.I[item,f]**2
                    sum_1-=self.alpha*self.λ
                    sum_2+=(1-self.alpha)*self.λ
                    self.U[user,f]=sum_1/sum_2
            #这里固定self.U,求解self.I
            for item in range(itemSum):
                for f in range(self.F):
                    sum_1=0.
                    sum_2=0.
                    for user in range(userSum):
                        if self.ratingMatrix[user,item]>0:
                            eui=self.ratingMatrix[user,item]-self.predict(user,item)#误差
                            sum_1+=(eui+self.U[user,f]*self.I[item,f])*self.U[user,f]
                            sum_2+=self.U[user,f]**2
                    sum_1-=self.alpha*self.λ
                    sum_2+=(1-self.alpha)*self.λ
                    self.I[item,f]=sum_1/sum_2
        return np.round(np.dot(self.U, self.I.T), 0)  # 返回全部,两个矩阵相乘

    #预测打分,用户的行与项目的列
    def predict(self,user,item):
        I_T=self.I.T#项目矩阵转置
        pui=np.dot(self.U[user,:],I_T[:,item])
        return pui
原文地址:https://www.cnblogs.com/little-horse/p/12494886.html