论文《RiVal - A Toolkit to Foster Reproducibility in Recommender System Evaluation》阅读

tech2022-11-25 167

论文《RiVal - A Toolkit to Foster Reproducibility in Recommender System Evaluation》阅读

论文概况论文亮点AbstractRecommendation and EvaluationRiVal - A Toolkit for EvaluationDemenstration

论文概况

这篇文章发表在推荐系统顶会RecSys 2014上，是一篇短论文，介绍了作者开发的一个叫做 RiVal 的推荐系统开源评估框架。

论文地址：RiVal论文代码地址：RiVal代码

论文亮点

针对主流开源推荐框架Evaluation实现差异较大而设计了一套可以集中进行横向评估的开源框架

下面进行详细介绍

Abstract

主流的开源框架，即使给定同一个数据集、同一个评估指标、同一个数据划分方法，最终给出的评估结果可能也天差地别（主要是由模型的实现方法以及参数的优化和修改造成的）。作者开发出RiVal框架，使用Java开发，是一款开源的推荐系统评估工具包。

RiVal 使得 Evaluation 的各个部分可以完全由用户掌握：

数据划分（Data Splitting）评估策略的定义（Definition of evaluation strategies）评估指标的计算（Computation of evaluation metrics）

Recommendation and Evaluation

主流的开源推荐系统框架包括以下几个：

Apache MahoutLensKitMyMediaLite

然而不同的框架之间，即使实现同一个算法也可能带来不同的准确率。作者认为有以下原因：

算法实现数据组织评估方法

作者举例如下表1 所示：

可以看到，即使是同一个算法，同一个评估指标，针对不同的框架得到的结果也是不同的，而且相差很大。

RiVal - A Toolkit for Evaluation

作者将推荐的Evaluation过程分为以下四个阶段：

数据分割（Data Splitting）推荐（Item Recommendation）生成候选（Candidate Item Generation）性能测量（Performance Measurement）

Rival作为一款开源的Java推荐系统性能评估工具包并不具备推荐功能，因此功能（ii）推荐（Item Recommendation）的功能需要其他开源框架完成，由RiVal负责性能评估。

RiVal可以通过Maven方式运行，也可以直接Java程序文件。具体使用方法是通过配置文件指定，在.prop文件中写明各个属性值即可。作者举例如下框Listing 1所示：这里对应第一步——数据分割，可以看到配置文件中指定了数据集文件，分隔符形式，数据分割方式，分割后的数据集命名方式（前后缀），以及其他细节（如peruser、seed等）。

类似地，第二步（推荐）的细节如下框list2所示：

可以看到在list2中指明了推荐算法模型（使用lenskit完成）、相似度计算方式、KNN中K的大小（neighborhood=50），以及前后缀名称等其他细节。

对于剩余两步（候选和评估）作者没有进一步展示，大体类似于前两步，可以上 github 进行查看。

作者展示了一个使用RiVal的运行结果如下图1所示：

作者针对RMSE（均方根误差）这一指标，对不同的算法（包含user-based CF，item-based CF及 SVD），不同的分割方式（交叉验证，per-user，global random），不同框架（Mahout，LensKit，MyMediaLite）的运算结果的可视化进行了展示。

Demenstration

这部分在前面已经详细介绍，具体可以参照github上的指示进行操作。

最新回复(0)