第二期,我们一起来聊一聊

如何解决推荐系统数据稀疏性的问题吧!

什么是稀疏性问题?

稀疏性问题是指一个推荐系统中与特定或特定相似组的用户输入发生过交互的数据集在整个数据集中占比过少的问题。

举个例子:例如在电影推荐系统中,因为有些电影只被小部分用户评级,所以很少会被推荐给品位类似的用户,即使那小部分用户给予很高评级,这就导致了较差的推荐结果。

稀疏性问题会导致什么后果?

稀疏性问题会导致新增产品项、无交互产品项、低交互产品项越来越无法出现推荐集中。

那么该如何解决推荐系统中数据稀疏性的问题?

第一步:引入可自定义标签系统

第二步:利用标签的扩展性,通过邻域的方式去将标签扩展到其他产品中。通过数据统计出标签之间的相似度,如果判断为相似的标签,该标签可以全部同步到带有相似的产品中去。

标签系统的好处有哪些呢?

1.可以利用算法根据用户打过的历史标签,计算用户对该标签下的商品感兴趣程度。

2.对新加入产品项可以打上预标签,提高推荐率。

3.标签可以反映同样反馈的不同逻辑,反映用户的真实情况。例如对一个商品选择推荐的理由可能有多个,例如:性价比高、到货快、质量好等。

如何检验成果呢?

主要从两个方面去判断:0交互和低交互产品占比是否呈下降趋势;推荐质量是否得到提升。

铉盈科技将其应用到了哪些司法服务场景?

铉盈科技将推荐系统中数据稀疏性的问题进行了优化,并应用到了诉讼风险评估系统中,系统以多维度评估当事人诉讼案件的风险情况,并提供相应的法律意见与行动建议,让大家在获取服务的同时学法、用法。