原数据集格式如下:
user item rating
aaaaa 100001 9.5
aaaaa 100002 7.8
aaaaa 100003 5.5
aaaaa 100004 3.2
aaaaa 100005 1.8
bbbbb 100011 8.7
bbbbb 100009 7.1
bbbbb 100006 6.9
bbbbb 100004 5.6
bbbbb 100005 3.2
如上图,为每个用户推荐了5个物品,并按推荐评分倒序排列。
需求:设计并导入到HBASE表,可以由用户名来查询任意个推荐物品。
比如:返回用户aaaaa的前3个推荐物品
我想了一种方案,请大家指正