spark MLlib中协同过滤算法接受的userId是int类型,但是真正的ID是字符串,怎么映射好呢?
MLlib的cf算法接受的是Rating类型的RDD:
JavaRDD<Rating>
其中Rating代表的是两个int 和一个double
org.apache.spark.mllib.recommendation.Rating.Rating(int user, int product, double rating)
但是假如我的用户唯一标识是uuid,那么怎么转换成唯一对应的int类型?直接弄个映射表把1234和uuid对应起来么?