求行业/类别匹配算法
我有自己的行业表(或类别表),得到了三方的行业表(或类别表),可以通过什么样的算法进行匹配?
比如我的行业数据是:
照明工业
电子元器件
传媒、广电
安全、防护
包装
纸业
办公、文教
数码、电脑
电工电气
……
三方的行业数据是:
房屋租售
交友征婚
搬家/快递
保洁/家政
家教/培训
婚庆/礼仪
装修/装饰
娱乐/保健
维修服务
虚拟物品
……
现在是通过字数相同度来匹配,但是匹配的结果约一半的数据是不合理的(不准确)
比如
石油燃料 匹出 油漆涂料
沼气设备 匹出 摄录设备
求更准确的匹配算法。
另外行业是有层级关系的,我的行业是三级,三方的行业可能是三级,也可能是两级