如何配对关键字来“截取字段”

huapingyijie 2014-07-08 01:08:00
请问一下技术大神,有没有这样一种技术:

比如我们是窝窝团的,有一些未开发的项目想COPY 美团,我们已经可以从美团从截取所有网页字段,只需要匹配到我们字段即可·

但所有程序都是机器来弄,担心因为关键字不同无法匹配:

比如美团 东城美食的 “九门小吃”,其中“一些列的美食介绍描述”是我们需要的!

而我们窝窝团,已经通过技术拥有了他们所有“美食介绍描述‘’

但,我们的标题是”九门美食“ 而美团是”美团小吃“! 因为关键字不同,所以拿来的数据匹配不上!

如果单是少些数据我们可以人工解决,问题是数据是海量的,假如有几十万个,人工一个个去匹配完全不可能!

所以请教一下大神们,是否有这种技术:

1.即使关键字有差别,几十万的数据照样能匹配上;
2 如果不能匹配,是否有一种方法短时间内能样我们的关键字“九门美食”完全匹配”九门小吃“等N多个关键字!

谢谢,再次谢谢大神们!
...全文
2467 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_19530241 2015-06-15
  • 打赏
  • 举报
回复
谢谢楼主,学习了
qq_28793097 2015-06-06
  • 打赏
  • 举报
回复
谢谢楼主 我来学习的
qq_28799157 2015-06-06
  • 打赏
  • 举报
回复
同求 期待答案揭晓
wmloli120 2015-06-05
  • 打赏
  • 举报
回复
同求…………
qq_20405039 2015-05-19
  • 打赏
  • 举报
回复
谢谢楼主分享
fantian830211 2015-05-14
  • 打赏
  • 举报
回复
这个太难了,这是自然语言处理的问题了。 我觉得你可以考虑相似度来处理。
sinat_28004881 2015-05-07
  • 打赏
  • 举报
回复
谢谢楼主分享
  • 打赏
  • 举报
回复
NLTK, natural language processing

547

社区成员

发帖
与我相关
我的任务
社区描述
Cloud Foundry是业界第一个开源PaaS云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。
社区管理员
  • Cloud Foundry社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧