求助一个思路的问题

微凉gogogo 2018-11-05 04:57:23
我们从某个网站爬下来一批图片,现在老板要求,在我们网站搜索的结果,和在来源网站搜索的结果要基本一致,并且顺序要基本一致
有没有大神有思路
...全文
119 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
weixin_37942284 2018-11-10
  • 打赏
  • 举报
回复
搜索结果一致,代表关键字的排序方式一致,搜索关键字的时候对方是根据标题的匹配度排序对吧,那么你在爬图片的时候,对应爬其他信息,并根据爬取顺序先赋值再存储,比如日期字段取当前时间,时间要求精度高,图片有上传日期的直接取日期,还有热度什么的,其次图片名称,作者信息等。。还有代码那边要做好日期的排序。或者热度等,让程序自己推导下排序方式,无非这几种结果
H-arry 2018-11-08
  • 打赏
  • 举报
回复
搜索顺序也要一致,那就两个办法了,一个是你有他的搜索算法,第二搜索的时候向那个网站发送搜索请求,然后根据返回数据填充到自己的页面,不过貌似这样你抓下来的照片用处就不是很大,除非回传数据中有图片的名,可以直接修改src地址进行显示图片。怎么说呢,第一种方法快,但是不科学,你很难获取到对方的算法,第二个慢,但是基本可以达到要求。
_jant 2018-11-08
  • 打赏
  • 举报
回复
分两步 第一步爬内容,第二部爬规则。 再把爬到的规则 应用到内容上,最后展示
windtears 2018-11-07
  • 打赏
  • 举报
回复
抓过来的图片加索引号和文件名绑定,每天 核对一次。
maradona1984 2018-11-05
  • 打赏
  • 举报
回复
你就按顺序爬呗,结果什么的那得把标签什么的都得爬下来跟图片一一对应...
Defonds 2018-11-05
  • 打赏
  • 举报
回复
除非你产品设计的灵感很高,玩玩人家的东西就知道搜索算法、结果排名是啥。
否则你应该去来源网站学习他们的搜索结果、顺序的算法是什么。
比如有没有行业规范或者默认套路,如果没有的话,那就难了,想办法从他们内部技术上下手看看能否找到点啥规则。

81,122

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧