看不懂百度搜索结果显示页面的代码

shijies 2024-02-04 15:59:29

打开百度搜索结果显示页面的htm文件,发现代码很长,不光htm文件,还嵌有脚本文件,我看htm文件的源文件是为了写cshtml文件,没有想到htm文件的源代码这么复杂。以前我看ASP的搜索显示代码并不复杂,每一个搜索结果列出,隔一行,就几行代码。 

...全文
85 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
by_封爱 版主 02-05
  • 打赏
  • 举报
回复

不过现在大部分网页 都不已"源文件" 作为参考依据了..

都按照F12 元素 这部分来说话..毕竟有一些是动态生成的 源码是没办法看到的.

也算是提升了一点"技术门槛"吧

这也就是说 为什么现在一些采集功能(比如抓小说) 这种 比以前稍微难一点.. 因为以前asp或者什么时代 大家都喜欢在页面里读取数据库然后输出到页面.

那么采集的时候 只请求这个页面html的源码 就能看到自己想要的东西. 然后通过xpath来提取.

而现在 使用ajax/fetch这种居多.都是动态的 以前能看到的东西 现在看不到.

至于所谓的脚本.. 可能就是页面特效或者广告之类的.

以前只是为了数据展示. 能看到数据就表示功能已经完成了, 现在随着进步.数据的样式以及各种UI以及各种插件包括特效 都是需要脚本来支持的

by_封爱 版主 02-05
  • 打赏
  • 举报
回复

一个html页面里 有css js 这不是正常的吗?

以前的年代已经不复存在了.

110,203

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧