看不懂百度搜索结果显示页面的代码

shijies 2024-02-04 15:59:29

打开百度搜索结果显示页面的htm文件，发现代码很长，不光htm文件，还嵌有脚本文件，我看htm文件的源文件是为了写cshtml文件，没有想到htm文件的源代码这么复杂。以前我看ASP的搜索显示代码并不复杂，每一个搜索结果列出，隔一行，就几行代码。

...全文

3302 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

by_封爱版主 2024-02-05

不过现在大部分网页都不已"源文件" 作为参考依据了..

都按照F12 元素这部分来说话..毕竟有一些是动态生成的源码是没办法看到的.

也算是提升了一点"技术门槛"吧

这也就是说为什么现在一些采集功能(比如抓小说) 这种比以前稍微难一点.. 因为以前asp或者什么时代大家都喜欢在页面里读取数据库然后输出到页面.

那么采集的时候只请求这个页面html的源码就能看到自己想要的东西. 然后通过xpath来提取.

而现在使用ajax/fetch这种居多.都是动态的以前能看到的东西现在看不到.

至于所谓的脚本.. 可能就是页面特效或者广告之类的.

以前只是为了数据展示. 能看到数据就表示功能已经完成了, 现在随着进步.数据的样式以及各种UI以及各种插件包括特效都是需要脚本来支持的

by_封爱版主 2024-02-05

一个html页面里有css js 这不是正常的吗?

以前的年代已经不复存在了.

111,131

社区成员

642,542

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

加载中

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧