有谁研究过QQ空间的页面结构的?

RuntimeError 2010-07-08 07:52:16
我正在做一个网络爬虫,想要抓去好友的QQ空间里的日志。我对HTML以及动态网页方面的知识了解得不是很多,我发现直接获取主框架的HTML代码里,竟然没有什么可见的文本。比如导航栏“主页、日志、相册”等这些内容都不是主框架里的。所有动态内容都是在blog_output_data这个子项目中的。
现在我的程序能够实现获取指定URL的HTML代码,我打算后面再通过正则表达式提取其中的文本内容。不过现在我无法取得好友QQ空间里的具体内容啊。请高人指点。
...全文
75 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
RuntimeError 2010-07-10
  • 打赏
  • 举报
回复
ajax 我大致知道是什么东西。
那怎么办呢?也就是说我没法通过软件获取其中的内容了?
一个下下策是,用Web浏览器打开QQ空间,直接从内存中获取好友的日志内容……
行间 2010-07-08
  • 打赏
  • 举报
回复
貌似还有一种直接访问的方式,直接从新闻那边过来的。
longyangyxm 2010-07-08
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 net_lover 的回复:]
很多情况下是ajax获取的内容
[/Quote]
纯支持
孟子E章 2010-07-08
  • 打赏
  • 举报
回复
很多情况下是ajax获取的内容
fhdry 2010-07-08
  • 打赏
  • 举报
回复
up--------------------------------

61,112

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧