请大家帮忙分析这个网址中“#”的含义,以及如何从该网址的网页中提取date指定的日期的新闻标题

黎大 2017-01-10 11:12:06
代分析网址如下
#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1" target="_blank">http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1

就是这个网址!是新浪滚动新闻的1月5日的新闻列表
里面那个绿色的“#”是什么意思呢?似乎和传统的解释——页面中位置标记,不是很搭界啊

我想用python或者其他什么语言得到这个页面中的新闻的标题,但是用
requests.get(url,params),在params里面设置了date : 2017-01-05,但是每次读下来的都是最新日期的新闻

那我应该怎么样呢?

...全文
275 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
业余草 2017-01-21
  • 打赏
  • 举报
回复
黎大 2017-01-15
  • 打赏
  • 举报
回复
@xiaofanku @街头小贩 亲爱的版主, re: ch=01#col=89代表一个参数ch它的值01#col=89 这里我不太认可,这两天查了一些材料,发现可能用如下的解释更合适 http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1 # 后面的 红色部分是这个页面的hash !!! 但是怎么传过去呢?怎么样才能够读下来呢?
黎大 2017-01-15
  • 打赏
  • 举报
回复
@xiaofanku @街头小贩 亲爱的版主, re: ch=01#col=89代表一个参数ch它的值01#col=89 这里我不太认可,这两天查了一些材料,发现可能用如下的解释更合适 http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1 # 后面的 红色部分是这个页面的hash !!! 单怎么传过去呢?
街头小贩 2017-01-13
  • 打赏
  • 举报
回复
引用 3 楼 peterlee1983 的回复:
[quote=引用 1 楼 xiaofanku 的回复:]

http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1
里面那个绿色的“#”是什么意思呢?似乎和传统的解释——页面中位置标记,不是很搭界啊 re: ch=01#col=89代表一个参数ch它的值01#col=89

requests.get(url,params),在params里面设置了date : 2017-01-05,但是每次读下来的都是最新日期的新闻
说明date不是用来取数据的决定性参数
在传递参数的时候怎么能够保证ch:‘01#col=89’这个参数紧跟在 url的问号'?'后面呢? requests.get(url),出来的url如下 http://roll.news.sina.com.cn/s/channel.php?offset_num=0&page=1&type=&num=80&date=2017-01-05&spec=&offset_page=0&ch=01%23col%3D89&k=&asc= 里面#和=都被编码了。。。 这该怎么办?和浏览器地址栏里的不一样 [/quote] 你有用urlEncode?
黎大 2017-01-13
  • 打赏
  • 举报
回复
引用 4 楼 xiaofanku 的回复:
[quote=引用 3 楼 peterlee1983 的回复:] [quote=引用 1 楼 xiaofanku 的回复:]

http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1
里面那个绿色的“#”是什么意思呢?似乎和传统的解释——页面中位置标记,不是很搭界啊 re: ch=01#col=89代表一个参数ch它的值01#col=89

requests.get(url,params),在params里面设置了date : 2017-01-05,但是每次读下来的都是最新日期的新闻
说明date不是用来取数据的决定性参数
在传递参数的时候怎么能够保证ch:‘01#col=89’这个参数紧跟在 url的问号'?'后面呢? requests.get(url),出来的url如下 http://roll.news.sina.com.cn/s/channel.php?offset_num=0&page=1&type=&num=80&date=2017-01-05&spec=&offset_page=0&ch=01%23col%3D89&k=&asc= 里面#和=都被编码了。。。 这该怎么办?和浏览器地址栏里的不一样 [/quote] 你有用urlEncode?[/quote] 我用的不是urllib,用的requests库,那个直接传了。。。
黎大 2017-01-12
  • 打赏
  • 举报
回复
引用 1 楼 xiaofanku 的回复:

http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1
里面那个绿色的“#”是什么意思呢?似乎和传统的解释——页面中位置标记,不是很搭界啊 re: ch=01#col=89代表一个参数ch它的值01#col=89

requests.get(url,params),在params里面设置了date : 2017-01-05,但是每次读下来的都是最新日期的新闻
说明date不是用来取数据的决定性参数
在传递参数的时候怎么能够保证ch:‘01#col=89’这个参数紧跟在 url的问号'?'后面呢? requests.get(url),出来的url如下 http://roll.news.sina.com.cn/s/channel.php?offset_num=0&page=1&type=&num=80&date=2017-01-05&spec=&offset_page=0&ch=01%23col%3D89&k=&asc= 里面#和=都被编码了。。。 这该怎么办?和浏览器地址栏里的不一样
黎大 2017-01-12
  • 打赏
  • 举报
回复
引用 1 楼 xiaofanku 的回复:

http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1
里面那个绿色的“#”是什么意思呢?似乎和传统的解释——页面中位置标记,不是很搭界啊 re: ch=01#col=89代表一个参数ch它的值01#col=89

requests.get(url,params),在params里面设置了date : 2017-01-05,但是每次读下来的都是最新日期的新闻
说明date不是用来取数据的决定性参数
那我应该怎么样来获取这个网页里的东西呢?多谢啊!
街头小贩 2017-01-12
  • 打赏
  • 举报
回复

http://roll.news.sina.com.cn/s/channel.php?ch=01#col=89&spec=&type=&date=2017-01-05&ch=01&k=&offset_page=0&offset_num=0&num=80&asc=&page=1
里面那个绿色的“#”是什么意思呢?似乎和传统的解释——页面中位置标记,不是很搭界啊 re: ch=01#col=89代表一个参数ch它的值01#col=89

requests.get(url,params),在params里面设置了date : 2017-01-05,但是每次读下来的都是最新日期的新闻
说明date不是用来取数据的决定性参数

10,607

社区成员

发帖
与我相关
我的任务
社区描述
Web 开发 其他
社区管理员
  • 其他
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧