如何获取百度文库里的文字

tusik1 2012-10-13 08:57:35

string HTML = GetHTML(textBox2.Text);

            string result = Regex.Match(HTML, @"(?s)<br />(.+?)<br />", RegexOptions.Singleline).Groups[1].Value;

            textBox1.Text = result;

我现在用的代码如上
可是只能获取文库的第一行文字，怎么获取全篇啊

...全文

798 8 打赏收藏转发到动态举报

写回复

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

bdhwjs 2012-10-14

打赏
举报

回复

很简单，别忘记给分喔。
例如：
http://wenku.baidu.com/view/1620cba2b0717fd5360cdce7.html
你让程序去采集这个就可以了。
http://wapwenku.baidu.com/view/1620cba2b0717fd5360cdce7.html

也就是说网址前面加个“wap”就解决了。
wap是手机版的。

bogehahaha 2012-10-14

打赏
举报

回复

注册一个账号，在右边评分（有五个五角星）那里点一下就是评论一下的一分，再找其他文档这样评论，就有积分了

tusik1 2012-10-14

打赏
举报

回复

[Quote=引用 6 楼的回复:]

很简单，别忘记给分喔。
例如：
http://wenku.baidu.com/view/1620cba2b0717fd5360cdce7.html
你让程序去采集这个就可以了。
http://wapwenku.baidu.com/view/1620cba2b0717fd5360cdce7.html

也就是说网址前面加个“wap”就解决了。
wap是手机版的。
[/Quote]
我就是用这个方法采集的，但是只能采集到第一行

myrroom 2012-10-13

打赏
举报

回复

模拟手机版的去请求页面，应该可以抓到全部的文字，我用android看的时候好像是文字版的

早起晚睡 2012-10-13

打赏
举报

回复

我都是抓图要不然就注册个好吗弄点积分下载

tusik1 2012-10-13

打赏
举报

回复

[Quote=引用 2 楼的回复:]

“全篇”是个flash，又不是html文本，用一般的网页采集取不到的。
[/Quote]
之前用这个代码我可以采集到前4500个字
现在只能采到第一行啊
怎么弄啊

dalmeeme 2012-10-13

打赏
举报

回复

“全篇”是个flash，又不是html文本，用一般的网页采集取不到的。

shelly 2012-10-13

打赏
举报

回复

没听过额

教你免费复制百度文库中的内容. 教你免费复制百度文库中的内容.

2020年图片文字识别，百度文库文字识别工具 2020年图片文字识别，百度文库文字识别工具 2020年图片文字识别，百度文库文字识别工具

1，可批量下载百度文库文档 2，在保存PDF文件的同时会自动保存一份txt文件；如果原始文档就是txt，那么自动保存的txt可能度非常高 3，*PDF内置了对部分文件的检索功能，可能定为到具体页面（无法很精确的定位到...

度文库随意下是一款支持百度文库中的文库下载和百度书库下载的下载工具，支持百度文库中所有的格式下载，保存为pdf文件或文本文件，可下载带图片的内容，之前的百度文库下载器都只是下载文字内容，对于一些图文并茂...

支持百度文库中的文库下载和百度书库的下载，支持百度文库中所有的格式的下载，保存为PDF文件或文本文件，可下载带图片的内容，之前的百度文库下载器都只是下载文字内容，对于一些图文并茂的文章少了图片解释就基本...

110,537

社区成员

642,576

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章