采集网页的几个问题

sudawei123 2008-11-08 01:21:38

我是先把网页用HttpWebRequest读出网页的源代码，再把原代码转成WebBrowser.document
现在有两个问题
１.当程序第一次采集的时候采不到我需要的内容，但在webbrowser里网页显示正常
document里显示的连接数也正常，但在判断我需要的连接为0

2.以下是采级的主控制代码
Dim filepath = "c:\1.txt"
getPage("http://www.clickbank.com/marketplace.htm?" & "method=Sort&c=1&subc=2&keywords=&sortBy=popularity&billingType=ALL&locale=EN&i=50", "c:\1.txt")
While weburl1 <> ""
filepath = "c:\" & weburl1.substring(weburl1.LastIndexOf("=") + 1) & ".txt"
MsgBox(filepath & "," & weburl1)
getPage(weburl1, filepath)
End While
MsgBox("采集完成")

getpage我是写的一个采集网页的方法
这个代码通过while采集多个网页
如果注释掉红字部分的时候采集到第二个网页就不动了，也不报错，程序就假死了
如果不注释的话就能正常采集下去

请问各位大大是哪里的问题啊

...全文

165 3 打赏收藏转发到动态举报

写回复

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

qshzf 2008-11-13

打赏
举报

回复

sleep等待一下

0暖沙0 2008-11-12

打赏
举报

回复

看来应该是你的While造成了主线程阻塞使程序假死
试试在循环中加入system.Threading.Thread.Sleep(10)或者Application.DoEvents()
或者干脆为你的while循环单独开一个线程执行

cookies10wen 2008-11-10

打赏
举报

回复

帮顶..

AI算力时代的先进封装：Chiplet、HBM与异构集成的产业机会

源码下载地址： https://pan.quark.cn/s/8d2c461c797c JavaWeb程序设计构成了掌握Web交互式应用程序开发的核心领域，对于初学者来说，精通这一技术具有决定性意义。在“JavaWeb程序设计（第三版）作业答案”中，我们可以预期获得针对该教材习题的一系列深入解析，从而协助学习者强化知识体系。 JavaWeb所包含的技术组件涵盖了Servlet、JSP（JavaServer Pages）、JDBC（Java Database Connectivity）以及各类框架如Spring MVC、Struts等。Servlet是Java平台提供的一种扩展服务器功能的接口，能够处理HTTP请求并生成相应的反馈。JSP则是一种用于构建动态网页的工具，它支持开发者将HTML代码与Java代码进行整合编写，从而简化了Web应用程序的开发流程。作业答案通常会涉及以下几个核心内容： 1. **Servlet基础**：可能包含Servlet生命周期、init(), service(), destroy()方法的应用，以及如何在web.xml文件中设定Servlet的映射关系。 2. **JSP基础**：JSP的九大内置对象，如request、response、session、application等的使用，以及EL（Expression Language）和JSTL（JavaServer Pages Standard Tag Library）的实际操作。 3. **HTTP协议理解**：GET和POST请求方法的差异，请求头与响应头的应用，以及会话管理的概念阐释。 4. **JDBC数据库操作**：与数据库建立连接，执行SQL指令，处理查询结果集，以及...

源码链接： https://pan.quark.cn/s/a4b39357ea24 斐讯K2是一款广受用户青睐的无线路由器，其运行表现稳定且具备较高的可操作性，在DIY爱好者群体中拥有极高的声誉。本资料将系统性地阐述斐讯K2的固件刷机方法及其关联的技术要点。固件升级是路由器爱好者改善设备性能、扩展功能的一种普遍手段，经由替换出厂固件，能够达成更加个性化的网络配置、增强安全防护等目标。斐讯K2固件资源库涵盖了多种知名的非官方固件，诸如Tomato Pheonix 不死鸟、高恪、PandoraBox 潘多拉等，这些固件均具备独特的优势，能够适配不同用户的需求。 1. Tomato Pheonix 不死鸟：Tomato是一款立足于Linux的开源固件，以其精巧、高效而备受推崇。不死鸟版本是专门为华硕及斐讯路由器优化的分支，提供了卓越的QoS（服务质量）配置、详尽的图表监控以及便捷的固件升级途径。对于那些需要精准调控带宽和监测网络状态的用户而言，这是一个理想的选项。 2. 高恪：高恪固件是OpenWrt的定制化版本，着重于操作的便捷性和运行的可靠性，特别适合对路由器操作不甚熟悉的用户群体。它提供了一些实用的功能，例如内置的广告屏蔽、快速测速工具等，同时保留了OpenWrt的适应性。 3. PandoraBox 潘多拉：潘多拉盒是另一款基于OpenWrt的固件，它以丰富的插件库和强大的自定义潜力而闻名。用户能够依据个人需求安装各类插件，实现更多功能，如远程接入、DDNS（动态域名解析服务）等。 4. 官方固件的纯净版本与定制版本：官方固件通常更侧重于稳定性，纯净版意味着未预置额外的应用或服务，适合注重稳定性的用户。定制版则可能包含了制造商的特色功能或优...

源码下载地址： https://pan.quark.cn/s/a4b39357ea24 在django框架中集成了celery功能，针对在启动django应用程序时如何使celery服务同步运行的问题，可通过ENTRYPOINT指令来实现启动。具体步骤如下：一、创建Dockerfile文件，基础镜像选用centos:7版本，执行localedef命令配置中文语言环境，设置环境变量LC_ALL为zh_CN.UTF-8，将项目代码复制到指定目录，并赋予运行脚本执行权限，最后安装项目所需依赖包。$ FROM centos:7 $ RUN localedef -c -f UTF-8 -i zh_CN zh_CN.utf8 $ ENV LC_ALL zh_CN.UTF-8 $ COPY ./hrms $CODE_DIR/hrms/ $ COPY ./run $CODE_DIR/run/ $ RUN chmod a+x $CODE_DIR/run/* $ RUN pip3 install -r $CODE_DIR/hrms/requirements.txt

1. 分组解析不再生成.txt文件，Excel文件复用性提升； 2. 汇总表生成自动过滤理论成绩与质量实训成绩，变更次日签到状态； 3. 收费表支持后续签到人员信息增量追加，保留已手动补充人员的信息； 4. 输入框均保留上一次输入过的历史记录，统一按钮样式； 5. 右键菜单支持多种配色风格自由切换。

16,718

社区成员

110,522

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章