社区
网络编程
帖子详情
如何编程获得网页里面的内容
wdasheng
2003-05-23 01:50:54
我有了网页的源码,怎样可以获得网页里面的现实的内容,那位高手给个例子,谢谢
...全文
54
3
打赏
收藏
如何编程获得网页里面的内容
我有了网页的源码,怎样可以获得网页里面的现实的内容,那位高手给个例子,谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
wdasheng
2003-05-23
打赏
举报
回复
我的问题没有那么复杂,我是得到了一个网页的源码,并且存到了一个CString,我现在是要从这个字符串中分析出内容
叶子哟
2003-05-23
打赏
举报
回复
VARIANT id, index;
CComPtr<IDispatch> spDispatch;
CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> pDoc2;
CComPtr<IHTMLElement> pElement;
CComPtr<IHTMLElementCollection> pElementCol;
CComPtr<IHTMLFormElement> pFormElement;
CComPtr<IHTMLInputTextElement> pInputElement;
//首先获取IWebBrowser2接口
CoInitialize(NULL); //必须要这句初始化
SHDocVw::IWebBrowser2Ptr spBrowser(spDisp);
if (m_spSHWinds == NULL)
{
if (m_spSHWinds.CreateInstance(__uuidof(SHDocVw::ShellWindows)) != S_OK)
{
MessageBox("Failed");
CoUninitialize();
}
}
if (m_spSHWinds)
{
int n = m_spSHWinds->GetCount();
for (int i = 0; i < n; i++)
{
_variant_t v = (long)i;
IDispatchPtr spDisp = m_spSHWinds->Item(v);
SHDocVw::IWebBrowser2Ptr spBrowser(spDisp); //生成一个IE窗口的智能指针
if (spBrowser)
{
//获取IHTMLDocument2接口
if (SUCCEEDED(spBrowser->get_Document( &spDispatch)))
pDoc2 = spDispatch;
if(pDoc2!=NULL)
{
// AfxMessageBox("已经获取IHTMLDocument2");
if (SUCCEEDED(pDoc2->get_forms(&pElementCol)))
{
// AfxMessageBox("已经获取IHTMLElementCollection");
long p=0;
if(SUCCEEDED(pElementCol->get_length(&p)))
if(p!=0)
{
for(long i=0;i<=(p-1);i++)
{
V_VT(&id) = VT_I4;
V_I4(&id) = i;
V_VT(&index) = VT_I4;
V_I4(&index) = 0;
if(SUCCEEDED(pElementCol->item(id,index, &spDispatch)))
if(SUCCEEDED(spDispatch->QueryInterface(IID_IHTMLFormElement,(void**)&pFormElement)))
{
// AfxMessageBox("已经获取IHTMLFormElement");
long q=0;
if(SUCCEEDED(pFormElement->get_length(&q)))
for(long j=0;j<=(q-1);j++)
{
V_VT(&id) = VT_I4;
V_I4(&id) = j;
V_VT(&index) = VT_I4;
V_I4(&index) = 0;
if(SUCCEEDED(pFormElement->item(id,index, &spDispatch)))
if(SUCCEEDED(spDispatch->QueryInterface(IID_IHTMLInputTextElement,(void**)&pInputElement)))
{
//AfxMessageBox("已经获取IHTMLInputTextElement");
CComBSTR value;
CComBSTR type;
pInputElement->get_type(&type); //获取输入框类型(密码框还是文本框)
CString strtype(type);
strtype.MakeUpper();
if(strtype.Find("TEXT")!=-1) //获取文本框的值
{
pInputElement->get_value(&value);
CString str(value);
if(!str.IsEmpty())
m_ctrlIE.InsertItem(0, _bstr_t(value)+_bstr_t(" 【可能是用户名或其他需提交的内容】"));
}
else if(strtype.Find("PASSWORD")!=-1) //获取密码框的值
{
pInputElement->get_value(&value);
CString str(value);
if(!str.IsEmpty())
m_ctrlIE.InsertItem(0, _bstr_t(value) + _bstr_t(" 【应该是密码】"));
}
}
}
}
}
}
}
}
}
}
}
yztgx
2003-05-23
打赏
举报
回复
什么意思?
用htmlView?
java通过url获取
网页
内容
_java通过url获取
网页
内容
在java中,一个url的简单小应用,就是通过url爬取
网页
的
内容
。在这里会遇到一个小问题,如果是服务器端禁止抓取,会在控制台报 HTTP 403错误代码。例如CSDN博客网站java.io.IOException: Server returned HTTP response code: 403 for URL:解决方法:可以通过设置User-Agent来欺骗服务器。httpUrlConn.set...
Java使用URL获取
网页
内容
使用URLConnection来获取
网页
的
内容
,发送get方法,如果所提供的是CSS代码,需求所需要的结果需要用到正则表达式来获取。package Get;import Post.PostMethod;import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import
用正则表达式获取
网页
里面
的
内容
/java面试题
今天,我看到这篇帖子,感觉很好,就打算看看。 我这个人看书的话不能有答案的,下面有答案,真的会影响自己思考。 就想着把
里面
的题目留下了,实在不会就去
网页
上面看看,这样子好点。 Java面试题全集(上) http://blog.csdn.net/jackfrued/article/details/44921941/ 然后就遇上 一些问题,记录下。 首先就是把整个页面扒
3.2JavaScript
网页
编程
——JavaScript
网页
编程
基础
特殊的几个为假的:undefine、null、0、false、‘’ 这五个和&&直接不用判断后面 和 ||直接看后面,(nan是非数值,所以不考虑,一般也可以暂且看做false,在if条件
里面
也是),并返回该数组的新长度arr.unshift(‘ewer’,‘rewt’),添加之后是[‘ewer’,‘rewt’,…prompt()的获取输入默认是字符串类型,可以+prompt()获取就是数字类型了,括号
里面
可以加提示字符串。前面括号是定义,传入的函数是形参,后面的括号是调用执行,
里面
是实参。
[java]通过
网页
class获取标签
内容
这里我编写了两个类,一个是CatHttp,一个是测试代码用的类。 CatHttp主要是用来写调用方法的,简化测试代码的代码量。 这里那b站做例子,pc端
网页
,首先访问
网页
获取页面源代码 - 访问并获取
网页
源码 //CatHttp类 public String getHttpText(String Url) { // TODO Auto-generated method stub try { // 获取url url = new URL(Url); // 下载资源 Ht.
网络编程
18,356
社区成员
64,214
社区内容
发帖
与我相关
我的任务
网络编程
VC/MFC 网络编程
复制链接
扫一扫
分享
社区描述
VC/MFC 网络编程
c++
c语言
开发语言
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章