求助:用mshtml解析HTML文件,遍历部分标签的问题。

benbebnmao 2010-04-08 06:33:25
比如html部分文件如下
<table >
<thead>
<tr> <th>代码</th> <th>名称</th> <th>时间</th> <th>数量</th> </tr>
</thead>
<tbody >
<tr><th><a href="../requery.php?code=583" target="_parent" >583</a></th>
<th><a href="../requery.php?code=583" target="_parent">工程1</a></th>
<th>2001-04-07</th>
<td><span class="up">110</span></td>
</tr>
<tr> .......... </tr>
</tbody>
</table>
网页中只有一个table,这个table中有很多行,每行的内容都与上类似。
我现在通过
pCollection = pDoc3->getElementsByTagName(L"table");

然后我再怎样取得table每行tr中的代码【583】、名称【工程1】、日期【2001-04-07】、数量【110】他们的文本?
我想知道如何得到table标签下的各个子标签,就如同遍历树结构一样,能够取得每个节点的子节点,父节点?
就是我想通过得到table,然后在得到他的子节点tbody, 再到子节点tr,再得到th,再得到a,然后用getinnertext()得到583这个代码,遍历完一行,我再回溯tbody,然后开始遍历新的tr?
直到遍历完table的所有行tr

多谢了,最好能以代码说明。谢谢!
...全文
473 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
zhuweiping2003 2010-04-13
  • 打赏
  • 举报
回复
在此提供几个网址: (仅供参考)
1 XMLTree.exe 是一个示例演示如何使用 MSXML DOM 接口,从 c + + 应用程序。
http://support.microsoft.com/kb/246230#top

2 VC使用Cmarkup生成、解析xml资料
http://download.csdn.net/source/992877


其中参看第一个 可以对4楼和5楼说的有更加多的理解
benbebnmao 2010-04-13
  • 打赏
  • 举报
回复
好的。我试试chu102给出的方法,差不多我就结贴了。呵呵。
管用的话,不知道可不可以加分结贴。

谢谢~
zhuweiping2003 2010-04-13
  • 打赏
  • 举报
回复
sorry 楼主要解析html 我看成要解析xml了
其实方法都差不多。。。
希望你解决问题后 最好贴出解决方法~
chufeifei 2010-04-11
  • 打赏
  • 举报
回复
尽快结贴啊,楼上说的正解
小哥哥1102 2010-04-09
  • 打赏
  • 举报
回复
这个我可以帮你,我也正弄这个东西呢,我大体给你个简单的代码,你修改一下可能有错
CComPtr< IDispatch > pDisp=NULL;
CComQIPtr <IHTMLElementCollection> pColl;
CComQIPtr<IHTMLTable> Table;
CComQIPtr<IHTMLTableRow> Row;
CComQIPtr <IHTMLElement> pEl;
CComQIPtr <IHTMLElementCollection> pIRows;
CComQIPtr <IHTMLElementCollection> pICell;
CComQIPtr<IHTMLTableCell> pCell;
IHTMLDocument2* pDoc2;
CString str;
BSTR bsStr;
pDoc2->get_all(&pColl);
pColl->tags(COleVariant("table"),&pDisp);
if (pDisp==NULL) return;
pColl.Release();
pColl=pDisp;
pDisp.Release();
long lCnt=0;
pColl->get_length(&lCnt);//得到网页里所有的表格
for (int n=0;n<lCnt;n++)
{
CComVariant cvt;
cvt=(long)n;
pColl->item(COleVariant((long)n),cvt,&pDisp);
Table=pDisp;
pDisp.Release();
long lRow=0;
Table->get_rows(&pIRows);
pIRows->get_length(&lRow);//得到表格里所有的行
for (long j=0;j<lRow;j++)
{
pIRows->item(COleVariant((long)j),COleVariant((long)0),&pDisp);
Row=pDisp;
pDisp.Release();
Row->get_cells(&pICell);
long lCell=0;
pICell->get_length(&lCell);//遍历每一行里面的单元格
for (long k=0;k<lCell;k++)
{
pICell->item(COleVariant((long)k),COleVariant((long)0),&pDisp);
pEl=pDisp;
pCell=pDisp;
pEl->get_outerText(&bsStr);
str=bsStr;//得到单元格里面的内容
pEl.Release();
pDisp.Release();
}
Row.Release();
pICell.Release();
}
pIRows.Release();
Table.Release();
}
pColl.Release();
benbebnmao 2010-04-09
  • 打赏
  • 举报
回复
能再详细点吗,就针对我上面写出的html文件。
多谢啊
firmbird 2010-04-09
  • 打赏
  • 举报
回复
IHTMLTable::get_rows(IHTMLElementCollection **p);
IHTMLTableRow::get_cells(IHTMLElementCollection **p);
IHTMLElementCollection::item(VARIANT name,VARIANT index,IDispatch **pdisp);
IHTMLElement::get_innerText(BSTR *p);
benbebnmao 2010-04-09
  • 打赏
  • 举报
回复
谁知道啊?
指点一下
小哥哥1102 2010-04-09
  • 打赏
  • 举报
回复
IHTMLDocument2 接口你应该知道怎么获取吧,上面代码我没有给出
内容概要:本文介绍了永磁同步电机(PMSM)无感控制技术,特别是高频方波注入与滑膜观测器相结合的方法。首先解释了高频方波注入法的工作原理,即通过向电机注入高频方波电压信号,利用电机的凸极效应获取转子位置信息。接着讨论了滑膜观测器的作用,它能够根据电机的电压和电流估计转速和位置,具有较强的鲁棒性。两者结合可以提高无传感器控制系统的稳定性和精度。文中还提供了具体的Python、C语言和Matlab代码示例,展示了如何实现这两种技术。此外,简要提及了正弦波注入的相关论文资料,强调了其在不同工况下的优势。 适合人群:从事电机控制系统设计的研发工程师和技术爱好者,尤其是对永磁同步电机无感控制感兴趣的读者。 使用场景及目标:适用于需要减少传感器依赖、降低成本并提高系统可靠性的情况,如工业自动化设备、电动汽车等领域的电机控制。目标是掌握高频方波注入与滑膜观测器结合的具体实现方法,应用于实际工程项目中。 其他说明:文中提到的高频方波注入和滑膜观测器的结合方式,不仅提高了系统的性能,还在某些特殊情况下表现出更好的适应性。同时,附带提供的代码片段有助于读者更好地理解和实践这一技术。

3,055

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC HTML/XML
社区管理员
  • HTML/XML社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧