C#如何从html标记中读取所要的文字?

ChinaHappyCat 2009-04-01 11:38:00
html里面有个<div class="p">,我想从这个div开始读取到这个div结束!如何操作?
<html>
.......
.......
<div class="p">
//这里是我想读取到的内容
</div>
.......
.......
</html>
...全文
348 13 打赏 收藏 转发到动态 举报
写回复
用AI写文章
13 条回复
切换为时间正序
请发表友善的回复…
发表回复
loong08 2009-04-02
  • 打赏
  • 举报
回复
.net 技术交流群34938110
loong08 2009-04-02
  • 打赏
  • 举报
回复
.net 技术交流群34938110
loong08 2009-04-02
  • 打赏
  • 举报
回复
.net 技术交流群34938110
jiejiep 2009-04-02
  • 打赏
  • 举报
回复
不好意思,写错。 用foreach(object i in mydiv)
jiejiep 2009-04-02
  • 打赏
  • 举报
回复
写个JS,主要语句:
var mydiv = document.getElementsByTagName("div");
for(object i in mydiv)
{
if(mydiv[i].className=="p") return mydiv[i].firstChild.nodeValue;//获取你要的节点的内容;
}
试试看。
jietuan 2009-04-02
  • 打赏
  • 举报
回复
使用正则表达式最好,你也可以使用dom,获取div里面的内容,但必须要把div这些标志附加上去。
vsstudio05 2009-04-02
  • 打赏
  • 举报
回复
上面的Groups["groupname"].Value;改成--------->
Groups["content"].Value;

vsstudio05 2009-04-02
  • 打赏
  • 举报
回复
string resultString = "你的内容";
try {
resultString = Regex.Match(subjectString, "<div[^>]*(?<content>[^<]*)</div>", RegexOptions.IgnoreCase).Groups["groupname"].Value;
} catch (ArgumentException ex) {
// Syntax error in the regular expression
}
tianyong0913 2009-04-02
  • 打赏
  • 举报
回复
用dom 操作或则是jquery 操作。
018 2009-04-02
  • 打赏
  • 举报
回复
用WebBrowser,可获取html的元素,好好研究一下。
ChinaHappyCat 2009-04-02
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 vsstudio05 的回复:]
C# codestring resultString = "你的内容";
try {
resultString = Regex.Match(subjectString, "<div[^>]*(?<content>[^<]*)</div>", RegexOptions.IgnoreCase).Groups["groupname"].Value;
} catch (ArgumentException ex) {
// Syntax error in the regular expression
}
[/Quote]

subjectString是什么东西啊???
zhouxingyu896 2009-04-02
  • 打赏
  • 举报
回复
C#中有可以通过URl请求,将网页源文件成string型的方法,可对string型的字符串进行分析,通过对<div的查找,然后提出你需要的内容
就是对网页拔取再分析
kongdelu2008 2009-04-02
  • 打赏
  • 举报
回复
您可以向C#窗体添加一个WebBrowser控件(在“公共控件”组里),然后将WebBrowser控件的Url属性设置为您要显示的HTML文件就可以了。
本DataGridView打印控件和.NET轻松打印控件5.0版(含报表模板设计组件)2012年5月12日修改完成,完全免费,在.NET2.0及以上环境下都可以使用(VB、C#等都可以用),有帮助文档与使用实例。 与4.95版相比,控件5.0版的主要更改如下: 1、解决了生成预览及打印过程的状态窗口显示的“第 页共 页”问题,现在可以正确显示总页数。 2、增加了打印DataGridView选定内容(选定行、列或矩形区域)的功能。对DGVPrint组件,设置PrintRange属性为相应的值即可,而对于VB2008Print组件,请先用CopyDataGridViewSelectedRange函数将要打印的DGV复制到新的DGV,然后再用PrintDGV函数打印这个新DGV即可。 3、增加了大量的绘图函数(如路径、多边形、填充多边形、曲线等),基本上.NET的GDI+绘图函数都有了(注意,填充类绘图函数名称为DrawFill……,而不是GDI+的Fill…。另外,对于Brush参数,只支持SolidBrush、TextureBrush、LinearGradientBrush三种类型的画刷,而且对于后2个画刷,只支持其的主要属性。 4、增加了直接打印Panel、GroupBox等容器控件的内容的DrawPanel函数(对容器的TextBox控件与Label控件以文本的形式打印,除此之外的其他除容器控件之外的控件如CheckBox、ComboBox、Button控件等则直接以图片的形式打印,函数还支持嵌套容器控件的打印,且如果一页打印不下具有自动换页续打功能)。借助该函数的功能,您可以在Panel等容器控件设计好要打印的内容及打印相对位置,控件轻松帮助您解决打印问题。(参见演示实例) 5、增加了报表文件及模板文件的自动关联功能。在运行了“打印控件安装.msi”文件安装了打印控件的前提下,双击报表文件(扩展名为you的文件)即可打印预览该报表的内容;双击报表模板文件(扩展名为mb的文件)即可进入报表模板修改界面(此时如果打印预览报表模板不会有数据,因为这样修改报表模板时是没有设置数据源的)。 6、解决了原EasyReport报表组件由于资源释放不及时,在多次重复使用时占用大量句柄而可能产生的不能打印或预览问题。 7、解决了DataGridView在有固定列(冻结列)的时候,有些情况下(DGV固定列的index与DisplayIndex不一致时)打印可能出错的问题。 8、DGVPrint组件的自定义纸张使用更方便,设计时在可以通过设置PaperHeight与PaperWidth属性设置,运行时在“打印参数”设置窗口也可设置自定义纸张大小。 9、解决了EasyReport组件“页表头”区域设置的背景图片覆盖该区域打印内容的问题。 10、增加了打印XML格式的HTML文档的功能(目前只支持部分HTML标记,不支持表格及图片等标记,请参见DrawXML函数) 11、对帮助文件做了进一步的修订 12、增加了很多新的演示实例。 13、其他一些完善和修改。 本控件特色: 1、强大的DataGridView打印功能,不仅可以以多种形式(普通打印、分栏打印、跨页打印、工资条打印)打印DataGridView表格,基本上能完全按DataGridView控件本身设置的格式如字体、字号、背景颜色、前景颜色、单元格对齐方式等打印出来,文字图像都可以打印,而且是完全根据表格当前的显示顺序进行打印的,如果您在使用时调整了列的顺序,刷新打印后就会按调整后的列显示顺序进行打印,基本上做到了所见即所得的打印。 2、报表设计功能,这是4.7版控件的新增功能。报表模板设计组件EasyReport与WebEasyReport组件可以设计普通报表、分组报表、套打模板等,分别以DataGridView和GridView为数据源。控件的位置以毫米为计量单位,定位准确,很适合套打单据设计。 3、分组汇总打印DataGridVeiw功能,每组还可以自动换新页打印,还可以自动增加行号。 4、强大的文本打印输出功能,有多个文本打印重载函数,打印文本时,如果需要,控件会自动换行或换页打印输出。 5、支持同一文档多种版面格式打印(类似于Word的节的功能):对同一份文档,不同的页面可以设置不同的格式(纸张大小、纸张方向、页边距),只需要在新增一页时在NewPage方法指定要使用的页面格式即可,使用非常简单。 6、报表文件保存功能。本控件允许将当前打印预览的内容保存为报表文件,以后使用本控件重新打开该报表文件即可重现原来保存报表时的打印内容。 7、打印方案保存与读取功能。可以将当前打印参数保存为打印方案文件,或都从保存的打印方案文件读取打印参数。 8、水印

111,126

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Creator Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧