社区
脚本语言
帖子详情
perl处理HTML文档
quanfeng
2006-04-03 12:22:03
请问大家,利用perl处理html文档,有没有已经写好的源代码找出文章内容?谢谢
...全文
437
4
打赏
收藏
perl处理HTML文档
请问大家,利用perl处理html文档,有没有已经写好的源代码找出文章内容?谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
蒋晟
2006-04-06
打赏
举报
回复
http://search.cpan.org/dist/HTML-Parser/
jackaltan
2006-04-05
打赏
举报
回复
什麽叫做“找出文章内容”?
將html作爲文本文件(.txt)處理不就可以了~~?能讀入和寫出html文件阿~~
你是要剔除那些標記只留下文件内容嗎?
ChumpKlutz
2006-04-03
打赏
举报
回复
看看帮助文档吧
没有办法,虽然自己英文非常非常烂,为了解决问题我还是硬着头皮去看呀
xyzxyz1111
2006-04-03
打赏
举报
回复
有HTML Parser
Perl
实例精解(第三版).pdf
原书名:
Perl
by Example(Third Edition),原出版社: PH PTR,作者: Ellie Quigley,译者: 杜炜,出版社:清华大学出版社,出版日期:2002 年8月,PDF 格式,大小 19 Mb。 内容简介 本书以最新版本的
Perl
5.6.1为范本,全面介绍了
Perl
语言,其内容包含
Perl
的所有主题。对每个主题都使用了范例说明,从
Perl
变量、正则表达式,到编写报表、CGI脚本和网络应用,并对范例程序进行了解释。读者可以很容易地通过这些范例掌握
Perl
语言的语法。附录含有完整的函数和定义、命令行开关、特殊变量、常见模块和
Perl
调试器的列表,全功能的、面向对象的CGI程序,一些有用的脚本,以及很有帮助的HTM教程。 本书非常适合于
Perl
语言初学者阅读,对于
Perl
程序员,也有很大的参考价值。 目录 第1章 实用摘要和报表语言 1.1 什么是
Perl
1.2
Perl
用户 1.3
Perl
的版本 1.4 如何获得
Perl
1.5 什么是CPAN 1.6
Perl
文档
第2章
Perl
脚本 2.1 从命令行使用
Perl
2.1.1 七开关 2.1.2 -n开关 2.1.3 -c开关 2.2 脚本设置 2.3 脚本 2.3.1 开始 2.3.2 注释 2.3.3
Perl
语句 2.3.4 执行脚本 2.3.5 脚本范例(UNIX, Windows) 练习1 了解
Perl
的语法 .第3章 获得打印句柄 3.1 文件句柄 3.2 字 3.2.1 引号 3.2.2 实量(常量) 3.3 print函数 3.3.1 打印实量 3.3.2 警告编译指示和-w开关 3.3.3 strict编译指示和字 3.4 printf函数 3.4.1 sprintf函数 3.4.2 无引号打印:here document 练习2 编写literals脚本 第4章 变量 4.1 关于
Perl
变量 4.1.1 类型 4.1.2 作用域和包 4.1.3 命名规范 4.1.4 赋值语句 4.1.5 引号规则 4.2 标量、数组和散列 4.2.1 标量变量 4.2.2 数组 4.2.3 散列 4.3 从STDIN读取 4.3.1 把输入赋值给标量变量 4.3.2 chop和chomp函数 4.3.3 read函数 4.3.4 getc函数 4.3.5 将输入赋值给数组 4.3.6 将输入赋值给散列 4.4 数组函数 4.4.1 chop和chomp函数(用于列表) 4.4.2 exists函数 4.4.3 delete函数 4.4.4 grep函数 4.4.5 join函数 4.4.6 map函数 4.4.7 pack和unpack函数 4.4.8 pop函数 4.4.9 push函数 4.4.10 shift函数 4.4.11 splice函数 4.4.12 split函数 4. 4.13 sort函数 4.4.14 reverse函数 4.4.15 unshift函数 4.5 散列(关联数组)函数 4.5.1 keys函数 4.5.2 values函数 4.5.3 each函数 4.5.4 delete函数 4.5.5 exists函数 4.6 关于散列的更多内容 4.6.1 从文件加载散列 4.6.2 特殊散列 4.6.3 语境 练习3 特殊字符 第5章 运算符 5.1 关于
Perl
运算符 5.2 混合数据类型 5.3 优先权与结合性 5.3.1 赋值运算符 5.3.2 关系运算符 5.3.3 等值运算符 5.3.4 逻辑运算符(短路运算符) 5.3.5 逻辑字运算符 5.3.6 算术运算符 5.3.7 自动递增和自动递减运算符 5.3.8 位逻辑运算符 5.3.9 条件运算符 5.3.10 范围运算符 5.3.11 特殊字符串运算符和函数 5.3.12 生成随机数 5.3.13 rand/srand函数 练习4 运算符 第6章 条件 6.1 控制结构,块和复合语句 6.2 决策--条件结构 6.2.1 if和unless语句 6.2.2 unless语句结构 6.3 循环 6.3.1 while循环 6.3.2 until循环 6.3.3 for循环 4.5.2 values函数 4.5.3 each函数 4.5.4 delete函数 4.5.5 exists函数 4.6 关于散列的更多内容 4.6.1 从文件加载散列 4.6.2 特殊散列 4.6.3 语境 练习3 特殊字符 第5章 运算符 5.1 关于
Perl
运算符 5.2 混合数据类型 5.3 优先权与结合性 5.3.1 赋值运算符 5.3.2 关系运算符 5.3.3 等值运算符 5.3.4 逻辑运算符(短路运算符) 5.3.5 逻辑字运算符 5.3.6 算术运算符 5.3.7 自动递增和自动递减运算符 5.3.8 位逻辑运算符 5.3.9 条件运算符 5.3.10 范围运算符 5.3.11 特殊字符串运算符和函数 5.3.12 生成随机数 5.3.13 rand/srand函数 练习4 运算符 第6章 条件 6.1 控制结构,块和复合语句 6.2 决策--条件结构 6.2.1 if和unless语句 6.2.2 unless语句结构 6.3 循环 6.3.1 while循环 6.3.2 until循环 6.3.3 for循环 6.3.4 foreach循环 6.3.5 循环控制 6.3.6 伪开关语句 练习5 条件是什么 第7章 正则表达式--模式匹配 7.1 什么是正则表达式 7.2 表达式修饰符和简语句 7.2.1 条件修饰符 7.2.2 DATA文件句柄 7.2.3 循环修饰符 7.3 正则表达式运算符 7.3.1 m运算符和匹配 7.3.2 s运算符和替换 7.3.3 模式绑定运算符 练习6 它是sed、awk或grep吗?尝试
Perl
第8章 获得控制:正则表达式元字符 8.1 正则表达式元字符 8.1.1 用于单字符的元字符 8.1.2 白空元字符 8.1.3 重复模式匹配的元字符 8.1.4 tr或y函数 8.2 统一字符编码(Unicode) 练习7 是sed、awk或grep吗?给出
Perl
的另外一个作用 第9章 获得文件句柄 9.1 用户定义文件句柄 9.1.1 打开文件:open函数 9.1.2 打开文件读 9.1.3 打开文件写 9.1.4 Win32文件 9.1.5 打开文件添加 9.1.6 select函数 9.1.7 使用flock锁住文件 9.1.8 seek和tell函数 9.1.9 打开文件读写 9.1.10 管道打开 9.2 传送参数 9.2.1 ARGV数组 9.2.2 ARGV和Null文件句柄 9.2.3 eof函数 9.2.4 -i开关:原位编辑文件 9.3 文件测试 练习8 获得文件句柄 第10章 子程序和函数 10.1 子程序/函数 10.1.1 定义和调用于程序 10.1.2 传送参数 10.1.3 原型 10.1.4 返回值 10.1.5 通过引用调用--别名和Typeglobs 10.1.6 通过指针传送 10.1.7 自动加载 10.1.8 BEGIN和END子程序(开始和结束) 10.1.9 subs函数 练习9 子程序不可缺少 第11章 模块化、打包并发送到库 11.1 包和模块 11.1.1 类比 11.1.2 定义 11.1.3 符号表 11.2 标准
Perl
库 11.2.1 @INC数组 11.2.2 包和.p1文件 11.2.3 模块和.pm文件 11.2.4 来自CPAN的模块 练习10 将所有的
Perl
都放入包中 练习11 压缩并放入库中 第12章 这个工作要求引用吗 12.1 什么是引用 12.1.1 符号引用与硬引用 12.1.2 硬引用 12.1.3 引用和匿名变量 12.1.4 嵌套数据结构 12.1.5 引用和子程序 12.1.6 文件句柄引用 12.1.7 ref函数 练习12 指向地址 第13章 面向对象的
Perl
13.1 OOP范型 13.1.1 回顾包和模块 13.1.2 一些面向对象的专用术语 13.2 类、对象和方法 13.2.1 类和专用性 13.2.2 对象 13.2.3 bless函数 13.2.4 方法 13.2.5 多态性和动态绑定 13.2.6 析构函数和无用存储单元收集 13.3 继承 13.3.1 @ISA数组和调用方法 13.3.2 $AUTOLOAD,sub AUTOLOAD和UNIVERSAL 13.3.3 派生类 13.3.4 多重继承 13.3.5 面向对象术语--父方法 13.4 公共用户接口:
文档
编制类 13.4.1 pod文件 13.4.2 pod命令 13.4.3 如何使用pod解释程序 13.4.4 将pod
文档
翻译成文本 13.4.5 将pod
文档
翻译成
HTML
13.5 使用
Perl
库中的对象 13.5.1 再看标准
Perl
库 13.5.2 标准
Perl
库中面向对象的模块 13.5.3 使用标准
Perl
库中的模块 练习13 这一课的对象是什么 练习14 函数Pod中的
Perl
第14章 tie函数,DBM文件和数据库挂钩 14.1 连接变量与类 14.1.1 tie函数 14.1.2 预定义方法 14.1.3 连接标量 14.1.4 连接数组 14.1.5 连接散列 14.2 DBM文件 14.2.1 创建并赋给DBM文件数据 14.2.2 从DBM文件检索数据 14.2.3 从DBM文件中删除项 第15章
Perl
数据库编程 15.1 本章概述 15.2
Perl
数据库编程 15.3 使用RDBMS的
Perl
编程 15.3.1 在Windows系统上安装
Perl
15.3.2 使用PPM在Windows系统上安装
Perl
模块 15.3.3 安装RDBMS 15.3.4 为MMS范例创建DSN 15.4 使用ADO和DBI访问MSS 15.4.1 Microsoft SQL Server--范例15-1和15-3的查询 15.4.2 范例15-1:ex1.p1在MS SQL Server上的ADO简单查询,DSN 15.4.3 执行DDL和DML操作 15.4.4 范例15-2:ex2.p1 MSS上persons.sql的
Perl
ADO,无DSN 15.4.5 范例15-3:ex3.p1 MS SQL Server上的
Perl
DBI范例 15.4.6 范例15-4:ex4.p1 MSS上persons.sql的
Perl
DBl 15.5 使用ADO和DBI访问Oracle 15.5.1 Oracle--范例15-5(ADO)和15-7(DBI)的简单查询 15.5.2 为Oracle范例创建DSN 15.5.3 范例15-5:ex5.p1 Oracle上的ADO简单查询,DSN 15.5.4 在Oracle上执行DDL和DML操作 15.5.5 范例15-6:ex6.pl Oracle上persons.sql的
Perl
ADO,无DSN 15.5.6 范例15-7:ex7.pl Oracle上的
Perl
DBI简单查询 15.5.7 范例15-8:ex8.ploracle上persons.sql的
Perl
DBI 15.6 练习:非编程 练习15 使用MSS 练习16 在MSS中执行persons.p1 练习17 使用Oracle 练习18 在Oracle中执行persons.p1 15.7 参考文献 第16章 与系统接口 16.1 系统调用 16.1.1 目录和文件 16.1.2 目录和文件属性 16.1.3 查找目录和文件 16.1.4 创建目录--mkdir函数 16.1.5 删除目录--rmdir函数 16.1.6 更改目录--chdir函数 16.1.7 通过目录文件句柄访问目录 16.1.8 许可和所有权 16.1.9 硬和软链接 16.1.10 更改文件名 16.1.11 更改访问和修改时间 16.12 文件统计量 16.1.13 低级文件I/O 16.1.14 压缩和解压缩数据 16.2 进程 16.2.1 UNIX进程 16.2.2 Win32进程 16.2.3 环境(UNIX和Windows) 16.2.4 进程和文件句柄 16.2.5 进程优先权和Nice 16.2.6 口令信息 16.2.7 时间和进程 16.2.8 UNIX进程创建 16.2.9 Win32进程创建 16.3 其他与操作系统接口的途径 16.3.1 syscall函数和h2hp脚本 16.3.2 命令替换--备份引号 16.3.3 Shell.pm模块(
Perl
) 16.3.4 system函数 16.3.5 here documents 16.3.6 Globbing(文件名扩展和通配符) 16.4 错误
处理
16.4.1 die函数
Perl
实例精解(第四版).文字版_第一部分.zip
Perl
实例精解(第四版).文字版 带中文电子书签 为什么要学
Perl
?回答是各种各样的。我对学习
Perl
的各种各样的人感到惊奇:工程师、科学家、基因学家、气象学家、经理、销售员、程序员、老师、硬件人员、小学生、证券商、各种管理员、作家、银行学等等。
Perl
不排除任何人,
Perl
是为每个人和每件事服务的。 无论是谁,我认为都会同意这句话:一图抵千言,这是个很好的例子。《
Perl
实例精解》(
Perl
by Example)是通过简明的范例从头开始教大家学习
Perl
。它不只是初学者指导,而且是
Perl
的完整指南。从正则表达式
处理
到格式化报表,从数据库到进程间通信以及Web开发。它教大学
Perl
,同时教了大家许多Unix和Windows知识。设计网络、系统调用、IPC和CGI这些主题可以节省了解函数作用、所需要的库以及正确语法的时间。同时还介绍了
Perl
对象、引用和CGI。
Perl
有丰富的函数,用于
处理
字符串、数组、系统接口、网络等等。为了理解这些函数的作用,在展示函数的范例程序之前,提供了这些函数的背景信息,以避免查阅手册和其它书籍。 本书还有包含了完整函数定义、命令行开关、特殊变量、常见模块和
Perl
调试器列表的附录;同时,还有一个全功能的、面向对象的CGI程序和其它一些有用的脚本和
HTML
教程。 本书作者在教授了8年的
Perl
后发现,很多新学
Perl
的在自学如何编程时会感到灰心。大多数人最佳的方法是从简洁的小范例和实践中学习,于是本书诞生了。 第1章 实用摘要和报表语言 第2章
Perl
脚本 第3章 获得打印句柄 第4章 变量 第5章 运算符 第6章 条件 第7章 正则表达式——模式匹配 第8章 获得控制:正则表达式元字符 第9章 获得文件句柄 第10章 子程序和函数 第11章 模块化、打包并发送到库 第12章 这个工作要求引用吗 第13章 面向对象的
Perl
第14章 tie函数,DBM文件和数据库挂钩 第15章
Perl
数据库编程 第16章 与系统接口 第17章 报表编写示例 第18章 网上发送 第19章 CGI与
Perl
附录A
Perl
固有函数、编译指示、模块和调试器 附录B 有用的
Perl
脚本 附录C 面向对象的
Perl
/CGI程序 附录D
HTML
文档
:基础介绍
perl
-gib:
Perl
吉卜
perl
gib是
Perl
的替代
文档
和测试经理。 介绍
perl
gib生成
HTML
,Markdown和Pod
文档
,并从
Perl
代码注释行运行测试。 安装 $
perl
Makefile.pl $ make dist $ VERSION=$(
perl
-Ilib -le 'require "./lib/
Perl
/Gib.pm"; print $
Perl
::Gib::VERSION') $ cpanm
Perl
-Gib-$VERSION.tar.gz 用法 只需运行
perl
gib doc包含索引文件
HTML
文件放入doc -或从
Perl
项目中进行
perl
gib test 。 除了
Perl
模块外,还将
处理
Markdown文件。 有关命令行工具
perl
gib更多信息,请参见以下帮助输出。 Usage:
perl
gib --help|-h | --man|-m | --ver
netscape-bookmarks:(
Perl
)用于
处理
旧的Netscape书签文件的废弃模块
Netscape :: Bookmarks模块 这是
Perl
模块的自述文件。 您可能正在查看此内容,因为您不知道在哪里可以找到您想要的东西。 读一遍,您可能永远不必再阅读任何
Perl
模块。 文献资料 要阅读有关,请查看模块本身中的嵌入式
文档
。 在发行版内部,您可以使用对其进行格式化: %
perl
doc lib/Netscape/Bookmarks.pm 如果已经安装了模块,则可以指定模块名称而不是文件位置: %
perl
doc Netscape::Bookmarks 您可以阅读
文档
并在检查元数据。 标准模块
文档
在SYNOPSIS部分中提供了示例用法,但是您也可以查看examples /目录(如果存在),或查看t /中的测试文件。 安装 您可以使用CPAN客户端安装此模块,该客户端将解析并安装依赖项: % cpan Netscape::Bookmarks % cpanm
OpusTools-
perl
OpusTools-
Perl
软件包 OpusTools-
perl
是用于
处理
在收集的并行数据的工具和脚本的集合。 有用于以各种方式读取,转换和
处理
数据的工具。 请注意,还有一个名为Python程序包,它提供相似的功能,但是即使存在一些重叠,这两个程序包也不涵盖相同类型的任务。 正在安装
perl
Makefile.pl make all make install 要求 需要以下
Perl
库 模块::安装 存档::邮编 DB_文件
HTML
::实体 Lingua ::句子 Ufal :: UDPipe XML ::解析器 XML ::作家 工具及其用法 该软件包包括许多可在命令行上使用的工具。 读取和
处理
数据的工具: opus-read :读取并过滤句子对齐的语料库 opus-cat :从压缩的OPUS语料库文件集合中读取文件 opus-udpipe :使用UDPipe解析OPUS语料库
脚本语言
37,719
社区成员
34,239
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章