很让我纠结的问题 求解

ryan_Donet 2010-07-29 04:24:30

$get=file_get_contents("test.html") or die("指定html源码获取失败");//再次获取该html的源码
$get=(string)$get;
$str=array();
$str=explode('。', $get);//以句号为分割截取一句话内容 放入数组中


我是从WIKI网站抓取的一片文章 然后我一句好分割 但就是分不了我把这个函数单独测试下 测试了几句话就没问题 可以分 为什么当分割网页上的句号就不行了 空格都可以 就句号分不了 为什么啊
在线等
...全文
109 点赞 收藏 9
写回复
9 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
hellokityy 2010-07-29
[Quote=引用 5 楼 hellokityy 的回复:]

引用 2 楼 dingsongtao 的回复:

句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分

iconv 转
[/Quote]
也给俺点分。毕竟是mm.不容易
回复
ryan_Donet 2010-07-29
Ok 问题解决了 拿分吧
回复
kyzy_yy_pm 2010-07-29
编码问题
不同的编码你进行分割很容易找不到分隔符
回复
ryan_Donet 2010-07-29
[Quote=引用 5 楼 hellokityy 的回复:]
引用 2 楼 dingsongtao 的回复:

句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分

iconv 转
[/Quote]
再测中
回复
hellokityy 2010-07-29
[Quote=引用 2 楼 dingsongtao 的回复:]

句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分
[/Quote]
iconv 转
回复
hellokityy 2010-07-29
成分啊。
回复
ryan_Donet 2010-07-29
[Quote=引用 2 楼 dingsongtao 的回复:]
句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分
[/Quote]
恩网站上的是UTF-8的 那么我该怎么做呢
回复
Dleno 2010-07-29
句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分
回复
xuzuning 2010-07-29
你的程序是 gbk 编码的吧?
回复
发动态
发帖子
基础编程
创建于2007-09-28

2.1w+

社区成员

从PHP安装配置,PHP入门,PHP基础到PHP应用
申请成为版主
社区公告
暂无公告