很让我纠结的问题 求解

ryan_Donet 2010-07-29 04:24:30

$get=file_get_contents("test.html") or die("指定html源码获取失败");//再次获取该html的源码
$get=(string)$get;
$str=array();
$str=explode('。', $get);//以句号为分割截取一句话内容 放入数组中


我是从WIKI网站抓取的一片文章 然后我一句好分割 但就是分不了我把这个函数单独测试下 测试了几句话就没问题 可以分 为什么当分割网页上的句号就不行了 空格都可以 就句号分不了 为什么啊
在线等
...全文
137 9 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
hellokityy 2010-07-29
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 hellokityy 的回复:]

引用 2 楼 dingsongtao 的回复:

句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分

iconv 转
[/Quote]
也给俺点分。毕竟是mm.不容易
ryan_Donet 2010-07-29
  • 打赏
  • 举报
回复
Ok 问题解决了 拿分吧
kyzy_yy_pm 2010-07-29
  • 打赏
  • 举报
回复
编码问题
不同的编码你进行分割很容易找不到分隔符
ryan_Donet 2010-07-29
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 hellokityy 的回复:]
引用 2 楼 dingsongtao 的回复:

句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分

iconv 转
[/Quote]
再测中
hellokityy 2010-07-29
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 dingsongtao 的回复:]

句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分
[/Quote]
iconv 转
hellokityy 2010-07-29
  • 打赏
  • 举报
回复
成分啊。
ryan_Donet 2010-07-29
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 dingsongtao 的回复:]
句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分
[/Quote]
恩网站上的是UTF-8的 那么我该怎么做呢
Dleno 2010-07-29
  • 打赏
  • 举报
回复
句号实际上属于中文了。
你这里的句号的编码必要和你获取到的网页内容的编码一致,才可以通过explode来拆分
xuzuning 2010-07-29
  • 打赏
  • 举报
回复
你的程序是 gbk 编码的吧?

21,893

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧