PHP文章相似度比较,通过similar_text()比较有点慢,可否有什么好效率?

码无边 2013-07-31 05:45:48
PHP文章相似度比较,通过similar_text()比较有点慢,可否有什么好效率?
如果通过将文章内容全部存入文本,遍历拿需要比较的文章内容,
通过similar_text()比较,这样的方法是否可行?

...全文
446 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
码无边 2013-08-01
  • 打赏
  • 举报
回复
引用 4 楼 xuzuning 的回复:
你也可以用 exec 直接返回差异结果数组

exec("fc 1.txt 2.txt", $a);
print_r($a);
如果你有能力,还可以下载并编译 xdiff 扩展
这个就不知道怎么弄。
码无边 2013-07-31
  • 打赏
  • 举报
回复
引用 4 楼 xuzuning 的回复:
你也可以用 exec 直接返回差异结果数组

exec("fc 1.txt 2.txt", $a);
print_r($a);
如果你有能力,还可以下载并编译 xdiff 扩展
引用 4 楼 xuzuning 的回复:
你也可以用 exec 直接返回差异结果数组

exec("fc 1.txt 2.txt", $a);
print_r($a);
如果你有能力,还可以下载并编译 xdiff 扩展
引用 4 楼 xuzuning 的回复:
你也可以用 exec 直接返回差异结果数组

exec("fc 1.txt 2.txt", $a);
print_r($a);
如果你有能力,还可以下载并编译 xdiff 扩展
引用 4 楼 xuzuning 的回复:
你也可以用 exec 直接返回差异结果数组

exec("fc 1.txt 2.txt", $a);
print_r($a);
如果你有能力,还可以下载并编译 xdiff 扩展
引用 4 楼 xuzuning 的回复:
你也可以用 exec 直接返回差异结果数组

exec("fc 1.txt 2.txt", $a);
print_r($a);
如果你有能力,还可以下载并编译 xdiff 扩展
如果我直接读取数据库表信息,遍历内容,与需要比较的文章内容比较,我又该怎么做呢? 如果我先分词,在通过相似度比较,写算法什么的,是否可以? 因为一旦数据库文章数据量大,靠数据库内容存入文本,再比较,会不会太慢?
xuzuning 2013-07-31
  • 打赏
  • 举报
回复
你也可以用 exec 直接返回差异结果数组

exec("fc 1.txt 2.txt", $a);
print_r($a);
如果你有能力,还可以下载并编译 xdiff 扩展
xuzuning 2013-07-31
  • 打赏
  • 举报
回复
比如(window)
system("fc 1.txt 2.txt > 3.txt");
readfile('3.txt');
linux 还有 wc 命令得到文件的行数
码无边 2013-07-31
  • 打赏
  • 举报
回复
引用 1 楼 xuzuning 的回复:
可以用操作系统提供的文件差异命令 linux : diff window : fc 他们都是按行处理的,报告中行数越多,自然相似度越低
具体是怎么实现呢?
xuzuning 2013-07-31
  • 打赏
  • 举报
回复
可以用操作系统提供的文件差异命令
linux : diff
window : fc
他们都是按行处理的,报告中行数越多,自然相似度越低

21,893

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧