关于采集使用函数的疑问
我一直使用file_get_contents来进行远程文件读取然后正则分析。但是发现效率不是很理想。
在普通服务器上用,无法使用curl函数(很少有服务器有这个扩展),所以只能使用fsockopen、fopen、file等函数来实现。
今天做了一下测试,发现fsockopen然后fgets的效果似乎比file速度更快。
我尝试过去qq上请教一些比较成功的采集程序的制作人,但是很难得到人家的指点,也许都希望技术独有罢。
搜索之前的文章,关于远程读取的屈指可数,其中比较有用的也就是gu1dai的一篇询问可否多次fgets/fputs用同一个fsockopen句柄来节省资源提高效率的文章,但是其中并没有一个较好的解决方法。
请教:如果读取一个网站上多篇文章的时候,远程读取文件用什么效果更好?