lastRSS,MagpieRSS,SimplePie

为了提高sagunman的处理XML的能力,今天专门测试了几个XML的解析类。

以前SaGunman用的是magpierss,这段时间的测试中发现有些采集点的聚合分析不够全面。以至于漏掉不少文章。后来搜索了一下,另外两个XML解析类引起我的注意。

lastrss很小巧,本着实用和小巧的原则,我首先试用了lastRSS,速度非常快。但是测试中发现,lastRSS还是存在和MagpieRSS一样的问题。有些分析不出来。也漏采了一些文章。

不得已测试了一下simplepie这个大块头,光核心文件就是300多K,还不算其他小文件,我首先想到的就是有精简的余地,但是不管这么多。先测试一下能力,这个大块头果然没有让我失望,采集了很多格式的RSS和ATOM,都能完整的抓取而且分析出来。稳定性非常让人满意。可是我发现SimplePie的效率并不是让我很满意,光include这个文件就要花掉不少时间。毕竟SimplePie的文件加起来有将近500K了,而且输出,还产生了很多对我来说无用的数组。大大增加了处理时间,不出我所料,缓存文件也相当巨大。一个缓存文件居然有将近600K。后来上网查了一下资料。发现SimplePie的优点就是处理XML相当强,但是效率是这次测试当中最慢的一个。

后来想想,现在的硬件已经相当快了,lastRSS也比SimplePie快不到1秒,就没有必要去追求速度了。毕竟SaGunman这种全自动的聚合采集系统,稳定、准确才是最重要的。况且国外的服务器性能优越不说,带宽都相当充足。还是用SimplePie吧,不管怎么说还是先测试一段时间看看。

Tags: sagunman, lastrss, magpierss, simplepie, 采集

上一篇: 一个用SaGunman搭建的英文站上线了——Cars-Eye
下一篇: I-Flash-Game上线了

相关文章

访客评论

更新不更新无所谓了,只要程序稳定。
还有你现在主站跟你的那些垃圾站做那么多链接不好的小心被搜索惩罚啊,和垃圾站做连接的网站也会降低权重的。
我还是回一如既往的支持SABLOG,支持小A的
我只有一个blog类站是sa的,其他的都是wp。
在我看来。wp建垃圾站比较方便,wp也有rss采集插件的,并且这个插件是免费的。
而自己认真在做的却是用的sa,省了升级的麻烦,用起来也顺手。
Post by whatsup on 2008-04-17, 3:47 AM #13
呵呵,这样用吗。
Total:14‹ Prev12

发表评论

评论内容 (必填):

My E-mail