你们有在生产环境中用 PhantomJS 做爬虫吗

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 3743 天前的主题，其中的信息可能已经有所发展或是发生改变。

RT

感觉速度太慢了。但是如果有些网站用静态爬虫的话好难分析。

第 1 条附言 · 2015 年 12 月 19 日

我又继续研究了下，我发现在用PhantomJS时候主要碰到下面几个问题

这是我使用PhantomJS的姿势不对，还是现在动态爬虫不够成熟。

9 条回复 • 2015-12-20 16:34:13 +08:00

$fractal314$

fractal314

2015 年 12 月 19 日 via Android

这个适合小规模的抓取，太耗 cpu

rootsir

2015 年 12 月 19 日

@fractal314 headless 哪种不占 CPU 呢

liuzhen

2015 年 12 月 19 日

用 PhantomJS 做截图

$fractal314$

fractal314

2015 年 12 月 19 日

@rootsir 逗逼

rootsir

2015 年 12 月 19 日

@fractal314 擦，干嘛骂人呢

ezreal

2015 年 12 月 19 日

有，我们的 SEO 系统就是用 PhantomJS 做的，所有商品详情页用 PhantomJS 爬下来存 mongoldb 中，爬虫过来直接喂静态的页面

icedx

2015 年 12 月 19 日

我们的充值系统就是通过 PhantomJS 读取支付宝的

flaman

2015 年 12 月 19 日

关键字 scrapy-splash

kkx

2015 年 12 月 20 日 via iPhone

大家有碰到过过一段时间爬取速度变慢的么重起程序后又能恢复速度感觉有内存泄漏问题
我用 phantomjs 和 selenium