Node.js 实现的一个 Scrapy like 爬虫框架

This topic created in 3853 days ago, the information mentioned may be changed or developed.

闲来无事想用 Node.js 写点东西练手，同时又想些爬虫，于是乎就有了这样一个爬虫项目。之前有过 Scrapy 的开发经验，于是乎就模仿 Scrpay 的 api 用 Node.js 实现了一套。
附上 github 地址： https://github.com/SteveZhangBit/leiobunum

名字取做 leiobunum 意思是长脚蜘蛛，感觉很形象啊～

本身 Node.js 就是异步 IO ，非常适合爬虫这种高 IO 的程序，并且本身 Scrapy 也是建立在 Twisted 上的，所以用 Node.js 实现起来简直爽歪歪。

自己还加上了一个 Redis 的支持，可以实现简单的分布式，实际测试原来要用数小时的爬去过程，缩短到了 10 来分钟，哈哈哈

欢迎大家 fork 和 star

Supplement 1 · Nov 28, 2015

发现 github 上空空如也，赶紧写了个 README...
里面写了基本的用法，和附上了我自己测试过的一个例子。

Node

Scrapy

爬虫

爬去

8 replies • 2016-12-13 16:14:04 +08:00