想要提取某个网站的一个页面上的特定内容,页面大体结构就是一些 div 、 table ,需要提取的是一个 table 中的内容, table 有 ID ,要提取的内容也有特定的 class
因为本身项目是 Laravel ,所以想也用 Laravel 实现,请指教一下思路?有什么包可以用?
因为本身项目是 Laravel ,所以想也用 Laravel 实现,请指教一下思路?有什么包可以用?
1
xuxu Jun 3, 2016
这跟 Laravel 没关系😄
|
3
xummerj Jun 3, 2016 |
4
yangqi Jun 3, 2016 和 laravel 没关系,看看 DomCrawler 这个包
|
5
jugelizi Jun 3, 2016
Laravel 什么时候变爬虫了?
curl 抓取 [snoopy] 然后解析 [simple_html_dom_node] |
6
lissome OP |
7
terranboy Jun 3, 2016
goutte 不错 可惜是单线程
|
8
tagtag Jun 3, 2016
file_get_contents+正则
|
9
Moker Jun 3, 2016
phpQuery 用这个,语法和 JQ 一样 $('table').html()
|
10
icybee Jun 3, 2016
进队列,后台守护进程抓去入库,推荐用各种 mq 实现
|
11
thenbsp Jun 3, 2016
|