1
stamaimer Nov 16, 2016 via iPhone
xpath ,有个库叫 lxml
|
2
rainysia Nov 16, 2016
1, py 怎么取这文本就不说了吧
2, 用 HBase thrift 写 或者 openTSDB |
3
f8281113 OP 有没有哪位使用过 bulk load
|
4
wmttom Nov 16, 2016
pyquery 写 css 选择器比写 xpath 更简单点
|
5
ubear1991 Nov 16, 2016
thrift
|
6
Wien Nov 16, 2016
bulk load 适合一次性导入到大量数据,而不适合持续导入。如果用 bulk load ,可以先用 python 读取数据到文本文件( csv 等)再通过 hadoop 的 MR 将数据转化成 HFile ,最后用 bulk load 直接导入 Hbase 。
|
7
wellsc Nov 16, 2016 via Android
pyspark
|