防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法
防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法
1
FrankFang128 Jun 11, 2015 via Android
把内容写在CSS里,使用你自己特制的字体,比如『我』的Unicode 码对应你
|
2
superliang Jun 11, 2015
加干扰码或者异步加载内容,不过不管怎么防止采集对搜索引擎都不友好
|
3
banri Jun 11, 2015 via iPhone
直接来源不就行了,妈妈再也不用担心被采集啦!
说真的都写前端了,就不要担心扒皮的事儿,因为100%可以被扒皮啊… |
4
banri Jun 11, 2015 via iPhone
:D 打错了是开源
|
5
kisshere Jun 11, 2015 via Android
全部用js生成模板
|
6
binux Jun 11, 2015 via Android
没有办法
|
7
lwbjing Jun 11, 2015
canvas重绘。。
|
8
endoffight Jun 11, 2015
js模板 selenium直接秒杀
|
9
typcn Jun 11, 2015
修改 nginx 配置,listen 80 改成 listen 127.0.0.1:80
|
11
learnshare Jun 11, 2015 后端直接渲染成图片
|
12
seerhut Jun 11, 2015
只要字体规整,图片也能高效ocr....
|
13
gangsta Jun 11, 2015
|
14
Busy Jun 11, 2015
不可能,综上
|
15
onlyice Jun 11, 2015 via Android
Canvas....
|
16
johnsmith123 Jun 11, 2015
怎么防止我发到网上的东西不会被复制?
|
17
liujiantao Jun 11, 2015 via Android
看看我这个 /t/157243
|
18
kokdemo Jun 11, 2015
……我觉得这只是增加了采集的门槛
但是也够了 |
19
thankyourtender Jun 11, 2015
日他,正面刚他,
|
20
Andy1999 Jun 11, 2015 via iPhone
屏蔽外部IP
|
22
mcone Jun 11, 2015
没办法 很难
百度知道现在的做法是,如果你ip访问频率过高,会随机替换一段话中的某几个字,用图片显示,这样你采集到的文字就是不完整的奇奇怪怪的 |
24
amxku Jun 11, 2015
其实还是有一些办法的,除了频率外,比如判断访问路径,是否加载了资源文件等等,就看你这数据是不是值得花这么大成本去做
|