niceday
V2EX  ›  问与答

怎么防止前端页面被采集?

  •  
  •   niceday · Jun 11, 2015 · 5188 views
    This topic created in 4026 days ago, the information mentioned may be changed or developed.

    防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法

    24 replies    2015-06-11 23:22:57 +08:00
    FrankFang128
        1
    FrankFang128  
       Jun 11, 2015 via Android
    把内容写在CSS里,使用你自己特制的字体,比如『我』的Unicode 码对应你
    superliang
        2
    superliang  
       Jun 11, 2015
    加干扰码或者异步加载内容,不过不管怎么防止采集对搜索引擎都不友好
    banri
        3
    banri  
       Jun 11, 2015 via iPhone
    直接来源不就行了,妈妈再也不用担心被采集啦!

    说真的都写前端了,就不要担心扒皮的事儿,因为100%可以被扒皮啊…
    banri
        4
    banri  
       Jun 11, 2015 via iPhone
    :D 打错了是开源
    kisshere
        5
    kisshere  
       Jun 11, 2015 via Android
    全部用js生成模板
    binux
        6
    binux  
       Jun 11, 2015 via Android
    没有办法
    lwbjing
        7
    lwbjing  
       Jun 11, 2015
    canvas重绘。。
    endoffight
        8
    endoffight  
       Jun 11, 2015
    js模板 selenium直接秒杀
    typcn
        9
    typcn  
       Jun 11, 2015
    修改 nginx 配置,listen 80 改成 listen 127.0.0.1:80
    lsongdev
        10
    lsongdev  
       Jun 11, 2015 via iPhone
    @typcn 正解,除此之外,其他的方案都不能完美解决。
    learnshare
        11
    learnshare  
       Jun 11, 2015   ❤️ 1
    后端直接渲染成图片
    seerhut
        12
    seerhut  
       Jun 11, 2015
    只要字体规整,图片也能高效ocr....
    gangsta
        13
    gangsta  
       Jun 11, 2015
    Busy
        14
    Busy  
       Jun 11, 2015
    不可能,综上
    onlyice
        15
    onlyice  
       Jun 11, 2015 via Android
    Canvas....
    johnsmith123
        16
    johnsmith123  
       Jun 11, 2015
    怎么防止我发到网上的东西不会被复制?
    liujiantao
        17
    liujiantao  
       Jun 11, 2015 via Android
    看看我这个 /t/157243
    kokdemo
        18
    kokdemo  
       Jun 11, 2015
    ……我觉得这只是增加了采集的门槛

    但是也够了
    thankyourtender
        19
    thankyourtender  
       Jun 11, 2015
    日他,正面刚他,
    Andy1999
        20
    Andy1999  
       Jun 11, 2015 via iPhone
    屏蔽外部IP
    binux
        21
    binux  
       Jun 11, 2015
    @gangsta 于是,你不是把这个赛高科技爬到 V2EX 来了吗?
    mcone
        22
    mcone  
       Jun 11, 2015
    没办法 很难

    百度知道现在的做法是,如果你ip访问频率过高,会随机替换一段话中的某几个字,用图片显示,这样你采集到的文字就是不完整的奇奇怪怪的
    Hawk
        23
    Hawk  
       Jun 11, 2015
    @Havee 这个也是有点屌。。
    amxku
        24
    amxku  
       Jun 11, 2015
    其实还是有一些办法的,除了频率外,比如判断访问路径,是否加载了资源文件等等,就看你这数据是不是值得花这么大成本去做
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2663 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 79ms · UTC 04:34 · PVG 12:34 · LAX 21:34 · JFK 00:34
    ♥ Do have faith in what you're doing.