dingyaguang117
V2EX  ›  问与答

如何编写一个通用的视频搜索引擎?

  •  
  •   dingyaguang117 · Jun 24, 2013 · 2860 views
    This topic created in 4747 days ago, the information mentioned may be changed or developed.
    所谓“通用”就是可以抽取不同网站,不同结构页面的视频信息(标题,截图,描述,剧集播放页列表)。

    我想知道百度视频搜索是怎么做到的?难道是针对各大视频网站的不同页面的结构编写不同的抽取程序吗?不然是怎么做到精准的信息抽取的。
    3 replies    1970-01-01 08:00:00 +08:00
    luikore
        1
    luikore  
       Jun 24, 2013
    在人力资源丰富的国度, 思路就是这样:
    招 100 个程序员, 针对数据量前 100 的视频网站写不同的抽取
    招 1000 个运营, 手工录入 100 以后的视频网站上的信息
    dingyaguang117
        2
    dingyaguang117  
    OP
       Jun 24, 2013
    @luikore = =那百度视频,快手看片等等 都是这么做的吗?
    jjplay
        3
    jjplay  
       Jun 24, 2013
    百度视频 都是第一索引自己的站 爱奇异 -> 百度影音 -> 奇热 ,优酷 土豆 ..... 前面自己站数据调用,后面大站肯定都是战略合作,毕竟谁都想和百度合作 引流巨大 不就是钱么,最后面应该是自己的算法识别 和一定的人工,差不多这样吧,百度视频 soku.com 都有递交视频的规范 当然收录几率几无
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3922 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 00:17 · PVG 08:17 · LAX 17:17 · JFK 20:17
    ♥ Do have faith in what you're doing.