所谓“通用”就是可以抽取不同网站,不同结构页面的视频信息(标题,截图,描述,剧集播放页列表)。
我想知道百度视频搜索是怎么做到的?难道是针对各大视频网站的不同页面的结构编写不同的抽取程序吗?不然是怎么做到精准的信息抽取的。
我想知道百度视频搜索是怎么做到的?难道是针对各大视频网站的不同页面的结构编写不同的抽取程序吗?不然是怎么做到精准的信息抽取的。
1
luikore Jun 24, 2013
在人力资源丰富的国度, 思路就是这样:
招 100 个程序员, 针对数据量前 100 的视频网站写不同的抽取 招 1000 个运营, 手工录入 100 以后的视频网站上的信息 |
2
dingyaguang117 OP @luikore = =那百度视频,快手看片等等 都是这么做的吗?
|