比如,里面分类娱乐,科技,体育等等,但是抓取文章本身并没有这些标签。不知道他们是如何实现分类的?
1
Syc May 13, 2016 via Android
分类好固定的微信号,从某些微信号抓取就是直接入库对应分类
|
3
immjun May 13, 2016
机器学习 中文语义分词
|
4
fenghua1013 May 13, 2016 via iPhone
布隆过滤器可以实现分类
|
5
marenight May 14, 2016
微信号后台有分类。此外,可以根据微信号简介进行分类(自然语言处理?)
|
6
Rorysky May 14, 2016
|
7
JhZ7z587cYROBgVQ May 14, 2016
@fenghua1013 我一直以为布隆过滤器是去重用的 orz 老司机怎么用这个分类的?
|
8
murmur May 14, 2016
@fenghua1013 你确定不是贝叶斯过滤器
|
9
ytmsdy May 14, 2016
传送门的账号在初期估计是一起导入进去的,后期的账号估计就是一个一个手工加上去的。
|