有新浪的同学吗,一直想不明白改版后微博的展示逻辑是怎么实现的。例如,第一次刷新拉取到内容,点击刷新第二次再次拉取的内容不会和第一次有重复,再次点击刷新第三次拉取到的内容,不会和前两次重复。如果按照时间顺序还好实现,改版后不安时间拉取实在是想不明白原理。难不成要记录我每次浏览的内容 ID ?可是这样也没办法快速去重啊?求赐教。
1
NSAgold Jun 14, 2019 via Android
微博现在有时间线了
|
2
leeZoom Jun 14, 2019 via Android
布隆过滤器?
|
4
rogwan Jun 14, 2019 via iPhone
微博应该是冷热数据分开处理的,主轴现在基本上都不是按时间顺序了,都是算法推荐。会给每个用户维护一个推荐列表,刷新过的内容,直接在列表里删除,所以你看不到重复推荐的内容。抖音推荐也是一样的思路,你重复刷新都是看不到相同内容的,因为数据是提前算好等在那里喂你的。
|
5
kingfly OP @rogwan 没个用户一个表成本还是有点高了吧,最低也要百万级别了吧?不能用 MySQL 了,每个用户提前算,这成本也不小。抖音没怎么用过,也是乱序吗?
|
7
rogwan Jun 14, 2019 via iPhone @kingfly 维护一个列表,不是维护一个表。热数据列表的实现方式很多了,只需要处理最近几天或者最近几百条数据,不会很大的。这种数据的更新策略也有不同的方式,数据量小就全局更新,数据量大可以按策略更新。
|
9
rogwan Jun 14, 2019 via iPhone
@kingfly 你可以测试一下微博的信息流,直接翻 100 页、200 页这样往下翻,就知道热数据用完了,微博系统其实自己就乱套啦。
|
12
lifespy Jun 14, 2019
我们最近也在做这个,插眼来看看大家的思路
|
13
dragonszy Jun 14, 2019
战略马克,不太懂。信息茧房把人群分成 2000 种应该可以了吧?维护 2000 个细分信息流,中间随机插点实时的消息,分配给千万的用户,每个用户都以为是个性化。
|
14
hideonwhere Jun 14, 2019
插眼
|
15
008px Jun 14, 2019 via Android
插眼
|
16
kingfly OP 体验了抖音感觉信息流更牛逼
|
17
nodwang Jun 15, 2019
看样不是一个简单业务流程能解决的问题
|