文章: http://minimaxir.com/2015/10/reddit-bigquery/
Notebook (R): https://github.com/minimaxir/reddit-bigquery/blob/master/reddit_bigquery.ipynb
- 分析 了 2006 到 2015 年 Reddit 的用户帖子和评论
- 例如在评论使用什么样的字眼会得到更多的 upvote ,以及一些节点的 active user 趋势
- BigQuery 每个月有 1 TB 的免费数据处理量
- 一个有用的发现:上午 10 点发帖效果最好
- Reddit 的这些数据是公开的: https://www.reddit.com/r/datasets/comments/3mg812/full_reddit_submission_corpus_now_available_2006/