已经有的数据:
给定关键字有一个算法,计算出一片文章与关键字的相关度 n(n>=0,几百或几千),若干篇文章的相关度基本为正态分布,一篇文章相关度没有一个上线值
根据一定算法获得文章的质量0~m(m>=0,几百或几千),若干篇文章的质量分布也基本为正态分布,一篇文章质量分没有上线
问题:
1 如何将相关度、质量评分归一化到一个统一的范围(如0~1000),文章的分布对归一化应该如何影响一直想不明白
2 相关度、质量数据如何整合为一个合理的评分
给定关键字有一个算法,计算出一片文章与关键字的相关度 n(n>=0,几百或几千),若干篇文章的相关度基本为正态分布,一篇文章相关度没有一个上线值
根据一定算法获得文章的质量0~m(m>=0,几百或几千),若干篇文章的质量分布也基本为正态分布,一篇文章质量分没有上线
问题:
1 如何将相关度、质量评分归一化到一个统一的范围(如0~1000),文章的分布对归一化应该如何影响一直想不明白
2 相关度、质量数据如何整合为一个合理的评分