zzxworld
V2EX  ›  问与答

有没有按标签相关性排序的方法或资料?

  •  
  •   zzxworld · May 9, 2012 · 3309 views
    This topic created in 5143 days ago, the information mentioned may be changed or developed.
    比如有三篇文章:A,B,C

    A的标签有:apple,iphone,iphone4s
    B的标签有:apple,ipod touch
    C的标签有:apple,iphone

    如果我现在查看A相关的文章时,B和C都有,但C的权重要高于B。

    用一个比较愚笨的方法就是取出与包含A标签的所有文章,然后再遍历所有文章的标签与A的标签进行比对并分配一个权重的值, 再按权重值进行排序。

    但是当数据达到一定量,比如一万条的时候,这个方法就见鬼了。想询问下有没有更好的方法,或是在DB端查询的时候就可以达到这个目的?
    2 replies    1970-01-01 08:00:00 +08:00
    kafka0102
        1
    kafka0102  
       May 9, 2012
    这个放到全文搜索会比较合适。。。
    virushuo
        2
    virushuo  
       May 9, 2012
    用余弦定理计算夹角,然后排序。这是相关度计算的办法,和搜索引擎计算页面相关是一样道理,只是你的tag等于已经做完了分词。

    可以参考吴军06年发表在google黑板报的文章: http://www.googlechinablog.com/2006/07/12.html



    http://www.google.com.hk/ggblog/googlechinablog/2006/06/blog-post_3066.html
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3375 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 11:28 · PVG 19:28 · LAX 04:28 · JFK 07:28
    ♥ Do have faith in what you're doing.