• 请不要在回答技术问题时复制粘贴 AI 生成的内容
windirt
V2EX  ›  程序员

这样的汉字排列组合还能弄出更多吗?

  •  
  •   windirt ·
    windirt · Jul 8, 2016 · 4054 views
    This topic created in 3644 days ago, the information mentioned may be changed or developed.
    问题是没有钱
    有钱是没问题
    没有钱是问题
    问题是钱没有
    钱没有是问题
    钱有没有問题 
    是有钱没问题
    是没钱有问题
    是钱没有问题
    有问题是没钱
    没问题是有钱
    没钱是有问题
    

    表面上看是六个字,随机排列,理论上是 6 的阶乘 720 个,但是因为汉字词组问题占用了两个字,以及不能放在问题前面等等的汉语语义条件限制了最终的可用输出数量,求以程序化的方式实现输出更多的符合汉字语义的组合

    10 replies    2016-07-09 09:57:45 +08:00
    lzhr
        1
    lzhr  
       Jul 8, 2016
    可以找找语义分析的 api
    mizuki
        2
    mizuki  
       Jul 8, 2016
    钱是没有问题
    acros
        3
    acros  
       Jul 8, 2016
    这个排列能靠计算机处理吗···

    是钱有没问题?
    forty
        4
    forty  
       Jul 8, 2016
    谁说钱不能放在问题前面?有没钱,问题是。口语这么说很正常,叫做倒装句。
    forty
        5
    forty  
       Jul 8, 2016
    是没钱,问题有。没钱,问题是有。
    rock_cloud
        6
    rock_cloud  
       Jul 8, 2016
    找个大一点的语料库,然后把包含这六个字的所有长度为 2 到 6 的组合提取出来,并统计出现的频率。
    S_{w_i^n}
    w^n 是所有长度为 n 的组合, w_i^n 是第 i 个长度为 n 的组合
    定义一个打分:
    \sum_{n=2}^6{n!S_{w_i^n}} 如果 w_i^n 在枚举的组合中出现。
    最终把所有的枚举按照打分排序,估计差不多。
    forty
        7
    forty  
       Jul 8, 2016
    问:没有题是钱?
    问:有题是没钱?
    钱?是问有题没……
    binjoo
        8
    binjoo  
       Jul 8, 2016
    这是汉语几级?
    forty
        9
    forty  
       Jul 8, 2016
    没有题是问钱
    dandycheung
        10
    dandycheung  
       Jul 9, 2016
    题是没有问钱、没问钱是有题
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   988 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 57ms · UTC 19:20 · PVG 03:20 · LAX 12:20 · JFK 15:20
    ♥ Do have faith in what you're doing.