maemolee
V2EX  ›  问与答

[请教]一个长度为 15 位的字符串,怎么压缩它的长度?

  •  
  •   maemolee · Sep 28, 2018 · 9276 views
    This topic created in 2822 days ago, the information mentioned may be changed or developed.

    一个长度为 15 位的字符串,可能包含大写、小写英文字母和数字(不包含特殊符号),想要通过一个算法压缩成一个 8 位的字符串,并能通过算法将压缩后的字符串正确还原。

    Supplement 1  ·  Sep 28, 2018
    我打算放弃了,大家要是有想法可以继续提出讨论,潜了,谢谢大家。
    26 replies    2018-09-29 03:19:08 +08:00
    SakuraSa
        1
    SakuraSa  
       Sep 28, 2018
    如果没有更强的假设,应该是做不到的。
    可能的组合:(26+26+10)**15
    需要的字符数:log((26+26+10)**15,256)=11.164
    maemolee
        2
    maemolee  
    OP
       Sep 28, 2018
    @SakuraSa 谢谢……
    xiaocsl
        3
    xiaocsl  
       Sep 28, 2018
    压缩后的也只能大小写英文字母和数字吗?
    只是可视的压缩还是要体积压缩?
    maemolee
        4
    maemolee  
    OP
       Sep 28, 2018
    @xiaocsl 因为压缩后的文本串要保证能以 64 位 2 进制码的形式储存,所以最好只能是 ASCII 表里面的东西。
    JmmBite
        5
    JmmBite  
       Sep 28, 2018
    改成 中文字符。
    stevenbipt
        6
    stevenbipt  
       Sep 28, 2018 via Android
    哈夫曼树重新编码?将每个 ASCII 码重新编码应该能压缩一下吧
    maemolee
        7
    maemolee  
    OP
       Sep 28, 2018   ❤️ 1
    @JmmBite 怎么改用中文?

    @stevenbipt 诶?你是说直接跳过转换为 8 位字符串的过程,直接用 15 位转换成 64 位二进制吗🤔难以想象啊
    ThirdFlame
        8
    ThirdFlame  
       Sep 28, 2018
    26+26+10=62 2 的 6 次方即可容纳。
    15 个字符*6=90 位二进制即可。

    1 楼的解释已经完美了,不可能实现的任务。
    chenyu8674
        9
    chenyu8674  
       Sep 28, 2018
    找 124 个不重样的字符,用进制转换的思路试试
    chenyu8674
        10
    chenyu8674  
       Sep 28, 2018
    @chenyu8674 脑抽想错,是 2^6
    maemolee
        11
    maemolee  
    OP
       Sep 28, 2018
    @ThirdFlame 感谢

    @chenyu8674 这样子是不是得自己定义一套编码规范😂
    chenyu8674
        12
    chenyu8674  
       Sep 28, 2018
    @maemolee 差不多是这个意思,比如 1111->F,就相当于把 4 位压到了 1 位
    不过我刚脑抽了,实际应该找不出那么多不同的字符
    blackcurrant
        13
    blackcurrant  
       Sep 28, 2018 via iPhone
    构造一个 url, 让这个字符串成为 URL 的一部分,然后使用短网址服务进行缩短,可压缩成 5 个字符甚至更短。
    sxul07
        14
    sxul07  
       Sep 28, 2018
    @blackcurrant 但还是不能保证全都压缩到 8 位以内
    catcn
        15
    catcn  
       Sep 28, 2018
    catcn
        16
    catcn  
       Sep 28, 2018
    汗,还有压缩后的位数要求。。
    blackcurrant
        17
    blackcurrant  
       Sep 28, 2018 via iPhone
    @sxul07 楼主的标题是 **一个**长度为 15 位的字符串。
    csx163
        18
    csx163  
       Sep 28, 2018
    可以用字典么
    maemolee
        19
    maemolee  
    OP
       Sep 28, 2018
    @blackcurrant 希望可以不要扣字眼,因为我有很多很多“一个”😂
    maemolee
        20
    maemolee  
    OP
       Sep 28, 2018
    @csx163 当然可以……
    momo1999
        21
    momo1999  
       Sep 28, 2018
    可以压缩到 12 位
    prolic
        22
    prolic  
       Sep 28, 2018 via Android
    两个集合大小不一样,15 位到 8 位只能做个满射
    NB40B938mff85mtq
        23
    NB40B938mff85mtq  
       Sep 28, 2018
    不用想了。。。遍历赋值给二进制数都凑不够。。。
    zealic
        24
    zealic  
       Sep 28, 2018
    只能用已知字典代替缺失的 3.1164 位
    mangoDB
        25
    mangoDB  
       Sep 28, 2018
    ```py
    import math

    s = (26 + 26 + 10) ** 15
    n = math.log(s, 2 ** 8)

    print n
    ```
    xychang
        26
    xychang  
       Sep 29, 2018
    随机的 15 位字符串不可能,如果个别字符频率比较高的话还是有可能的,参见 6 楼
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2491 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 71ms · UTC 06:49 · PVG 14:49 · LAX 23:49 · JFK 02:49
    ♥ Do have faith in what you're doing.