V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
abc0123xyz
V2EX  ›  问与答

请教, txt 文档的一些问题

  •  
  •   abc0123xyz · Sep 7, 2024 · 2136 views
    This topic created in 597 days ago, the information mentioned may be changed or developed.
    想把收藏的网文给放到 nas 上,搞一个 web 网站自用,这样就不用占用本地空间了。

    但是有些问题想咨询一下大佬们。

    1. 内容主要是 txt 格式的,但是编码格式不是固定,但找了一个包 juniversalchardet ,就是不知道好不好用。
    2. txt 在服务端文件该怎么存储以及分页呢?
    3. 因为来源比较杂乱,所有没有固定的章节格式,该怎么划分章节呢?

    目前就这些,感谢大佬们!
    6 replies    2024-09-07 12:41:29 +08:00
    Ashore
        1
    Ashore  
       Sep 7, 2024
    小说站?
    fuge
        2
    fuge  
       Sep 7, 2024
    用 Sphinx 怎么样。
    zhangeric
        3
    zhangeric  
       Sep 7, 2024
    有自建小说阅读服务器的 docker.比如 legado 和 reader
    panlatent
        4
    panlatent  
       Sep 7, 2024
    如果只是想看小说之类的,就我来讲不会采用这样的方案。如果流行则必有整理好的规范版本,如果极小众且格式不规范,大概率需要人工参与。小说占用的空间还是比较小,储存的话可以把不看的压缩存储。好的阅读器可以处理绝大多数小说章节。

    开发的话,应该是检测编码后自动转码存储,去除冗杂文本,分析出章节,分页应该是客户端干的事。
    lyzz0612
        5
    lyzz0612  
       Sep 7, 2024
    https://github.com/gedoor/legado 一直在用这个看,可以自定义书源格式,网文应该都可以搜索到。如果真找不到的,你自己实现一下 api 读取你本地的 txt?
    dream7758522
        6
    dream7758522  
       Sep 7, 2024
    网文体积又不大,怕占用空间?不是很理解题主的思路。直接存阅读端不就行了?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   979 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 19:49 · PVG 03:49 · LAX 12:49 · JFK 15:49
    ♥ Do have faith in what you're doing.