字符串里有回车符应该怎么查找位置？ - V2EX

Home Sign Up Sign In

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

This topic created in 3689 days ago, the information mentioned may be changed or developed.

#-*-coding:utf-8-*-
htmlstr=
'''
。。。
</td>
</tr>
</table>
<ul>
<li>
<a></a>
<a></a>
</li>
</ul>
。。。
<td>页次
'''

ksstr='</table>\n<ul>\n<li>'
jsstr='<td>页次'
ks=htmlstr.find(ksstr)
js=htmlstr.find(jsstr)
lbylist=htmlstr[ks:js]
print(lbylist)
print(ks)

这段代码是想从 htmlstr 中截取一段，有开始和结尾代码，分别是 ksstr 和 jsstr ，这段代码测试通过。
但当我把 ksstr 和 jsstr 两个字符串的值分别存入数据库，然后直接解析网页页面，在程序里取出来时， ks 的值就是-1 了，很明显是“</table>\n<ul>\n<li>”这个地方出了问题。
我现在搞不清是\n 的问题还是编码的问题，也试过\n\r ，还是不行。网页的编码是 gb2312 。想起来了，应该不是编码的问题，因为还有其他的页面也是 gb2312 的，也通过了，就这一个带\n 的出了问题。

9 replies • 2016-06-23 13:59:09 +08:00

1

l12ab

Jun 23, 2016

\n
\r\n

2

imn1

Jun 23, 2016

\s*\n\s*

3

omg21

OP

Jun 23, 2016

@imn1 还是不行，我要把“</table>\n<ul>\n<li>”存到数据库里，然后在程序里读出来，改成这样还是不行“</table>\s*\n\s*<ul>\s*\n\s*<li>”

4

ghostheaven

Jun 23, 2016 via Android

数据库的字符串编码， php 源代码的编码呢，都是 gb2312 么

5

weakiwi

Jun 23, 2016 via Android

js 和 php 的正则都有多行查找模式

6

Cabana

Jun 23, 2016

我来吐个槽，拼音缩写命名，看了半天没理解 ks 和 js 是什么意思，突然才恍然大悟。

7

Cabana

Jun 23, 2016

一个笨办法，存取数据库时 base64 一下，就不会出现这种问题了

8

ango

Jun 23, 2016

@Cabana start & end

9

jason19659

Jun 23, 2016

写正则吧

About · Help · Advertise · Blog · API · FAQ · Solana · 5311 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 66ms · UTC 08:15 · PVG 16:15 · LAX 01:15 · JFK 04:15
♥ Do have faith in what you're doing.