正则表达式

正则表达式很常用,但是规则也很复杂,每次用的时候查资料即可。我这里只是总结一下常用的正则表达式。

字符串过滤

我们常常需要根据正则表达式,来对字符串进行过滤。例如仅保留汉字、数字、字母等。用法如下例所示:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
# coding = utf-8
import re

num = 'a¥1aB23Cqqq$我.04'
print("原字符串: ", num)
# 字符串只保留中文
num1 = re.sub(u"([^\u4e00-\u9fa5])", "", num)
print("字符串只保留中文: ", num1)
# 字符串只保留英文
num2 = re.sub(u"([^\u0041-\u005a\u0061-\u007a])", "", num)
print("字符串只保留英文: ", num2)
# 字符串只保留数字
num3 = re.sub(u"([^\u0030-\u0039])", "", num)
print("字符串只保留数字: ", num3)
num4 = re.sub("\D", "", num)
print("字符串只保留数字: ", num4)
# 字符串保留数字.和¥
num5 = re.sub(u"([^\u0030-\u0039\u002e\uffe5])", "", num)
print("字符串保留数字.和¥: ", num5)
# 字符串只保留英文和数字
num6 = re.sub(u"([^\u0041-\u005a\u0061-\u007a\u0030-\u0039])", "", num)
print("字符串只保留英文和数字: ", num6)

s = "ABC今天下雨了,abs不开心123!。??"
# 字符串只保留中文、字母、数字。
num7 = re.sub(u"([^\u4e00-\u9fa5\u0041-\u005a\u0061-\u007a\u0030-\u0039])", "", s)
print('字符串只保留汉字、英文和数字: ', num7)

输出结果如下所示:

1
2
3
4
5
6
7
8
原字符串:  a¥1aB23Cqqq$我.04
字符串只保留中文: 我
字符串只保留英文: aaBCqqq
字符串只保留数字: 12304
字符串只保留数字: 12304
字符串保留数字.和¥: ¥123.04
字符串只保留英文和数字: a1aB23Cqqq04
字符串只保留汉字、英文和数字: ABC今天下雨了abs不开心123

参考

python正则过滤字符串,只保留数字、字母等

------ 本文结束------
坚持原创技术分享,您的支持将鼓励我继续创作!

欢迎关注我的其它发布渠道