python爬虫之正则表达式(3)
文章目录
- 前言
- 1、介绍
- 2、常见的匹配模式
- 3、正则表达式的使用方法
- 3.1 re.match()方法的使用
- 3.1.1 常规匹配
- 3.1.2 泛匹配
- 3.1.3 匹配指定目标--分组匹配
- 3.1.4 贪婪匹配
- 3.1.5 非贪婪模式
- 3.1.6 匹配包括换行的所有字符
- 3.1.7 匹配特殊字符--转义
- 3.2、re.search()方法的使用
- 3.2.1 匹配演练
- 3.3 re.findall()方法的使用
- 3.4 re.sub()方法的使用
前言
本文详细介绍了正则表达式
的常见匹配模式,以及re模块
的各种使用方法;结合案例让大家可以快速了解如何使用正则表达式
1、介绍
-
正则表达式是对字符串操作的一种
逻辑公式
,就是用事先定义好的一些特殊字符及这些特定字符的组合,组成一个“规则字符串”
,这个“规则字符串”用来表达对字符串
的一种逻辑过滤。简单来说,就是用这个表达式去匹配搜索到我们想要的字符串数据 -
非python独有,像java、C等语言都有这种表达式
-
python里面是使用
re模
块来实现的,不需要额外进行安装,是python内置模块
2、常见的匹配模式
模式 | 描述 |
---|---|
\w | 匹配"字母数字及下划线" |
\W | 匹配"非字母数字下划线" |
\s | 匹配任意空白字符,等价于 [\t\n\r\f]. |
\ |