[正则] 2024-03-29 圈点312
摘要:python正则re.search获取匹配的内容,取div中的内容
python正则re.search获取匹配的内容:
示例:
import re
body = "html..."
neirong_re = re.search('<div id="neirong">(.*)</div>',body,re.I|re.DOTALL)
if neirong_re:
if neirong_re.group(1):
neirong = neirong_re.group(1)
这样就可以取到此div中的内容了。注意:默认是贪婪的匹配模式,此处其将就匹配最后一个</div>前面所有的字符。
记录re.search()用法:
语法:
re.search(pattern, string, flags=0)
说明:
扫描整个字符串并返回第一个成功的匹配。
参数说明:
参数描述
pattern匹配的正则表达式
string要匹配的字符串。
flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
匹配成功re.search方法返回一个匹配的对象,否则返回None。
可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。
匹配对象方法描述
group(num=0)匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
groups()返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。
上一篇[正则]正则表达式正向匹配与反向匹配
下一篇[正则]python的re正则默认是贪婪模式