python正则re.search获取匹配的内容

[正则] 2024-03-29 圈点312

摘要:python正则re.search获取匹配的内容,取div中的内容

python正则re.search获取匹配的内容:


示例:

import re

body = "html..."

neirong_re = re.search('<div id="neirong">(.*)</div>',body,re.I|re.DOTALL)

if neirong_re:

if neirong_re.group(1):

neirong = neirong_re.group(1)


这样就可以取到此div中的内容了。注意:默认是贪婪的匹配模式,此处其将就匹配最后一个</div>前面所有的字符。


记录re.search()用法:


语法:

re.search(pattern, string, flags=0)

说明:

扫描整个字符串并返回第一个成功的匹配。


参数说明:

参数描述

pattern匹配的正则表达式

string要匹配的字符串。

flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。


匹配成功re.search方法返回一个匹配的对象,否则返回None。


可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

匹配对象方法描述

group(num=0)匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。

groups()返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。



正则  

感谢反馈,已提交成功,审核后即会显示