如果需要爬取的网页源码部分为:标题,获得的源码字符串在变量text中,已导入re模块,需要获取其中的标题,可以使用如下语句:
A: e.findall("(?)",a)
B: e.findall("(*)",a)
C: e.findall("(.*)",a)
D: e.findall("(.?)",a)
A: e.findall("(?)",a)
B: e.findall("(*)",a)
C: e.findall("(.*)",a)
D: e.findall("(.?)",a)
举一反三
- 如果需要爬取的网页源码部分为: 标题</h1>,获得的源码字符串在变量text中,已导入re模块,需要获取其中的标题,可以使用如下语句:
- 如果要一次完成字符串中所有满足正则表达式规则的子串的匹配,可以使用re模块的( )函数。 A: searchall B: findall C: finditer D: search
- 在re库中,用于替换字符串中所有与正则表达式匹配的子串的函数是()。 A: sub B: match C: findall D: replace
- e库中,将正则表达式编译成正则表达式对象,可以提高一点效率的方法是: A: e.compile() B: e.match() C: e.search() D: e.findall()
- 遍历文档树中,()函数是返回满足条件的第一个对象;()函数是返回满足条件的列表 A: find,findall B: find,find_all C: find_all,find D: find_all,findall