以下代码使用python regex从html链接中提取网址
import re s = '''http://www.santa.com''' match = re.search(r'href=[\'"]?([^\'" >]+)', s) if match: print match.group(0)
输出结果
这给出了输出
href="http://www.santa.com"
友情链接: json在线解析 通晓查询 糯晒黄历 姓名打分