Python使用请求和lxml刮取一些数据的基本示例

示例

# 与Python 2兼容。
from __future__ import print_function

import lxml.html
import requests


def main():
    r = requests.get("https://httpbin.org")
    html_source = r.text
    root_element = lxml.html.fromstring(html_source)
    # 注意root_element.xpath()给出结果列表。
    # XPath指定了所需元素的路径。
    page_title = root_element.xpath('/html/head/title/text()')[0]
    print(page_title)

if __name__ == '__main__':
    main()