Python爬虫实践:requests+BeautifulSoup的简单爬取案例

原创 电玩女神 2025-03-14 13:45 25阅读 0赞

在Python爬虫中,我们通常会使用requests库来发送HTTP请求获取网页内容,然后利用BeautifulSoup库解析HTML文档提取所需信息。

下面是一个简单的爬取案例,爬取一个网站的首页标题:

  1. 导入所需的库
  1. import requests
  2. from bs4 import BeautifulSoup
  1. 发送GET请求获取网页内容
  1. url = 'https://example.com' # 替换成你要爬取的目标URL
  2. response = requests.get(url)
  1. 解析HTML内容并提取标题(假设标题在<title>标签内)
  1. soup = BeautifulSoup(response.text, 'html.parser')
  2. title = soup.find('title').text
  3. print(title) # 输出爬取的首页标题

这样就实现了一个简单的Python爬虫,爬取指定URL的首页标题。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,25人围观)

还没有评论,来说两句吧...

相关阅读