Python爬虫案例:爬取网页信息

原创 男娘i 2025-01-31 02:21 64阅读 0赞

Python作为一种强大的编程语言,非常适合进行网站爬虫。以下是一个简单的爬虫案例,爬取一个网页的标题:

  1. import requests
  2. from bs4 import BeautifulSoup
  3. # 请求目标网页
  4. url = 'https://example.com' # 将此处替换为你需要爬取的实际URL
  5. response = requests.get(url)
  6. # 如果请求成功(HTTP状态码200),则继续处理内容
  7. if response.status_code == 200:
  8. soup = BeautifulSoup(response.text, 'html.parser')
  9. # 找到网页的标题,通常在<h1>标签内
  10. title = soup.find('h1').text
  11. print(title) # 输出爬取到的网页标题
  12. else:
  13. print(f"请求失败,状态码:{response.status_code}}")

这个案例中,我们使用了requests库来发送HTTP请求,然后使用BeautifulSoup库解析返回的HTML内容。最后,我们将获取的网页标题打印出来。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,64人围观)

还没有评论,来说两句吧...

相关阅读