Python爬虫案例:爬取网页信息
Python作为一种强大的编程语言,非常适合进行网站爬虫。以下是一个简单的爬虫案例,爬取一个网页的标题:
import requests
from bs4 import BeautifulSoup
# 请求目标网页
url = 'https://example.com' # 将此处替换为你需要爬取的实际URL
response = requests.get(url)
# 如果请求成功(HTTP状态码200),则继续处理内容
if response.status_code == 200:
soup = BeautifulSoup(response.text, 'html.parser')
# 找到网页的标题,通常在<h1>标签内
title = soup.find('h1').text
print(title) # 输出爬取到的网页标题
else:
print(f"请求失败,状态码:{response.status_code}}")
这个案例中,我们使用了requests库来发送HTTP请求,然后使用BeautifulSoup库解析返回的HTML内容。最后,我们将获取的网页标题打印出来。
还没有评论,来说两句吧...