网络请求:Python中使用HTTP库进行网页爬取
在Python中,我们可以使用内置的http库或者第三方库如requests、BeautifulSoup等来进行网页爬取。
下面是一个简单的例子,使用http库获取网页内容:
import http
response = http.request('GET', 'http://example.com') # 发送GET请求
if response.status_code == 200: # 如果响应状态码为200(表示成功),
print(response.data) # 打印返回的内容
注意:在实际使用中,需要遵守目标网站的robots.txt规则,尊重网站的爬虫策略。
还没有评论,来说两句吧...