在Python中爬虫采集的数据有多少中保存的文件格式。代码怎么变现出来
时间: 2023-05-26 15:04:32 浏览: 200
基于Python爬虫的股票信息爬取保存到文件
4星 · 用户满意度95%
Python中常用的爬虫数据保存格式包括:
1. 文本格式:如txt、csv等。
2. XML格式:如XML、HTML、RSS等。
3. JSON格式:一种轻量级的数据交换格式。
4. 图像格式:如JPG、PNG等。
5. 多媒体格式:如MP4、FLV等。
代码如下:
保存为txt文件:
```
with open('file.txt', 'w') as f:
f.write('hello world')
```
保存为csv文件:
```
import csv
with open('file.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerow(['ID', 'Name', 'Age'])
writer.writerow(['001', 'Tom', '20'])
```
保存为JSON文件:
```
import json
data = {'name': 'Tom', 'age': 20}
with open('file.json', 'w') as f:
json.dump(data, f)
```
保存为图像文件:
```
import requests
url = 'http://example.com/image.jpg'
response = requests.get(url)
with open('image.jpg', 'wb') as f:
f.write(response.content)
```
保存为多媒体文件:
```
import requests
url = 'http://example.com/video.mp4'
response = requests.get(url)
with open('video.mp4', 'wb') as f:
f.write(response.content)
```
阅读全文