入门入门Python爬虫爬虫Day4
python爬虫爬虫
此文章大致需要观看十分钟
Python作为现阶段最流行的语言,对于网络的爬取和海量数据的分析,作为现阶段最流行的语言,对于网络的爬取和海量数据的分析,python更胜一筹。更胜一筹。
Comma Separated Values,简称 CSV ,它是一种以逗号分隔数值的文件类型。在数据库或电子表格中,它是最常见的导入
导出格式,它以一种简单而明了的方式存储和共享数据, CSV 文件通常以纯文本的方式存储数据表,由于爬虫的数据量高效
且巨大,今天具体讲一下 Python 对 csv 格式的文件处理。
首先我们先准备一个 csv 文件,命名为 csv_test.csv 。
数据源如下:
姓名姓名 年龄年龄 电话电话
小P 18 138001380000
小Y 22 138001380000
1、、CSV写入写入
import csv
# 若存在文件,打开若存在文件,打开csv文件,若不存在即新建文件文件,若不存在即新建文件
# 如不设置如不设置newline='',每行数据会隔一行空白行,每行数据会隔一行空白行
csvfile = open('csv_test.csv', 'w', newline='')
# 将文件加载到将文件加载到csv对象中对象中
writer = csv.writer(csvfile)
# 写入一行数据写入一行数据
writer.writerow(['姓名姓名', '年龄年龄', '电话电话'])
# 多行数据写入多行数据写入
data = [
('小小P', '18', '138001380000'),
('小小Y', '22', '138001380000')
] writer.writerows(data)
# 关闭关闭csv对象对象
csvfile.close()
2、、csv列表字典写入列表字典写入
import csv
csvfile = open('csv_test.csv', 'r')
# 以列表形式输出以列表形式输出
reader = csv.reader(csvfile)
# 以字典形式输出,第一行作为字典的键以字典形式输出,第一行作为字典的键
# reader = csv.DictReader(csvfile)
rows = [row for row in reader] print(rows)
import csv
csvfile = open('csv_test.csv', 'r')
# 以列表形式输出
reader = csv.reader(csvfile)
for row in reader:
if '小P' in row:
print(row)
# 以字典形式输出,第一行作为字典的键
# reader = csv.DictReader(csvfile)
# for row in reader:
# if row['姓名']== '小P':
# print(row)
3、、xlwt控制控制Excel
import xlwt
# 新建一个新建一个Excel文件文件