# coding: utf-8 import pandas as pd df = pd.read_csv('./职位描述.csv', encoding='gbk') # print(df.head()) for text in df['Job_Description']: # print(text) if text is not None: with open('职位表述文本.txt', mode='a', encoding='utf-8') as file: file.write(str(text)) print('写入完成')
时间: 2024-01-27 16:04:41 浏览: 20
这段代码是一个 Python 脚本,它使用 Pandas 库读取名为“职位描述.csv”的文件,并将其中的职位描述提取出来写入一个名为“职位表述文本.txt”的文本文件中。其中,文件编码为 GBK 编码,写入文件时使用 UTF-8 编码。如果职位描述为空,则不会写入任何内容。最后输出“写入完成”表明写入操作已完成。
相关问题
# coding=utf-8 和 # coding: utf-8有什么区别
两者的作用是相同的,都是用来指定Python源文件的编码格式为UTF-8。但是,它们的语法有所不同:
- `# coding=utf-8` 使用了等号,这种写法在Python 2.x中是不支持的,只有在Python 3.x中才能使用。
- `# coding: utf-8` 使用了冒号,这种写法在Python 2.x和Python 3.x中都是支持的。
在Python 2.x中,如果你想指定文件编码格式为UTF-8,应该使用第二种写法,即 `# coding: utf-8`。在Python 3.x中,两种写法都可以使用,但是推荐使用第一种写法,即 `# coding=utf-8`。
# -*-coding:utf-8-*- import pandas as pd import json import pprint # 读取csv文件 df = pd.read_csv('202205012-20230512.csv', header=None, skiprows=1, usecols=[1,2,3]) # 将数据转换为JSON格式 data = df.to_dict(orient='records') json_data = json.dumps(data) data_t = json.loads(json_data) for ele in data_t: print(ele['代码'])
这段代码的作用是读取一个csv文件,并将其中的数据转换为JSON格式,然后输出其中每行数据的“代码”这一列的值。
其中:
- 第1行声明编码格式为UTF-8;
- 第2行导入pandas库,用于数据处理;
- 第3行导入json库,用于JSON格式的编码和解码;
- 第5行利用pandas库读取csv文件(文件名为“202205012-20230512.csv”),跳过第1行表头,仅读取第2、3、4列(用cols参数指定),并将其转换为pandas的DataFrame对象df;
- 第8行将DataFrame对象df转换为JSON格式,存储在变量json_data中;
- 第10行将json_data解码为Python对象(即一个字典列表),存储在变量data_t中;
- 第12~14行遍历data_t中的每个字典元素,输出其中key为“代码”的value值。