data = pd.read_excel("D:/PycharmProjects/cluster220422/聚类后数据1000_excel/" + cond) # # print(data) # # 首先将pandas读取的数据转化为array # data = np.array(data) # # 然后转化为list形式 # data = data.tolist() # # print(data)，df = pd.read_csv("F:/XH_WY_ZH_ALL/XH_WY_ZH_ALL/XH_WY_ZH_ALL/" + cond) # os.mkdir(r"G:/功图/" + cond) # 选择需要提取的两列数据 col1 = df['WY'] col2 = df['ZH'] # 合并两列数据 new_col = col1.astype(str) + ',' + col2.astype(str) # 将合并后的数据保存为新文件 new_df = pd.DataFrame({'WYZH': new_col}) # 分列 new_df = new_df['WYZH'].str.split(',', expand=True) new_df = pd.DataFrame(new_df) # 首先将pandas读取的数据转化为array data = np.array(new_df) # 然后转化为list形式 data = data.tolist() # print(data)为什么第二段代码相较于第一段代码输出有引号

时间: 2024-02-24 21:58:21 浏览: 72

ZIP

kcv方法matlab代码-MLC_toolbox:用于多标签分类的MATLAB/OCTAVE库

第二段代码输出的数据中含有引号，是因为在将 DataFrame 对象中的字符串列转换为列表时，每个字符串被当作一个整体，因此被加上了引号。而第一段代码输出的数据中没有引号，是因为读取 Excel 文件时，pandas 自动将单元格中的字符串识别为 Python 字符串类型，而不是带引号的字符串类型。如果你希望在第二段代码输出的数据中去掉引号，可以使用 strip() 方法去掉每个字符串的首尾空格，或者使用 replace() 方法替换掉每个字符串中的引号。修改后的代码如下： ``` import pandas as pd import numpy as np df = pd.read_csv("F:/XH_WY_ZH_ALL/XH_WY_ZH_ALL/XH_WY_ZH_ALL/" + cond) col1 = df['WY'] col2 = df['ZH'] new_col = col1.astype(str) + ',' + col2.astype(str) new_df = pd.DataFrame({'WYZH': new_col}) new_df[['WY', 'ZH']] = new_df['WYZH'].str.split(',', expand=True) data = new_df[['WY', 'ZH']].values.tolist() data = [[s.strip().replace('"', '') for s in row] for row in data] print(data) ```

阅读全文

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通