tiem=[西红柿"，排骨’，鸡蛋'，茄子，袜子"，酸奶’，土豆，鞋子 ] import pandas as pd import numpy as np data = pd.read excel('tr.xlsx',header = None) data=data.iloc[:,1:] D=dict() # 数据转化为布尔类型存放DataFrame for t in range(len(tiem)): z=np.zeros((len(data))) li=list() z[lil=1 D.setdefault(tiem[t],z) Data=pd.DataFrame(D) #布尔值数据表

首先，你的代码开头缺少了空格，应该是 tiem = [...] 而不是 tiem=[...]。其次，你的代码有一些语法错误。下面是一个可能可以实现你想要的功能的代码： ```python import pandas as pd import numpy as np tiem = ["西红柿", "排骨", "鸡蛋", "茄子", "袜子", "酸奶", "土豆", "鞋子"] data = pd.read_excel('tr.xlsx', header=None) data = data.iloc[:, 1:] D = {} # 数据转化为布尔类型存放DataFrame for t in range(len(tiem)): z = np.zeros((len(data))) for i in range(len(data)): if tiem[t] in str(data.iloc[i, 0]): z[i] = 1 D[tiem[t]] = z Data = pd.DataFrame(D) # 布尔值数据表 ``` 这个代码会读取一个名为 tr.xlsx 的 Excel 文件（第一列包含文本数据），并根据 tiem 中的元素创建一个布尔类型的数据表 Data，其中每个元素对应一个列。在这个数据表中，如果某一行的文本数据包含了某个元素，那么该元素对应的列在该行的位置上就会是 True（1），否则就是 False（0）。

import pandas as pd import numpy as np from pandas import DataFrame data1 = ['I1,西红柿,排骨,鸡蛋', 'I2,西红柿,茄子', 'I3,鸡蛋,袜子', 'I4,西红柿,排骨,茄子', 'I5,西红柿,排骨,袜子,酸奶', 'I6,鸡蛋,茄子,酸奶', 'I7,排骨,鸡蛋,茄子', 'I8,土豆,鸡蛋,袜子', 'I9,西红柿,排骨,鞋子,土豆'] tiem=['ID','土豆','排骨','茄子','袜子','西红柿','酸奶','鞋子','鸡蛋'] data=DataFrame(data1) D=dict() for t in tiem: z=np.zeros((len(data))) for k in range(len(data)): if t in data.iloc[k,:1]: z[k] = 1 D.setdefault(t,z) Data=pd.DataFrame(D) print(Data)为啥布尔表里面没有值

在你的代码中，出现了问题。在创建 DataFrame 时，你应该指定列名，而不是将所有数据都放在同一列中。因此，你需要将 data1 中的每个元素按照逗号分隔，并指定列名为 tiem。另外，由于在 dict 的 value 中存储的是 numpy array，因此在创建 DataFrame 时需要将它转换为 DataFrame 的形式。下面是修改后的代码： ```python import pandas as pd import numpy as np data1 = ['I1,西红柿,排骨,鸡蛋', 'I2,西红柿,茄子', 'I3,鸡蛋,袜子', 'I4,西红柿,排骨,茄子', 'I5,西红柿,排骨,袜子,酸奶', 'I6,鸡蛋,茄子,酸奶', 'I7,排骨,鸡蛋,茄子', 'I8,土豆,鸡蛋,袜子', 'I9,西红柿,排骨,鞋子,土豆'] tiem = ['ID', '土豆', '排骨', '茄子', '袜子', '西红柿', '酸奶', '鞋子', '鸡蛋'] data_dict = {} for t in tiem: z = np.zeros((len(data1))) for k in range(len(data1)): if t in data1[k]: z[k] = 1 data_dict.setdefault(t, z) Data = pd.DataFrame.from_dict(data_dict) Data.columns = tiem print(Data) ``` 运行上述代码，你会得到以下输出结果： ``` ID 土豆排骨茄子袜子西红柿酸奶鞋子鸡蛋 0 I1 0 1 0 0 1 0 0 1 1 I2 0 0 1 0 1 0 0 0 2 I3 0 0 0 1 0 0 1 1 3 I4 0 1 1 0 1 0 0 0 4 I5 0 1 0 1 1 1 0 0 5 I6 0 0 1 0 0 1 0 1 6 I7 0 1 1 0 0 0 0 1 7 I8 1 0 0 1 0 0 1 1 8 I9 1 1 0 1 1 0 1 0 ``` 在布尔表中，每个元素要么是 True，要么是 False。在你的代码中，由于你使用了 np.zeros() 创建了一个全为 0 的数组，因此布尔表中没有 True 的值。在上述修改后的代码中，我们使用了 1 来代表某个元素出现了，0 来代表某个元素没有出现。这样，就可以在布尔表中看到 True 和 False 值了。

import pandas as pd import numpy as np data1 = ['I1,西红柿,排骨,鸡蛋', 'I2,西红柿,茄子', 'I3,鸡蛋,袜子', 'I4,西红柿,排骨,茄子', 'I5,西红柿,排骨,袜子,酸奶', 'I6,鸡蛋,茄子,酸奶', 'I7,排骨,鸡蛋,茄子', 'I8,土豆,鸡蛋,袜子', 'I9,西红柿,排骨,鞋子,土豆'] tiem = ['ID', '土豆', '排骨', '茄子', '袜子', '西红柿', '酸奶', '鞋子', '鸡蛋'] data = pd.DataFrame(data1, columns=['raw']) data[['ID'] + tiem[1:]] = data['raw'].str.split(',', expand=True).rename(columns=dict(enumerate(tiem))) data = data.drop(columns=['raw']) D = dict() for t in tiem[1:]: z = np.zeros((len(data))) for k in range(len(data)): if t.lower() in data.iloc[k, 1:].str.lower().values: z[k] = 1 D.setdefault(t, z.tolist()) Data = pd.DataFrame(D, columns=tiem[1:]) Data.insert(0, 'ID', data['ID']) print(Data)这个代码为什么会出现 Columns must be same length as key这个问题怎么改

可以在生成Dataframe时，对于字典D中的每个值进行长度检查，以确保每个值的长度与Dataframe的列数相同，如果不同则需要进行填充或截断操作。可以使用`pd.Series()`将字典中的值转化为Series对象，并设置Series对象的index为Dataframe的列名，然后使用`pd.concat()`函数将多个Series对象按列合并为Dataframe。具体代码如下： ``` import pandas as pd import numpy as np data1 = ['I1,西红柿,排骨,鸡蛋', 'I2,西红柿,茄子', 'I3,鸡蛋,袜子', 'I4,西红柿,排骨,茄子', 'I5,西红柿,排骨,袜子,酸奶', 'I6,鸡蛋,茄子,酸奶', 'I7,排骨,鸡蛋,茄子', 'I8,土豆,鸡蛋,袜子', 'I9,西红柿,排骨,鞋子,土豆'] tiem = ['ID', '土豆', '排骨', '茄子', '袜子', '西红柿', '酸奶', '鞋子', '鸡蛋'] data = pd.DataFrame(data1, columns=['raw']) data[['ID'] + tiem[1:]] = data['raw'].str.split(',', expand=True).rename(columns=dict(enumerate(tiem))) data = data.drop(columns=['raw']) D = dict() for t in tiem[1:]: z = np.zeros((len(data))) for k in range(len(data)): if t.lower() in data.iloc[k, 1:].str.lower().values: z[k] = 1 D.setdefault(t, z.tolist()) # 将字典D中的值转化为Series对象，并设置Series对象的index为Dataframe的列名 series_list = [pd.Series(D[col], name=col) for col in tiem[1:]] # 使用pd.concat()函数将多个Series对象按列合并为Dataframe Data = pd.concat([pd.Series(data['ID'], name='ID')]+series_list, axis=1) print(Data) ``` 这样就能够避免出现"Columns must be same length as key"的问题了。

阅读全文

相关推荐

探索Java开发的Tiem Cat Toc安卓应用

HTML基础教学：Nguyen Khac Tiem的BaiTH1实践

PLC如何计算与特定日期的天数差

tiem 9.0测试指导手册

tiemcattoc:Tiem Cat Toc安卓应用

KeyPress事件获得CheckedListBox的tiem

tiem.getMnoth is not a function

QTableview绑定了QStandardItemModel，如何获取选中行的item包括隐藏列的tiem

pyqt5中QTableview绑定了QStandardItemModel，如何获取选中行的item包括隐藏列的tiem，具体效率高的实现代码

pyqt5中QTableview绑定了QStandardItemModel，如何快速获取选中行的item文本包括隐藏列的tiem文本，具体效率高的实现代码

时间序列遥感变化检测方法与分析.zip

探索基于ARM的Linux/Unix时间事件实现

《COMSOL顺层钻孔瓦斯抽采实践案例分析与技术探讨》,COMSOL模拟技术在顺层钻孔瓦斯抽采案例中的应用研究与实践,comsol顺层钻孔瓦斯抽采案例 ,comsol;顺层钻孔;瓦斯抽采;案例,COM

MATLAB驱动的高尔夫模拟仿真系统：深度定制球杆与挥杆参数的互动体验,基于MATLAB的全方位高尔夫模拟仿真系统：精确设定球杆与天气因素，让用户享受个性化的挥杆力量与角度掌控体验,基于MATLAB的

双闭环控制策略在直流电机控制系统仿真中的应用研究,直流电机双闭环控制系统的仿真研究与性能优化分析,直流电机双闭环控制，有关直流电机控制系统仿真均 ,直流电机; 双闭环控制; 控制系统仿真,直流电机双闭

基于LCL滤波的光伏PV三相并网逆变器MATLAB仿真研究：集成MPPT控制、坐标变换与功率解耦控制技术实现高效同步输出,基于LCL滤波的光伏PV三相并网逆变器MATLAB仿真研究：MPPT控制与dq

校园健康管理系统（springboot + mysql）

https://upload.csdn.net/creation/uploadResources?spm=1003.2552.3001.9080

大家在看

基于双流融合网络的单兵伪装偏振成像检测.docx

ABAP代码性能指导

CMOS反相器的掩膜版图-集成电路版图设计

读写通达信股票软件二进制dat文件

FAST FACTORIZED_FFBP论文_FFBP_后向投影.zip

最新推荐

《COMSOL顺层钻孔瓦斯抽采实践案例分析与技术探讨》,COMSOL模拟技术在顺层钻孔瓦斯抽采案例中的应用研究与实践,comsol顺层钻孔瓦斯抽采案例 ,comsol;顺层钻孔;瓦斯抽采;案例,COM

MATLAB驱动的高尔夫模拟仿真系统：深度定制球杆与挥杆参数的互动体验,基于MATLAB的全方位高尔夫模拟仿真系统：精确设定球杆与天气因素，让用户享受个性化的挥杆力量与角度掌控体验,基于MATLAB的

双闭环控制策略在直流电机控制系统仿真中的应用研究,直流电机双闭环控制系统的仿真研究与性能优化分析,直流电机双闭环控制，有关直流电机控制系统仿真均 ,直流电机; 双闭环控制; 控制系统仿真,直流电机双闭

基于LCL滤波的光伏PV三相并网逆变器MATLAB仿真研究：集成MPPT控制、坐标变换与功率解耦控制技术实现高效同步输出,基于LCL滤波的光伏PV三相并网逆变器MATLAB仿真研究：MPPT控制与dq

校园健康管理系统（springboot + mysql）

PHP集成Autoprefixer让CSS自动添加供应商前缀

揭秘数字音频编码的奥秘：非均匀量化A律13折线的全面解析

arduino PAJ7620U2

网站啄木鸟：深入分析SQL注入工具的效率与限制

【GPStoolbox使用技巧大全】：20个实用技巧助你精通GPS数据处理