df.iloc表示csv文件的第一第三第五个数
时间: 2023-07-07 10:25:40 浏览: 87
`df.iloc`是pandas库中的方法,用于按照行号和列号来选择DataFrame中的数据。如果要使用`df.iloc`来表示csv文件的第一、第三、第五个数,需要先使用pandas库将csv文件读取为DataFrame对象,然后再使用`df.iloc`来选择数据。
具体实现可以按照以下步骤:
1. 导入pandas库,使用`read_csv`函数读取csv文件,将其转换为DataFrame对象。
2. 使用`df.iloc`来选择DataFrame中的第一、第三、第五列数据。
3. 将选择的数据添加到字典中。
具体代码如下:
```python
import pandas as pd
# 使用read_csv函数读取csv文件,将其转换为DataFrame对象
df = pd.read_csv('example.csv')
# 创建一个空字典
csv_dict = {}
# 遍历DataFrame中的每一行数据,将第一、第三、第五列的数据作为键和值添加到字典中
for i in range(len(df)):
key = df.iloc[i, 0]
value = [df.iloc[i, 2], df.iloc[i, 4]]
csv_dict[key] = value
# 打印字典
print(csv_dict)
```
这样,csv文件每一行的第一、第三、第五个数就被添加到了字典中。其中,字典中的键是第一列的数据,值是一个列表,包含第三列和第五列的数据。
相关问题
如何用python读取i.csv文件中第五行的三种方式
以下是三种读取i.csv文件第五行的方式,可以在Python中使用:
1. 使用pandas库读取CSV文件
```python
import pandas as pd
df = pd.read_csv('i.csv', header=4) #header指定第几行为列名,第五行就是header 4
row_5 = df.iloc[4] #iloc[4]从0开始计数,所以表示第五行
```
2. 使用csv库读取CSV文件
```python
import csv
with open('i.csv', 'r') as csvfile:
reader = csv.reader(csvfile)
data = list(reader)
row_5 = data[4]
```
3. 使用numpy库读取CSV文件
```python
import numpy as np
data = np.genfromtxt('i.csv', delimiter=',', skip_header=4) #skip_header指定跳过几行
row_5 = data[4]
```
import pandas as pd def basic_set(df): basic = {} for i in df.drop_duplicates().values.tolist(): # 去重.转列表 basic[str(i)] = [] # str转为字符串类型,每一个str(i)都制作一个索引,暂时是空的 for j, k in enumerate(df.values.tolist()): # 把数据放到对应的索引里面 if k == i: basic[str(i)].append(j) return basic def rough_set(data): data = data.dropna(axis=0, how='any') # 删去有缺失值的某些行 x_data = data.drop(['y'], axis=1) # 得到条件属性列:去掉决策属性y列,得到条件属性的数据 y_data = data.loc[:, 'y'] # 得到决策属性列 # 决策属性等价集 y_basic_set = [v for k, v in basic_set(y_data).items()] #y_basic_set [[1, 2, 5, 6], [0, 3, 4, 7]] # 条件属性等价集 x_basic_set = [v for k, v in basic_set(x_data).items()] #x_basic_set [[4], [0], [5], [1], [6], [7], [2], [3]] #######################Begin######################## #求正域POSc(D) pos = [] # 正域POSc(D) #计算决策属性D关于属性集全集C的依赖度r_x_y print('依赖度r_x_(y):', r_x_y) ########################End######################### # 探索条件属性中不可省关系 u = locals() # locals() 函数会以字典类型返回当前位置的全部局部变量 pos_va = locals() r = locals() columns_num = list(range(len(x_data.columns))) # range() 函数可创建一个整数列表,一般用在for循环中 # 收集属性重要度 imp_attr = [] for i in columns_num: c = columns_num.copy() c.remove(i) u = data.iloc[:, c] # iloc通过行号获取行数据,不能是字符 u_basic_set = [v for k, v in basic_set(u).items()] #去掉一个属性的属性子集的等价集 #######################Begin######################## #求正域POSc-a(D) pos_va = [] # 正域POSc-a(D) #计算决策属性D关于属性集子集C-a的依赖度r ########################End######################### r_diff = round(r_x_y - r, 4) # 计算属性的重要度 imp_attr.append(r_diff) # 把该属性的重要度存在imp_attr里面 print('第',imp_attr.index(imp_attr==0)+1,'个属性重要度为0,可约简') def main(): #读取文件数据 data = pd.read_csv(filepath_or_buffer='data3.csv') rough_set(data) if __name__ == '__main__': main()请补全上述从begin到end的代码
begin:
#求正域POSc(D)
pos = [] # 正域POSc(D)
for i in y_basic_set: # 循环决策属性等价集
flag = 0 # flag=0表示i为正域元素
for j in i:
if j not in pos: # 如果决策属性等价集中的元素不在正域中,则添加到正域中
pos.append(j)
flag = 1 # 此时i不是正域元素
if flag == 0:
pos += i # 如果i为正域元素,则添加到正域中
#计算决策属性D关于属性集全集C的依赖度r_x_y
r_x_y = round(len(pos)/len(data), 4) # 四舍五入保留4位小数
########################End#########################
# 探索条件属性中不可省关系
u = locals() # locals() 函数会以字典类型返回当前位置的全部局部变量
pos_va = locals()
r = locals()
columns_num = list(range(len(x_data.columns))) # range() 函数可创建一个整数列表,一般用在for循环中
# 收集属性重要度
imp_attr = []
for i in columns_num:
c = columns_num.copy()
c.remove(i)
u = data.iloc[:, c] # iloc通过行号获取行数据,不能是字符
u_basic_set = [v for k, v in basic_set(u).items()] #去掉一个属性的属性子集的等价集
#######################Begin######################### #求正域POSc-a(D)
pos_va = [] # 正域POSc-a(D)
for j in u_basic_set:
flag = 0
for k in j:
if k not in pos_va:
pos_va.append(k)
flag = 1
if flag == 0:
pos_va += j
#计算决策属性D关于属性集子集C-a的依赖度r
r = round(len(pos_va)/len(u), 4) # 四舍五入保留4位小数
#######################End#########################
r_diff = round(r_x_y - r, 4) # 计算属性的重要度
imp_attr.append(r_diff) # 把该属性的重要度存在imp_attr里面
print('第',imp_attr.index(imp_attr==0)+1,'个属性重要度为0,可约简')
end.
阅读全文