pd.DataFrame(pd.read_excel(r"C:\\Users\\74038\\Desktop\\shuju\\地址单元\\临河坳陷\\lh.xlsx")).values这样读取完成的数据如何打乱
时间: 2024-01-29 21:10:36 浏览: 92
你可以使用`numpy.random.shuffle()`函数来打乱数据。下面是一个示例代码:
```python
import pandas as pd
import numpy as np
# 读取Excel文件并转换为DataFrame
data = pd.DataFrame(pd.read_excel(r"C:\\Users\\74038\\Desktop\\shuju\\地址单元\\临河坳陷\\lh.xlsx"))
# 将DataFrame转换为numpy数组
array_data = data.values
# 打乱数据
np.random.shuffle(array_data)
# 打印打乱后的数据
print(array_data)
```
这样,你就可以通过`np.random.shuffle()`函数将读取完成的数据打乱了。
相关问题
import pandas as pd from difflib import SequenceMatcher # 读取Excel文件 df = pd.read_excel(r'C:\Users\Admin\Desktop\1000.xlsx') # 比较相似度函数 def similarity(a, b): return SequenceMatcher(None, str(a), str(b)).ratio() # 创建同名和不同名的DataFrame same_df = pd.DataFrame(columns=df.columns) unsame_df = pd.DataFrame(columns=df.columns) # 遍历每一行数据 for i, row in df.iterrows(): is_same = False for j, same_row in same_df.iterrows(): if row['author'] == same_row['author'] and similarity(row['org'], same_row['org']) > 0.8: is_same = True same_df.loc[j] = same_row.append(row) break if not is_same: unsame_df = unsame_df.append(row) # 保存同名和不同名的数据为Excel文件 same_df.to_excel(r'C:\Users\Admin\Desktop\same.xlsx', index=False) unsame_df.to_excel(r'C:\Users\Admin\Desktop\unsame.xlsx', index=False) print("同名的数据已保存为same.xlsx") print("不同名的数据已保存为unsame.xlsx") 这段代码 报错AttributeError: 'DataFrame' object has no attribute 'append' 如何修改
报错 "AttributeError: 'DataFrame' object has no attribute 'append'" 是因为在代码中使用了错误的 DataFrame 方法。DataFrame 对象没有 "append" 方法,无法直接将行添加到 DataFrame 中。
要修正这个问题,可以使用 `pd.concat()` 函数将行连接起来,然后重新赋值给 DataFrame。
以下是修正后的代码:
```python
import pandas as pd
from difflib import SequenceMatcher
# 读取Excel文件
df = pd.read_excel(r'C:\Users\Admin\Desktop\1000.xlsx')
# 比较相似度函数
def similarity(a, b):
return SequenceMatcher(None, str(a), str(b)).ratio()
# 创建同名和不同名的DataFrame
same_df = pd.DataFrame(columns=df.columns)
unsame_df = pd.DataFrame(columns=df.columns)
# 遍历每一行数据
for i, row in df.iterrows():
is_same = False
for j, same_row in same_df.iterrows():
if row['author'] == same_row['author'] and similarity(row['org'], same_row['org']) > 0.8:
is_same = True
same_df = pd.concat([same_df, row.to_frame().T], axis=0)
break
if not is_same:
unsame_df = pd.concat([unsame_df, row.to_frame().T], axis=0)
# 保存同名和不同名的数据为Excel文件
same_df.to_excel(r'C:\Users\Admin\Desktop\same.xlsx', index=False)
unsame_df.to_excel(r'C:\Users\Admin\Desktop\unsame.xlsx', index=False)
print("同名的数据已保存为same.xlsx")
print("不同名的数据已保存为unsame.xlsx")
```
在修正的代码中,使用 `pd.concat()` 函数将新的行连接到 DataFrame 中。将 `row.to_frame().T` 转换为 DataFrame,并通过 `axis=0` 参数进行行连接。
请确保将文件的保存路径修改为你想要保存的位置。
import numpy as np import pandas as pd df = pd.read_excel('C:\\Users\\Administrator\\Desktop\\meal_order_detail.xlsx') df
根据提供的代码,我们可以看出这是在使用pandas库读取一个Excel文件,并将其存储为一个DataFrame对象df。问号符号?可以用于获取有关对象的帮助信息。在这种情况下,输入df?将显示有关DataFrame对象的帮助信息,包括对象的属性和方法等。
以下是使用df?获取DataFrame对象帮助信息的示例代码:
```python
import numpy as np
import pandas as pd
# 读取Excel文件并存储为DataFrame对象
df = pd.read_excel('C:\\Users\\Administrator\\Desktop\\meal_order_detail.xlsx')
# 获取DataFrame对象的帮助信息
df?
```
阅读全文