pandas随机取100行数据
时间: 2023-10-17 22:02:17 浏览: 185
可以使用pandas的sample函数来随机取100行数据,示例代码如下:
```python
import pandas as pd
# 读取数据文件
df = pd.read_csv('data.csv')
# 随机取100行数据
df_sample = df.sample(n=100)
# 打印取样结果
print(df_sample)
```
其中,`n`参数指定需要随机取的行数,`df.sample()`函数会返回一个新的DataFrame对象,包含随机取的数据行。
相关问题
使用pandas,随机取excel表中的行数据
可以使用pandas库中的sample()方法来实现随机取行数据。
下面是一个示例代码:
```python
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('data.xlsx')
# 随机选取 5 行数据
random_sample = df.sample(n=5)
# 打印结果
print(random_sample)
```
在这个示例中,我们读取名为 `data.xlsx` 的 Excel 文件,然后使用 `sample()` 方法随机选取其中的 5 行数据,最后打印结果。如果你需要随机选取更多或更少的数据,只需要相应地修改 `n` 参数即可。
需要注意的是,`sample()` 方法默认会从数据集中随机选取,但如果你希望设置随机种子,以便能够复现相同的随机结果,可以使用 `random_state` 参数。例如:
```python
random_sample = df.sample(n=5, random_state=42)
```
这里我们设置随机种子为 42,这样每次运行代码时都会得到相同的随机结果。
python:一张csv表中根据其中三列cate、biz、result进行排列组合,每个组合随机取50条数据,不够50条的有多少取多少条,把随机取出的数据行写进一张新的表
可以使用Pandas库来完成这个任务。以下是一个可能的实现:
```python
import pandas as pd
import random
# 读取原始CSV表
df = pd.read_csv('original.csv')
# 根据cate、biz、result列进行分组
groups = df.groupby(['cate', 'biz', 'result'])
# 创建空的新表
new_df = pd.DataFrame(columns=df.columns)
# 对每个组合进行处理
for name, group in groups:
# 随机取50条数据,如果不足50条则取全部
n = min(50, len(group))
sample = group.sample(n)
# 将取出的数据行添加到新表中
new_df = pd.concat([new_df, sample], ignore_index=True)
# 将结果写入新的CSV表
new_df.to_csv('new.csv', index=False)
```
以上代码首先读取原始CSV表,然后根据cate、biz、result列进行分组。接着对于每个组合,随机取出50条数据或全部数据,将取出的数据行添加到新表中。最后将新表写入CSV文件中。
阅读全文