创建一个空的 DataFrame,遍历文件列表并获取修改时间并将修改时间添加到 DataFrame 中
时间: 2024-05-05 19:21:56 浏览: 73
可以使用 Pandas 库来创建一个空的 DataFrame,使用 os 模块来遍历文件列表并获取修改时间,然后将其添加到 DataFrame 中。下面是一个示例代码:
```python
import os
import pandas as pd
# 创建空的 DataFrame
df = pd.DataFrame(columns=['file', 'modified_time'])
# 遍历文件列表并获取修改时间
path = '/path/to/files'
for file in os.listdir(path):
if os.path.isfile(os.path.join(path, file)):
modified_time = os.path.getmtime(os.path.join(path, file))
df = df.append({'file': file, 'modified_time': modified_time}, ignore_index=True)
# 输出 DataFrame
print(df)
```
在上面的代码中,`path` 是要遍历的文件夹路径。`os.listdir()` 函数用于获取文件列表,然后使用 `os.path.isfile()` 函数判断是否为文件。如果是文件,就使用 `os.path.getmtime()` 函数获取修改时间,然后将其添加到 DataFrame 中。最后,使用 `print()` 函数输出 DataFrame。
相关问题
dataframe 遍历
Pandas DataFrame 可以通过多种方式进行遍历。
1. 使用 iterrows() 方法遍历
使用 iterrows() 方法可以返回每行的索引和数据,可以使用 for 循环遍历每行,如下所示:
```python
import pandas as pd
df = pd.read_csv('data.csv')
for index, row in df.iterrows():
print(index, row['Name'], row['Age'])
```
2. 使用 itertuples() 方法遍历
使用 itertuples() 方法可以返回每行数据的命名元组,该元组包含每列的值和行的索引,可以使用 for 循环遍历每行,如下所示:
```python
import pandas as pd
df = pd.read_csv('data.csv')
for row in df.itertuples():
print(row.Index, row.Name, row.Age)
```
3. 使用 loc[] 方法遍历
使用 loc[] 方法可以通过行和列的标签访问 DataFrame 的元素,可以使用 for 循环遍历每行,如下所示:
```python
import pandas as pd
df = pd.read_csv('data.csv')
for index in df.index:
print(index, df.loc[index, 'Name'], df.loc[index, 'Age'])
```
4. 使用 iloc[] 方法遍历
使用 iloc[] 方法可以通过行和列的整数位置访问 DataFrame 的元素,可以使用 for 循环遍历每行,如下所示:
```python
import pandas as pd
df = pd.read_csv('data.csv')
for i in range(len(df)):
print(i, df.iloc[i]['Name'], df.iloc[i]['Age'])
```
以上是四种常见的 DataFrame 遍历方法,根据具体的应用场景可以选择合适的方法。
dataframe遍历
在Python中,我们可以使用循环遍历DataFrame中的每一行或每一列。下面是一些示例代码:
遍历每一行:
```python
import pandas as pd
# 创建一个DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)
# 遍历每一行
for index, row in df.iterrows():
print(row['name'], row['age'])
```
遍历每一列:
```python
import pandas as pd
# 创建一个DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)
# 遍历每一列
for col in df.columns:
print(col)
print(df[col])
```
阅读全文