dataframe代码
时间: 2024-11-19 07:14:08 浏览: 0
DataFrame是Pandas库中的核心数据结构,它是一个二维表格型的数据结构,可以看作是Series的集合,每个列都有相同的数据类型。在Python数据分析领域,DataFrame非常常用,它可以存储大量的数据,并支持标签式索引和列名,使得数据操作和分析变得高效。
创建DataFrame的一般语法如下:
```python
import pandas as pd
# 从列表或数组创建 DataFrame
data = {'column1': [value1, value2, ...],
'column2': [value3, value4, ...], ...}
df = pd.DataFrame(data)
# 或者直接从CSV、Excel等文件读取
df = pd.read_csv('file.csv')
# 也可以通过字典的字典来创建
data_dict = {col: [val1, val2] for col, val in zip(column_names, data)}
df = pd.DataFrame(data_dict)
```
常用的操作包括查看数据前几行、选择特定列、添加新列、合并/拼接数据框等。例如:
```python
# 查看前5行
print(df.head())
# 选择某一列
df['column_name']
# 添加新列
df['new_column'] = new_values
# 合并数据框,如按列连接(inner join)
merged_df = pd.merge(df1, df2, on='common_column')
```
阅读全文