dataframe的语法
时间: 2024-11-05 11:11:19 浏览: 3
Spark DataFrame
在Pandas库中,DataFrame是一种强大的二维数据结构,其语法主要包括以下几个关键部分:
1. **创建DataFrame**:
- 从字典或列表创建:`pd.DataFrame(data)`,其中`data`是一个字典,键是列名,值是相应列的数据。
- 从CSV、Excel等文件加载:`pd.read_csv('file.csv')` 或 `pd.read_excel('file.xlsx')`。
- 从SQL查询获取:`pd.read_sql_query(query, connection)`。
2. **查看数据**:
- 列表所有列名:`df.columns`
- 显示前几行或指定范围的行:`df.head()` 或 `df.iloc[start:end]`
- 查看数据摘要统计:`df.describe()`
3. **修改和操作数据**:
- 修改单个元素:`df.loc[row_index, column_name] = value`
- 添加新列:`df['new_column'] = new_data`
- 删除列:`del df['column_name']`
4. **数据筛选和条件操作**:
- 条件选择:`df[df['column'] > threshold]`
- 布尔索引:`df[df['column'].isin(['value1', 'value2'])]`
5. **合并与拼接**:
- `pd.concat([df1, df2], axis=0)` 合并沿行 (`axis=0`),`pd.merge(df1, df2, on='key')` 按键合并。
6. **分组和聚合**:
- `groupby` 函数进行分组分析:`df.groupby('column').agg({'column': 'mean'})`
7. **数据透视**:
- `pivot_table` 或 `pivot` 可用于重塑数据以展示多维度信息。
8. **保存数据**:
- `to_csv('output_file.csv')`, `to_excel('output_file.xlsx')` 等将DataFrame保存到文件。
阅读全文