pandas.dataframe()用法
时间: 2024-10-31 20:04:29 浏览: 13
pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例
pandas.DataFrame()是一个在Pandas库中创建二维表格数据结构(DataFrame)的主要函数。DataFrame是一种表格型的数据结构,它有行索引和列名,可以看作是表格化的Series集合,每列可以包含不同类型的数据。
用法示例:
```python
import pandas as pd
# 创建一个简单的DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Paris', 'London']
}
df = pd.DataFrame(data)
# 或者直接从列表或数组创建,不需要字典形式
df = pd.DataFrame([
[1, 'John', 'Male'],
[2, 'Jane', 'Female'],
[3, 'Mike', 'Male']
], columns=['ID', 'Name', 'Gender'])
# 另外,还可以通过其他数据源如CSV、Excel、SQL查询等创建DataFrame
df_from_csv = pd.read_csv('file.csv')
# DataFrame还支持各种操作,如筛选、排序、合并、分组等
df_filtered = df[df['Age'] > 30]
阅读全文