做一个使用 Python 的 pandas 库读取表格数据并统计人数的脚本示例: python 1. 导入 pandas 库 2. 读取表格数据 3. 合并列 4. 分割字符串 5. 扁平化列表 6. 去除重复 7. 统计人数 8. 打印结果
时间: 2024-10-08 20:24:30 浏览: 41
一个简单的数据分析脚本示例,它使用Python和pandas库来读取CSV文件、执行一些基本的数据清洗和转换,并进行简单的可视化
当然,这里是一个结合了上述步骤的Python脚本示例,假设你有这样一个二维列表,每个子列表代表一个人,包含名字和其他信息,我们仅统计名字的数量:
```python
import pandas as pd
# 创建示例数据
data = [
['张三', '男'],
['李四', '女'],
['张三', '男'],
['王五', '男'],
['赵六', '女'],
]
# 1. 导入 pandas 库
# 无需特别说明,这是默认的操作
# 2. 读取表格数据
df = pd.DataFrame(data, columns=['Name', 'Gender']) # 假设 Name 列存储的是名字
# 3. 合并列(这里是直接用,因为你已经分开了)
# 如果需要合并其他列,可以简单地将它们放在一起,例如 df[['Name', 'NewColumn']]
# 4. 分割字符串(这里不需要,因为我们已经有单独的名字列)
# 如果需要,你可以用 df['Name'].str.split() 来按某个字符分割,如姓和名
# 5. 扁平化列表(这里也没必要,因为我们已经有了扁平的数据)
# 如果数据结构更复杂,可以用 df.applymap(list).explode() 或者 json.loads(df['column']) 来扁平化
# 6. 去除重复
unique_names = df['Name'].drop_duplicates()
# 7. 统计人数
name_count = unique_names.shape[0] # shape[0] 返回行数,即唯一名字的数量
# 8. 打印结果
print(f"有 {name_count} 个独一无二的名字.")
# 相关问题--
1. 为什么在这里直接用 DataFrame 而不是从 CSV 文件读取数据?
2. 如果原始数据结构更复杂,如何处理?
3. 有没有办法在去重之前忽略名字的大小写?
阅读全文