pandas excel 千位分隔符
时间: 2023-11-09 22:00:18 浏览: 186
可以使用 pandas 的 styler 对象来实现在 excel 中添加千位分隔符。具体实现方法如下:
1. 读取 excel 文件并创建 pandas 的 dataframe 对象
```
import pandas as pd
df = pd.read_excel('example.xlsx')
```
2. 创建 styler 对象并设置千位分隔符
```
def add_commas(val):
return '{:,}'.format(val)
styler = df.style.format({'列名': add_commas})
```
3. 将 styler 对象写入 excel 文件
```
styler.to_excel('example_formatted.xlsx', index=False)
```
相关问题
pandas read_excel参数
Pandas中read_excel函数的常用参数有:
- filepath_or_buffer: excel文件路径或文件名
- sheet_name: 要读取的excel sheet的名称或编号(默认读取第一个sheet)
- header: 行号作为列名(默认为0)
- skiprows: 跳过前几行(默认为0)
- skipfooter: 跳过最后几行(默认为0)
- index_col: 使用哪一列作为索引(默认为None)
- names: 给列赋予新的名称(默认为None)
- usecols: 使用哪些列(默认读取所有列)
- engine: 使用的读取引擎(默认为'openpyxl', 可选'xlrd'或'xlwt')
- converters: 转换某些特殊列的数据类型(默认为None)
- true_values: 将特定值解释为True(默认为None)
- false_values: 将特定值解释为False(默认为None)
- na_values: 将特定值解释为NA/NaN(默认为None)
- keep_default_na: 是否保留默认的NA/NaN值(默认为True)
- verbose: 显示读取进度(默认为False)
- parse_dates: 将哪些列解释为日期(默认为None)
- date_parser: 日期解析函数(默认为None)
- dayfirst: 是否默认将日期按照'DD/MM/YYYY'的格式解析(默认为False)
- iterator: 是否使用迭代器读取文件(默认为False)
- chunksize: 迭代器读取的块大小(默认为None)
- compression: 压缩类型(默认为None, 可选'infer', 'gzip', 'bz2', 'zip', 'xz'等)
- thousands: 千位分隔符(默认为None)
- decimal: 小数点符号(默认为'.')
- linetermin: 行结束符(默认为'\r\n')
- quotechar: 引用符(默认为'"')
- quoting: 引用模式(默认为csv.QUOTE_MINIMAL, 可选csv.QUOTE_ALL, csv.QUOTE_NONNUMERIC, csv.QUOTE_NONE)
- doublequote: 是否将引用符内的引用符转义(默认为True)
- escapechar: 转义符(默认为None)
- comment: 注释符(默认为None)
- encoding: 编码方式(默认为None, 可选'utf-8', 'cp1252'等)
- dialect: 对话方式(默认为None, 可选csv.excel, csv.excel_tab等)
- tupleize_cols: 是否将列转换为元组(默认为False)
- error_bad_lines: 是否忽略读取过程中出现的错误(默认为True)
- warn_bad_lines: 是否在出现错误时发出警告(默认为True)
- skip_blank_lines: 是否跳过空行(默认为True)
- keep_date_col: 是否保留原有的日期列(默认为True)
- dayname: 是否包含星期名称(默认为False)
- thousands: 千位分隔符(默认为',')
- keep_default_na: 是否保留默认的NA/NaN值(默认为True)
- na_filter: 是否过滤NA/NaN值(默认为True)
- memory_map: 是否使用内pandas的read_excel()函数有许多可选参数。
常用参数如下:
- `io`: 文件路径或者文件类型。
- `sheet_name`: 读取的工作表名称或编号。
- `header`: 用来作为列名的行号。
- `skiprows`: 跳过的行数。
- `index_col`: 作为索引的列编号。
- `usecols`: 选择读取的列。
- `nrows`: 读取的行数。
其他参数可以参考官方文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html
pandas.read_excel 详细参数
pandas.read_excel() 是 pandas 库中用于读取 Excel 文件的函数,它的详细参数如下:
1. io:文件名、URL、文件型对象或者一个包含以上对象的列表。必需参数。
2. sheet_name:需要读取的工作表名称或者工作表索引,可以是字符串、整数或者列表。默认为 0,即读取第一个工作表。
3. header:指定列名所在的行数,默认为 0,即第一行。
4. names:列名,如果 header=None,则使用 names 作为列名。
5. index_col:指定数据中作为行名的列,可以是单个列名或者多个列名构成的列表。默认为 None,即不指定行名。
6. usecols:读取指定的列,可以是单个列名或者多个列名构成的列表。默认为 None,即读取所有列。
7. dtype:指定每列的数据类型,可以是字典或者单个类型。默认为 None,即自动推断数据类型。
8. converters:字典,用于指定每列需要转换的类型。
9. na_values:指定需要替换为 NaN 的值。
10. keep_default_na:是否保留 Excel 文件中的默认 NaN 值。
11. verbose:是否输出读取日志信息,默认为 False。
12. engine:指定 Excel 文件读取引擎,可以是 'openpyxl'、'xlrd' 或者 'xlsxwriter'。默认为 'xlrd'。
13. squeeze:是否将单列 DataFrame 转化为 Series 类型,默认为 False。
14. thousands:千位分隔符,指定数字中千位分隔符所使用的字符,默认为 ','。
15. decimal:小数点分隔符,指定数字中小数点所使用的字符,默认为 '.'。
16. skiprows:指定需要跳过的行数。
17. skipfooter:指定需要跳过的行数,从文件末尾开始计算。
18. nrows:指定需要读取的行数。
19. parse_dates:指定需要解析为日期时间格式的列,可以是单个列名或者多个列名构成的列表。
20. date_parser:用于解析日期时间格式的函数。
21. squeeze:是否将单列 DataFrame 转化为 Series 类型,默认为 False。
22. infer_datetime_format:是否启用 Pandas 的自动日期时间格式推断功能。
23. converters:字典,用于指定每列需要转换的类型。
24. sheet_list:指定需要读取的工作表列表。
阅读全文