统计csv文件中每列数据中数字使用频率
时间: 2023-06-01 20:05:36 浏览: 118
0409_逻辑分析仪导出30次数据,matlab中怎么查看库函数源码,matlab源码怎么用
可以使用Python语言中的pandas库来实现统计csv文件中每列数据中数字使用频率的功能,具体代码如下:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 统计数字使用频率
digit_counts = df.apply(lambda x: pd.Series(str(x).replace('.', '').replace(',', '')
.replace('-', '').replace('/', '').replace('%', '')
.replace('NaN', '').replace('nan', '')
.replace('None', '').replace('null', '')
.replace(' ', '').replace('\'', '').replace('\"', '').replace('[', '').replace(']', '')
.replace('{', '').replace('}', '').replace('\\', '').replace('\n', '')
.replace('\t', '').replace('\r', '').replace('\f', '')
.replace('\v', '').replace('\a', '').replace('\b', '').replace('\e', '').replace('\0', '')
.replace('\1', '').replace('\2', '').replace('\3', '').replace('\4', '').replace('\5', '')
.replace('\6', '').replace('\7', '').replace('\8', '').replace('\9', '')
.apply(lambda x: pd.Series(list(x)))
.stack().value_counts(normalize=True))
print(digit_counts)
```
这里我们首先使用pandas库中的read_csv函数读取csv文件,然后使用apply函数将每个单元格中的数值转换为字符串,去除字符串中的无用字符,再使用stack函数将多维数据转换为一维数据,最后使用value_counts函数统计每个数值出现的频率,并且通过normalize参数将频率转换为占比。
以上代码可以统计所有数值类型,包括整数、小数、百分数等。
阅读全文