用Python脚本统计csv文件单词数量
时间: 2024-02-02 09:05:18 浏览: 23
可以使用Python内置的csv模块和collections模块来统计csv文件中单词数量。以下是一个示例脚本:
```python
import csv
from collections import Counter
# 打开csv文件
with open('example.csv', 'r', encoding='utf-8') as csvfile:
reader = csv.reader(csvfile)
# 将所有单元格的内容合并为一个字符串
text = ' '.join([cell.strip() for row in reader for cell in row])
# 使用Counter统计单词数量
word_count = Counter(text.split())
# 输出结果
for word, count in word_count.items():
print(f"{word}: {count}")
```
在这个示例中,我们打开了名为example.csv的文件,并将所有单元格的内容合并为一个字符串。然后,我们使用collections模块中的Counter函数来统计单词数量,并输出结果。注意,这个示例假设csv文件中的每个单元格都只包含一个单词。如果单元格中包含多个单词,需要对代码进行修改以适应不同的情况。
相关问题
使用python脚本把CSV文件数据导入ORACLE
可以使用Python中的pandas库来读取CSV文件数据,并使用cx_Oracle库连接并导入到ORACLE数据库中。以下是示例代码:
```python
import pandas as pd
import cx_Oracle
# 读取CSV文件数据
df = pd.read_csv('data.csv')
# 建立ORACLE数据库连接
dsn = cx_Oracle.makedsn('hostname', port, service_name='ORCL')
conn = cx_Oracle.connect(user='username', password='password', dsn=dsn)
# 将数据写入ORACLE数据库
cursor = conn.cursor()
for row in df.itertuples(index=False):
cursor.execute('INSERT INTO table_name VALUES (:1, :2, :3, :4)', row)
conn.commit()
# 关闭连接
cursor.close()
conn.close()
```
请注意,您需要将代码中的hostname、port、user、password和table_name替换为您自己的值。
用python脚本获取csv文件编码格式的方法
在 Python 中,可以使用 `chardet` 模块获取文件的编码格式。下面是一个获取 CSV 文件编码格式的示例:
```python
import chardet
import csv
# 读取文件内容
with open('file.csv', 'rb') as f:
content = f.read()
# 获取编码格式
result = chardet.detect(content)
encoding = result['encoding']
confidence = result['confidence']
# 输出编码格式信息
print('文件编码格式:{},可信度:{}'.format(encoding, confidence))
# 使用正确的编码格式读取文件
with open('file.csv', 'r', encoding=encoding) as f:
reader = csv.reader(f)
for row in reader:
# 处理每一行数据
```
这里,使用 `chardet.detect()` 函数获取文件的编码格式和可信度。然后,使用获取到的编码格式读取文件内容,并处理文件内容。需要注意的是,`open()` 函数打开文件时需要使用二进制模式读取文件,否则可能会出现编码错误。