Python read_table读txt文件中—>符号读不出来
时间: 2024-05-01 20:21:58 浏览: 119
您好,可以通过设置read_table函数的delimiter参数来指定读取文件时使用的分隔符,例如:
```
import pandas as pd
df = pd.read_table('test.txt', delimiter='—>')
```
这样,就可以按照—>符号进行读取了。祝您工作愉快!
相关问题
文本文件article.txt(一篇英文文章)直接在目录中新建并输入数据,编写一个程序,对文件中的单词根据长度进行分类和统计,标点符号忽略,相同的单词仅计算一次。分类和统计结果按照以下格式:1:1,a 2:3,an on in,结果按照单词长度升序排序后显示,并存放到new_article_classify.txt中
下面是Python的实现代码:
```python
import string
# 读取文件并分割单词
with open('article.txt', 'r') as f:
words = f.read().lower().split()
# 去掉单词中的标点符号
table = str.maketrans('', '', string.punctuation)
words = [word.translate(table) for word in words]
# 统计单词出现次数
word_freq = {}
for word in words:
if word not in word_freq:
word_freq[word] = 1
# 对单词按长度进行分类和统计
word_classify = {}
for word, freq in word_freq.items():
length = len(word)
if length not in word_classify:
word_classify[length] = [(word, freq)]
else:
word_classify[length].append((word, freq))
# 排序并输出结果到文件
with open('new_article_classify.txt', 'w') as f:
for length in sorted(word_classify.keys()):
words = [word[0] for word in word_classify[length]]
freqs = [word[1] for word in word_classify[length]]
f.write('{}:{}\n{}\n'.format(length, len(word_classify[length]), ' '.join(words)))
```
这个程序首先读取文件并把文章中的单词分割出来,然后去掉单词中的标点符号,统计每个单词出现的次数。接下来,根据单词的长度对它们进行分类和统计,最后按照单词长度升序排序并输出结果到文件new_article_classify.txt中。
代码错误:import pandas as pd # 读取第一个表格并保存表头 df = pd.read_excel('附件一:2022年12月末存量公司客户管户认领情况表__海沧-1.xlsx') header = df.columns.tolist() # 循环读取其余表格并拼接 for file in [ '附件三:2022年12月末存量机构客户管户认领情况表__海沧支行-1.xlsx', '附件二:2023年3月末新拓公司客户管户认领情况表__海沧-1.xlsx', '附件四:2023年3月末新拓机构客户管户认领情况表__海沧支行-1.xlsx' ]: df_temp = pd.read_excel(file, header=None, skiprows=1) df = df.append(df_temp) # 输出新表 df.to_excel('new_table.xlsx', index=False, header=header)
这段代码可能出错的原因是文件名没有写对或者文件路径不正确。请确保文件名和路径与实际文件匹配,并且文件在当前工作目录或者指定的路径中可用。
另外,如果文件名中包含空格或者其他特殊字符,需要使用引号将文件名括起来,例如:
```python
df = pd.read_excel('附件一:2022年12月末存量公司客户管户认领情况表__海沧-1.xlsx')
```
可以改为:
```python
df = pd.read_excel('附件一:2022年12月末存量公司客户管户认领情况表__海沧-1.xlsx')
```
或者:
```python
df = pd.read_excel(r'C:\data\附件一:2022年12月末存量公司客户管户认领情况表__海沧-1.xlsx')
```
其中`r`表示将字符串转义字符原样输出,可以避免一些路径中的转义符号被误解释。同时,也要确保指定的路径存在,文件名正确。
阅读全文