python读取txt内容去掉句号
时间: 2023-07-06 13:41:38 浏览: 75
可以使用Python的字符串操作来去掉文本中的句号。以下是示例代码:
```python
with open('file.txt', 'r') as f:
text = f.read()
# 去掉句号
text = text.replace('.', '')
print(text)
```
解释:
- 首先使用 `open` 函数打开文件并读取文本内容;
- 然后使用 `replace` 函数将文本中的句号替换为空字符串,即删除句号;
- 最后输出处理后的文本。
相关问题
我想读取“D:\点宽学院”下所有PDF内容,将所有读取到的内容合并成一个字符串,去掉其中所有空行与空格。然后用中文句号进行分割,一句话中含有一个句号,把分割出来的语句一一打印出来,请用python实现,不能用pypdf2和pdfminer库
可以使用PyMuPDF库来实现这个功能。以下是代码实现:
```python
import fitz # PyMuPDF库
# 读取PDF文件的内容
def read_pdf(file_path):
doc = fitz.open(file_path)
content = ""
for page in doc:
content += page.getText()
doc.close()
return content
# 去除字符串中的空格和空行
def remove_spaces(text):
return "\n".join([line.strip() for line in text.split("\n") if line.strip()])
# 将字符串按中文句号分割成多个语句
def split_sentences(text):
sentences = []
for sentence in text.split("。"):
sentence = sentence.strip()
if sentence:
sentences.append(sentence + "。")
return sentences
# 读取指定目录下所有PDF文件的内容并合并成一个字符串
def read_all_pdfs(dir_path):
all_content = ""
for file_name in os.listdir(dir_path):
if file_name.endswith(".pdf"):
file_path = os.path.join(dir_path, file_name)
content = read_pdf(file_path)
content = remove_spaces(content)
all_content += content
return all_content
# 将字符串按中文句号分割成多个语句并打印出来
def print_sentences(text):
sentences = split_sentences(text)
for sentence in sentences:
print(sentence)
# 测试
dir_path = r"D:\点宽学院"
all_content = read_all_pdfs(dir_path)
print_sentences(all_content)
```
这段代码会读取指定目录下所有PDF文件的内容,并将它们合并成一个字符串。然后会去掉其中的空格和空行,并按中文句号分割成多个语句。最后将分割出来的语句逐一打印出来。
我想读取"我想读取“D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf”这个PDF的内容,把读取的内容合并成一个字符串,然后用中文或英文句号进行分割,把分割的结果打印出来,用python,不用pypdf2库
好的,你可以使用Python中的PyMuPDF库来实现这个功能。以下是代码:
```python
import fitz
# 读取PDF文件
doc = fitz.open(r"D:\点宽学院\在线绿色互动如何影响共享型绿色消费行为_——自然联结性的调节作用_王建明.pdf")
# 定义一个空字符串来存储读取的内容
text = ""
# 读取每一页的内容并添加到字符串中
for page in doc:
text += page.getText()
# 用中文或英文句号进行分割
text = text.replace('\n', '') # 去掉换行符
text = text.replace('\r', '') # 去掉回车符
text = text.replace(' ', '') # 去掉空格
text = text.replace('。', '。\n') # 中文句号
text = text.replace('. ', '.\n') # 英文句号
# 打印分割结果
print(text)
```
这个程序会读取指定路径下的PDF文件,并把每一页的内容合并成一个字符串。然后,它会用中文或英文句号进行分割,并把分割的结果打印出来。
阅读全文