这里给出《春江花月夜》文本,保存在春江花月夜.txt文件中 请编写程序,对《春江花月夜》文本中出现的汉字及标点符号进行统计,字符与出现次数之间用冒号:分隔,输出保存到字频统计.txt文件中,该文件要求采用CSV格式存储。
时间: 2024-02-24 21:56:59 浏览: 26
好的,以下是Python代码实现:
```python
import csv
# 读取文本文件
with open('春江花月夜.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 统计汉字及标点符号出现次数
char_dict = {}
for char in text:
# 判断是否为汉字或标点符号
if '\u4e00' <= char <= '\u9fff' or char in ',。!?;:、':
if char in char_dict:
char_dict[char] += 1
else:
char_dict[char] = 1
# 将结果输出到CSV文件中
with open('字频统计.txt', 'w', newline='', encoding='utf-8') as f:
writer = csv.writer(f)
for char, count in char_dict.items():
writer.writerow([char, count])
```
程序运行后,会在当前目录下生成一个名为“字频统计.txt”的CSV文件,其中每一行为一个汉字或标点符号及其出现次数,使用冒号:分隔。
相关问题
使用python百度搜索“春江花月夜” 1、新建文本文件”chunjiang.txt”, 2、写入“春江花月夜”内容, 3、读取文件内容。
你可以尝试以下代码实现:
```python
# 导入requests库
import requests
# 百度搜索链接
url = 'https://www.baidu.com/s'
# 搜索关键词
keyword = '春江花月夜'
# 构造查询参数
params = {'wd': keyword}
# 发送查询请求
response = requests.get(url, params=params)
# 获取查询结果的HTML源代码
html = response.text
# 新建文件并写入搜索结果
with open('chunjiang.txt', 'w', encoding='utf-8') as f:
f.write(html)
# 读取文件内容
with open('chunjiang.txt', 'r', encoding='utf-8') as f:
content = f.read()
print(content)
```
注意,由于百度搜索结果的HTML源代码可能比较长,因此在写入文件时可能会耗费较长时间。如果你只需要查看搜索结果的部分内容,可以修改代码如下:
```python
# 新建文件并写入搜索结果的前1000个字符
with open('chunjiang.txt', 'w', encoding='utf-8') as f:
f.write(html[:1000])
# 读取文件内容
with open('chunjiang.txt', 'r', encoding='utf-8') as f:
content = f.read()
print(content)
```
这样可以只写入搜索结果的前1000个字符,节省写入时间和文件空间。
如何使用正则表达式筛选出春江花月夜中以江字开头的诗句并输出
您可以使用以下正则表达式来筛选符合条件的句子:
^江.*。
这个正则表达式以“江”字开头,并且后面可以跟上任意字符(0个或多个),直到句子结束。
以下是一个 Python 代码示例,可以读取文本文件中的所有句子,然后筛选出符合条件的句子并输出:
```python
import re
# 定义正则表达式
pattern = "^江.*。"
# 打开文件并读取所有行
with open("poem.txt", "r", encoding="utf-8") as f:
lines = f.readlines()
# 遍历所有行,筛选符合条件的句子并输出
for line in lines:
# 使用正则表达式匹配句子
match = re.match(pattern, line)
if match:
# 如果匹配成功,则输出匹配结果
print(match.group(0))
```
请注意,这个示例假设您的诗歌文件名为 `poem.txt`,并且使用 UTF-8 编码。您需要根据实际情况进行相应修改。
相关推荐
![ppt](https://img-home.csdnimg.cn/images/20210720083527.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)