win10 txt 内容修改utf-8
时间: 2023-05-10 16:01:53 浏览: 545
Win10的文本编辑器自带功能是可以修改UTF-8编码格式的文本内容的。首先,打开文本文件,然后点击“文件”菜单,如果文本文件是ANSI编码格式,那么选择“另存为”并选择“UTF-8”编码格式即可将其保存为UTF-8编码格式。如果文本文件本来就是UTF-8编码格式,那么可以直接修改即可。接下来就可以使用文本编辑器进行修改。如果想要添加中文等非ANSI字符,可以直接输入,因为文本编辑器会自动将其转化为UTF-8编码格式。如果要修改编码格式之前的内容,可以选择全选,然后按Ctrl+C复制文本,新建一个UTF-8编码格式的文本文件并将其粘贴到新的文本文件中,之后就可以对其进行修改。需要注意的是,在修改前要备份文本文件,避免修改后原有的数据发生不可逆的损坏。总的来说,Win10的文本编辑器是一个简单易用的工具,可以满足大部分文本编辑需求。
相关问题
cmakelist 添加支持UTF-8
在 CMakeLists.txt 文件中添加以下代码,即可支持 UTF-8 编码:
```cmake
if (WIN32)
add_definitions(-DUNICODE -D_UNICODE)
endif()
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -finput-charset=UTF-8 -fexec-charset=UTF-8")
```
这里的 `-finput-charset=UTF-8` 表示编译器将源代码文件视为 UTF-8 编码,而 `-fexec-charset=UTF-8` 表示编译后的可执行文件使用 UTF-8 编码。
如果你需要支持其他语言的编码,只需将 UTF-8 替换成对应的编码即可。例如,如果你需要支持 GBK 编码,可以将上面的代码修改为:
```cmake
if (WIN32)
add_definitions(-DUNICODE -D_UNICODE)
endif()
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -finput-charset=GBK -fexec-charset=GBK")
```
python爬虫爬取https://tieba.baidu.com/f?ie=utf-8&kw=%E4%B8%AD%E5%8E%9F%E5%B7%A5%E5%AD%A6%E9%99%A2&fr=search并把数据存储
好的,以下是一个爬取贴吧帖子的示例代码,使用了Requests和BeautifulSoup库:
``` python
import requests
from bs4 import BeautifulSoup
# 设置请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 发送请求
url = 'https://tieba.baidu.com/f?ie=utf-8&kw=%E4%B8%AD%E5%8E%9F%E5%B7%A5%E5%AD%A6%E9%99%A2&fr=search'
response = requests.get(url, headers=headers)
# 解析网页内容
soup = BeautifulSoup(response.content, 'html.parser')
post_list = soup.find_all('li', class_='j_thread_list clearfix')
# 输出帖子标题和链接
for post in post_list:
title = post.find('a', class_='j_th_tit').get('title')
link = 'https://tieba.baidu.com' + post.find('a', class_='j_th_tit').get('href')
print(title, link)
# 存储数据到文件
with open('tieba_posts.txt', 'w', encoding='utf-8') as f:
for post in post_list:
title = post.find('a', class_='j_th_tit').get('title')
link = 'https://tieba.baidu.com' + post.find('a', class_='j_th_tit').get('href')
f.write(title + '\n' + link + '\n\n')
```
这个示例代码可以爬取中原工学院吧的帖子标题和链接,并将其存储到 tieba_posts.txt 文件中。你可以根据需要修改代码来爬取更多数据或者存储到其他格式的文件中。
阅读全文