std::string中文乱码
时间: 2023-12-21 09:06:13 浏览: 143
中文乱码问题
在C++中,std::string默认使用的是ASCII编码,而中文字符是Unicode编码,因此在使用std::string存储中文字符时,可能会出现乱码的情况。为了避免这种情况,可以使用std::wstring来存储中文字符,或者使用第三方库进行编码转换。下面是一个使用第三方库iconv进行编码转换的例子:
```c++
#include <iostream>
#include <string>
#include <iconv.h>
int main() {
std::string str = "中文字符";
std::string from_charset = "UTF-8";
std::string to_charset = "GBK";
iconv_t cd = iconv_open(to_charset.c_str(), from_charset.c_str());
if (cd == (iconv_t)-1) {
std::cerr << "iconv_open failed" << std::endl;
return 1;
}
char *inbuf = const_cast<char *>(str.c_str());
size_t inbytesleft = str.length();
size_t outbytesleft = inbytesleft * 2;
char *outbuf = new char[outbytesleft];
char *outbuf_start = outbuf;
if (iconv(cd, &inbuf, &inbytesleft, &outbuf, &outbytesleft) == (size_t)-1) {
std::cerr << "iconv failed" << std::endl;
return 1;
}
std::string result(outbuf_start, outbuf - outbuf_start);
std::cout << result << std::endl;
delete[] outbuf;
iconv_close(cd);
return 0;
}
```
上述代码中,我们使用了iconv库进行编码转换。首先,我们定义了一个std::string类型的字符串str,其中包含中文字符。然后,我们定义了两个std::string类型的变量from_charset和to_charset,分别表示源编码和目标编码。在本例中,源编码为UTF-8,目标编码为GBK。接下来,我们调用iconv_open函数打开一个iconv转换句柄。如果打开失败,我们将输出错误信息并返回1。然后,我们定义了输入缓冲区inbuf、输入缓冲区剩余字节数inbytesleft、输出缓冲区outbuf、输出缓冲区剩余字节数outbytesleft。接着,我们调用iconv函数进行编码转换。如果转换失败,我们将输出错误信息并返回1。最后,我们将输出转换后的结果,并释放内存和关闭iconv转换句柄。
阅读全文