C++使用WideCharToMultiByte函数生成UTF-8编码文件的方法 - CSDN文库

123 浏览量更新于2023-05-11 收藏 60KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源推荐

C++使用使用WideCharToMultiByte函数生成函数生成UTF-8编码文件的方编码文件的方

法法

用来映射Unicode字符串的WideCharToMultiByte函数经常被用来进行UTF-8编码的转换,以下我们将看到C++使

用WideCharToMultiByte函数生成UTF-8编码文件的方法,首先先来对WideCharToMultiByte作一个详细的了解:

WideCharToMultiByte函数映射一个unicode字符串到一个多字节字符串。

函数原型：函数原型：

int WideCharToMultiByte

UINT CodePage, //指定执行转换的代码页

DWORD dwFlags, //允许你进行额外的控制，它会影响使用了读音符号（比如重音）的字符

LPCWSTR lpWideCharStr, //指定要转换为宽字节字符串的缓冲区

int cchWideChar, //指定由参数lpWideCharStr指向的缓冲区的字符个数

LPSTR lpMultiByteStr, //指向接收被转换字符串的缓冲区

int cchMultiByte, //指定由参数lpMultiByteStr指向的缓冲区最大值

LPCSTR lpDefaultChar, //遇到一个不能转换的宽字符，函数便会使用pDefaultChar参数指向的字符

LPBOOL pfUsedDefaultChar //至少有一个字符不能转换为其多字节形式，函数就会把这个变量设为TRUE

参数：参数：

CodePage：指定执行转换的代码页，这个参数可以为系统已安装或有效的任何代码页所给定的值。你也可以指定其为下面的

任意一值：

CP_ACP：ANSI代码页；CP_MACCP：Macintosh代码页；CP_OEMCP：OEM代码页；

CP_SYMBOL：符号代码页（42）；CP_THREAD_ACP：当前线程ANSI代码页；

CP_UTF7：使用UTF-7转换；CP_UTF8：使用UTF-8转换。

相关变量相关变量

lpWideCharStr：指向将被转换的unicode字符串。

cchWideChar：指定由参数lpWideCharStr指向的缓冲区的字符个数。如果这个值为-1，字符串将被设定为以NULL为结

束符的字符串，并且自动计算长度。

lpMultiByteStr：指向接收被转换字符串的缓冲区。

cchMultiByte：指定由参数lpMultiByteStr指向的缓冲区最大值（用字节来计量）。若此值为零，函数返回lpMultiByteStr

指向的目标缓冲区所必需的字节数，在这种情况下，lpMultiByteStr参数通常为NULL。

lpDefaultChar和pfUsedDefaultChar：只有当WideCharToMultiByte函数遇到一个宽字节字符，而该字符在uCodePage

参数标识的代码页中并没有它的表示法时，WideCharToMultiByte函数才使用这两个参数。如果宽字节字符不能被转

换，该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL（这是大多数情况下的参数值），那么该函数使

用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的，因为问号是个通配符。pfUsedDefaultChar

参数指向一个布尔变量，如果Unicode字符串中至少有一个字符不能转换成等价多字节字符，那么函数就将该变量置为

TRUE。如果所有字符均被成功地转换，那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被

成功地转换后，可以测试该变量。

返回值：如果函数运行成功，并且cchMultiByte不为零，返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数；如果

函数运行成功，并且cchMultiByte为零，返回值是接收到待转换字符串的缓冲区所必需的字节数。如果函数运行失败，

返回值为零。若想获得更多错误信息，请调用GetLastError函数。它可以返回下面所列错误代码：

ERROR_INSUFFICIENT_BJFFER；ERROR_INVALID_FLAGS；

ERROR_INVALID_PARAMETER；ERROR_NO_UNICODE_TRANSLATION。

注意：指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样，函数将失败，GetLastError将返回

ERROR_INVALID_PARAMETER的值。

Windows CE：不支持参数CodePage中的CP_UTF7和CP_UTF8的值，以及参数dwFlags中的

WC_NO_BEST_FIT_CHARS值。

生成生成utf-8编码的文件编码的文件

步骤如下:

1. 首先要写一个BOM头。UTF-8文件一般是要这个头的，当然也可以没有。

2. 将要生成的字符先使用宽字符格式生成，然后调用WideCharToMultiByte转为utf-8编码，写入文件。

例子如下：

FILE * pFile = fopen("d://a.txt", "w");

char szBOM[4] = {(char)0xEF, (char)0xBB, (char)0xBF, 0};

fprintf(pFile, "%s", szBOM);

wchar_t chNum[11] = L"零壹贰叁肆伍陆柒捌玖";

wchar_t chNum2[10] = L"亿千百拾万千百拾个";

char sz[10] = "112304823";

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

weixin_38538950

粉丝: 4
资源: 930

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈