C++11 UTF8的编解码

简单的讲,编码是指把有效信息按照指定格式变成字符串或者字节流,解码是指把字符串或字节流按照指定格式转成有效信息,要保证编解码时使用相同的格式,才能得到有效信息。也可以参考这篇文章


C++11提供的方法

C++11 提供了std::wstring_convert和std::codecvt_utf8来编解码UTF8

#include <locale>
#include <codecvt>

std::string utf8_encode(const std::wstring& source)
{
    
    
	return std::wstring_convert<std::codecvt_utf8<wchar_t>>().to_bytes(source);
}

std::wstring utf8_decode(const std::string& source)
{
    
    
    return std::wstring_convert<std::codecvt_utf8<wchar_t>>().from_bytes(source);
}

使用如下,

int main()
{
    
    
    std::wstring dd = L"你好";
    std::string ddbytes = utf8_encode(dd); // 按照UTF8格式进行编码,转为常规string,即得到UTF8格式的字节流
    
	
	std::wstring ret = utf8_decode(ddbytes); // 按照UTF8格式对字节流进行解码,转为wstring
}

猜你喜欢

转载自blog.csdn.net/whahu1989/article/details/109731625