Namespaces
Variants

std::wstring_convert<Codecvt,Elem,Wide_alloc,Byte_alloc>:: to_bytes

From cppreference.net
ヘッダーで定義 <locale>
byte_string to_bytes ( Elem wchar ) ;
(1)
byte_string to_bytes ( const Elem * wptr ) ;
(2)
byte_string to_bytes ( const wide_string & wstr ) ;
(3)
byte_string to_bytes ( const Elem * first, const Elem * last ) ;
(4)

cvtptr が指すファセットを使用して、ワイドシーケンスをバイト文字列に変換します。

1) ワイドシーケンスは単一の要素 byte のみで構成されます。
2) ワイドシーケンスは、 ptr から始まるnull終端シーケンスです。
3) ワイドシーケンスは str に含まれるシーケンスです。
4) ワイドシーケンスは範囲 [ first , last ) です。

変換が開始される前に、 * this がコンストラクタのオーバーロード (3) で構築され ていない 場合、 cvtstate はデフォルト値(初期変換状態)に設定されます。

入力要素の変換に成功した数は cvtcount に格納されます。

目次

戻り値

変換が成功した場合、変換結果を返します。それ以外の場合、 * this がコンストラクタのオーバーロード (4) で構築されている場合は、 byte_err_string を返します。

例外

変換が失敗し、かつ * this がコンストラクタオーバーロード (4) で構築され なかった 場合、 std::range_error をスローします。

#include <codecvt>
#include <iomanip>
#include <iostream>
#include <locale>
#include <string>
// 出力用ユーティリティ関数
void hex_print(const std::string& s)
{
    std::cout << std::hex << std::setfill('0');
    for (unsigned char c : s)
        std::cout << std::setw(2) << static_cast<int>(c) << ' ';
    std::cout << std::dec << '\n';
}
int main()
{
    // ワイド文字データ
    std::wstring wstr = L"z\u00df\u6c34\U0001f34c"; // または L"zß水🍌"
    // ワイド文字からUTF-8へ変換
    std::wstring_convert<std::codecvt_utf8<wchar_t>> conv1;
    std::string u8str = conv1.to_bytes(wstr);
    std::cout << "UTF-8変換により " << u8str.size() << " バイト生成されました:\n";
    hex_print(u8str);
    // ワイド文字からUTF-16leへ変換
    std::wstring_convert<std::codecvt_utf16<wchar_t, 0x10ffff, std::little_endian>> conv2;
    std::string u16str = conv2.to_bytes(wstr);
    std::cout << "UTF-16le変換により " << u16str.size() << " バイト生成されました:\n";
    hex_print(u16str);
}

出力:

UTF-8変換により 10 バイト生成されました:
7a c3 9f e6 b0 b4 f0 9f 8d 8c 
UTF-16le変換により 10 バイト生成されました:
7a 00 df 00 34 6c 3c d8 4c df

関連項目

バイト文字列をワイド文字列に変換する
(公開メンバ関数)
ワイド文字列をナローマルチバイト文字列に変換する(状態指定)
(関数)
[virtual]
InternT から ExternT への文字列変換(ファイル書き込み時など)
( std::codecvt<InternT,ExternT,StateT> の仮想保護メンバ関数)