Namespaces
Variants

std:: mbrtowc

From cppreference.net
ヘッダーで定義 <cwchar>
std:: size_t mbrtowc ( wchar_t * pwc,

const char * s,
std:: size_t n,

std:: mbstate_t * ps ) ;

ナローマルチバイト文字をワイド文字に変換します。

s が null ポインタでない場合、 s が指すバイトから始まるマルチバイト文字列の最大 n バイトを検査し、次のマルチバイト文字(シフトシーケンスを含む)を完了するために必要なバイト数を決定します。関数が s 内の次のマルチバイト文字が完全かつ有効であると判断した場合、それを対応するワイド文字に変換し、 * pwc に格納します( pwc が null でない場合)。

s が null ポインタの場合、 n および pwc の値は無視され、この呼び出しは std :: mbrtowc ( nullptr, "" , 1 , ps ) と等価になります。

生成されたワイド文字がナル文字の場合、 * ps に格納された変換状態は初期シフト状態となります。

目次

パラメータ

pwc - 結果のワイド文字が書き込まれる場所へのポインタ
s - 入力として使用されるマルチバイト文字列へのポインタ
n - 検査可能なsのバイト数の制限
ps - マルチバイト文字列の解釈時に使用される変換状態へのポインタ

戻り値

以下のうち最初に該当するもの:

  • 0 sから変換された文字(nullでない場合はpwcに格納される)がナル文字であった場合。
  • sから正常に変換されたマルチバイト文字のバイト数 [ 1 ... n ]
  • static_cast < std:: size_t > ( - 2 ) 次の n バイトが不完全ではあるが、これまで有効なマルチバイト文字を構成している場合。 * pwc には何も書き込まれない。
  • static_cast < std:: size_t > ( - 1 ) エンコーディングエラーが発生した場合。 * pwc には何も書き込まれず、値 EILSEQ errno に格納され、 * ps の値は未指定となる。

#include <clocale>
#include <cstring>
#include <cwchar>
#include <iostream>
void print_mb(const char* ptr)
{
    std::mbstate_t state = std::mbstate_t(); // 初期状態
    const char* end = ptr + std::strlen(ptr);
    int len;
    wchar_t wc;
    while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0)
    {
        std::wcout << "次の " << len << " バイトは文字 " << wc << '\n';
        ptr += len;
    }
}
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 ナローマルチバイトエンコーディング
    const char* str = "z\u00df\u6c34\U0001d10b"; // または u8"zß水𝄋"
                      // または "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
    print_mb(str);
}

出力:

次の 1 バイトは文字 z
次の 2 バイトは文字 ß
次の 3 バイトは文字 水
次の 4 バイトは文字 𝄋

関連項目

次のマルチバイト文字をワイド文字に変換する
(関数)
ワイド文字をマルチバイト表現に変換する(状態を指定)
(関数)
[virtual]
ExternT から InternT への文字列変換(ファイルからの読み取り時など)
( std::codecvt<InternT,ExternT,StateT> の仮想保護メンバー関数)