std:: mbrtowc

From cppreference.net

ヘッダーで定義 `<cwchar>`
std:: size_t mbrtowc ( wchar_t * pwc, const char * s, std:: size_t n, std:: mbstate_t * ps ) ;

ナローマルチバイト文字をワイド文字に変換します。

s が null ポインタでない場合、 s が指すバイトから始まるマルチバイト文字列の最大 n バイトを検査し、次のマルチバイト文字（シフトシーケンスを含む）を完了するために必要なバイト数を決定します。関数が s 内の次のマルチバイト文字が完全かつ有効であると判断した場合、それを対応するワイド文字に変換し、 * pwc に格納します（ pwc が null でない場合）。

s が null ポインタの場合、 n および pwc の値は無視され、この呼び出しは std :: mbrtowc ( nullptr, "" , 1 , ps ) と等価になります。

生成されたワイド文字がナル文字の場合、 * ps に格納された変換状態は初期シフト状態となります。

0 sから変換された文字（nullでない場合はpwcに格納される）がナル文字であった場合。
sから正常に変換されたマルチバイト文字のバイト数 [ 1 ... n ] 。
static_cast < std:: size_t > ( - 2 ) 次の n バイトが不完全ではあるが、これまで有効なマルチバイト文字を構成している場合。 * pwc には何も書き込まれない。
static_cast < std:: size_t > ( - 1 ) エンコーディングエラーが発生した場合。 * pwc には何も書き込まれず、値 EILSEQ が errno に格納され、 * ps の値は未指定となる。

例

このコードを実行

#include <clocale>
#include <cstring>
#include <cwchar>
#include <iostream>
void print_mb(const char* ptr)
{
    std::mbstate_t state = std::mbstate_t(); // 初期状態
    const char* end = ptr + std::strlen(ptr);
    int len;
    wchar_t wc;
    while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0)
    {
        std::wcout << "次の " << len << " バイトは文字 " << wc << '\n';
        ptr += len;
    }
}
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 ナローマルチバイトエンコーディング
    const char* str = "z\u00df\u6c34\U0001d10b"; // または u8"zß水𝄋"
                      // または "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
    print_mb(str);
}

出力:

次の 1 バイトは文字 z
次の 2 バイトは文字 ß
次の 3 バイトは文字 水
次の 4 バイトは文字 𝄋

Compiler support
Freestanding and hosted
Language
Standard library
Standard library headers
Named requirements
Feature test macros (C++20)
Language support library
Concepts library (C++20)
Diagnostics library
Memory management library
Metaprogramming library (C++11)
General utilities library
Containers library
Iterators library
Ranges library (C++20)
Algorithms library
Strings library
Text processing library
Numerics library
Date and time library
Input/output library
Filesystem library (C++17)
Concurrency support library (C++11)
Execution control library (C++26)
Technical specifications
Symbols index
External libraries

pwc	-	結果のワイド文字が書き込まれる場所へのポインタ
s	-	入力として使用されるマルチバイト文字列へのポインタ
n	-	検査可能なsのバイト数の制限
ps	-	マルチバイト文字列の解釈時に使用される変換状態へのポインタ

mbtowc	次のマルチバイト文字をワイド文字に変換する (関数)
wcrtomb	ワイド文字をマルチバイト表現に変換する（状態を指定） (関数)
do_in [virtual]	`ExternT` から `InternT` への文字列変換（ファイルからの読み取り時など） ( `std::codecvt<InternT,ExternT,StateT>` の仮想保護メンバー関数)
Cドキュメント for mbrtowc

cppreference.net

Namespaces

Variants

std:: mbrtowc

目次

パラメータ

戻り値

例

関連項目