std:: mbrtowc
|
ヘッダーで定義
<cwchar>
|
||
|
std::
size_t
mbrtowc
(
wchar_t
*
pwc,
const
char
*
s,
|
||
ナローマルチバイト文字をワイド文字に変換します。
s が null ポインタでない場合、 s が指すバイトから始まるマルチバイト文字列の最大 n バイトを検査し、次のマルチバイト文字(シフトシーケンスを含む)を完了するために必要なバイト数を決定します。関数が s 内の次のマルチバイト文字が完全かつ有効であると判断した場合、それを対応するワイド文字に変換し、 * pwc に格納します( pwc が null でない場合)。
s が null ポインタの場合、 n および pwc の値は無視され、この呼び出しは std :: mbrtowc ( nullptr, "" , 1 , ps ) と等価になります。
生成されたワイド文字がナル文字の場合、 * ps に格納された変換状態は初期シフト状態となります。
目次 |
パラメータ
| pwc | - | 結果のワイド文字が書き込まれる場所へのポインタ |
| s | - | 入力として使用されるマルチバイト文字列へのポインタ |
| n | - | 検査可能なsのバイト数の制限 |
| ps | - | マルチバイト文字列の解釈時に使用される変換状態へのポインタ |
戻り値
以下のうち最初に該当するもの:
- 0 sから変換された文字(nullでない場合はpwcに格納される)がナル文字であった場合。
- sから正常に変換されたマルチバイト文字のバイト数 [ 1 ... n ] 。
- static_cast < std:: size_t > ( - 2 ) 次の n バイトが不完全ではあるが、これまで有効なマルチバイト文字を構成している場合。 * pwc には何も書き込まれない。
- static_cast < std:: size_t > ( - 1 ) エンコーディングエラーが発生した場合。 * pwc には何も書き込まれず、値 EILSEQ が errno に格納され、 * ps の値は未指定となる。
例
#include <clocale> #include <cstring> #include <cwchar> #include <iostream> void print_mb(const char* ptr) { std::mbstate_t state = std::mbstate_t(); // 初期状態 const char* end = ptr + std::strlen(ptr); int len; wchar_t wc; while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0) { std::wcout << "次の " << len << " バイトは文字 " << wc << '\n'; ptr += len; } } int main() { std::setlocale(LC_ALL, "en_US.utf8"); // UTF-8 ナローマルチバイトエンコーディング const char* str = "z\u00df\u6c34\U0001d10b"; // または u8"zß水𝄋" // または "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b"; print_mb(str); }
出力:
次の 1 バイトは文字 z 次の 2 バイトは文字 ß 次の 3 バイトは文字 水 次の 4 バイトは文字 𝄋
関連項目
|
次のマルチバイト文字をワイド文字に変換する
(関数) |
|
|
ワイド文字をマルチバイト表現に変換する(状態を指定)
(関数) |
|
|
[virtual]
|
ExternT
から
InternT
への文字列変換(ファイルからの読み取り時など)
(
std::codecvt<InternT,ExternT,StateT>
の仮想保護メンバー関数)
|
|
Cドキュメント
for
mbrtowc
|
|