No.17 文字コードの国際的な業界標準の一つで、世界中の様々な言語の文字を収録して通し番号を割り当て、同じコード体系のもとで使用できるようにしたもの。
世界の主な言語のほとんどの文字を収録しており、通貨記号や約物など文字と共に使われる記号や絵文字なども登録されている。
業界団体のユニコードコンソーシアム((***) Consortium)が策定・改訂しており、ほぼ同じものがISO/IEC 10646として国際標準となっている。
(***)では登録された文字のそれぞれについて「コードポイント」(code point:符号点、符号位置と訳される)と呼ばれる一意の通し番号を与えている。
例えば、日本語のカタカナの「ア」には12450番が割り当てられているが、説明文などではこれを16進数表記を用いて「U+30A2」のように表記する。
世界中のあらゆる言語の文字を収録するという目的のため、コードポイントは最長で21ビットの値(上限は1114111番、U+10FFFF)まで用意されている。
コード領域のうち、16ビット(2バイト)の値で表現できるU+0000からU+FFFFは「基本多言語面」(BMP:Basic Multilingual Plane)と呼ばれ、主要な言語の文字のほとんどをカバーしている。
当初の規格はBMPのみの予定だったが、追加収録を希望する文字のすべてを登録しきれないことが明らかになり、後からU+10000~U+10FFFFの拡張領域が追加された。
このうち、U+10000~U+1FFFFを「追加多言語面」(SMP:Supplementary Multilingual Plane/補助多言語面)と呼び、古代文字や絵文字などが収録されている。
世界の主な言語のほとんどの文字を収録しており、通貨記号や約物など文字と共に使われる記号や絵文字なども登録されている。
業界団体のユニコードコンソーシアム((***) Consortium)が策定・改訂しており、ほぼ同じものがISO/IEC 10646として国際標準となっている。
(***)では登録された文字のそれぞれについて「コードポイント」(code point:符号点、符号位置と訳される)と呼ばれる一意の通し番号を与えている。
例えば、日本語のカタカナの「ア」には12450番が割り当てられているが、説明文などではこれを16進数表記を用いて「U+30A2」のように表記する。
世界中のあらゆる言語の文字を収録するという目的のため、コードポイントは最長で21ビットの値(上限は1114111番、U+10FFFF)まで用意されている。
コード領域のうち、16ビット(2バイト)の値で表現できるU+0000からU+FFFFは「基本多言語面」(BMP:Basic Multilingual Plane)と呼ばれ、主要な言語の文字のほとんどをカバーしている。
当初の規格はBMPのみの予定だったが、追加収録を希望する文字のすべてを登録しきれないことが明らかになり、後からU+10000~U+10FFFFの拡張領域が追加された。
このうち、U+10000~U+1FFFFを「追加多言語面」(SMP:Supplementary Multilingual Plane/補助多言語面)と呼び、古代文字や絵文字などが収録されている。
⭕️
❌
💾
🖊 | ☑️ |
⭕️ | [[ AnswerCalc[0] ]] % | A | [[ AnswerCalc[1] ]] |
💾
✔️
[[ d.CommentTxt ]] |
< | > |
🥇 |