Unicode
ユニコード
Unicode
Unicodeとは
Unicodeとは、多言語を扱える文字コードの一種です。
コンピュータが文字を識別する場合、それぞれの文字をある数値として認識します。日本語にひらがな、カタカナ、漢字などがあるように各国で様々な文字が存在しますが、それらの文字に固有の番号を割り振ったものが文字コードです。
文字コードは言葉によって様々な種類のものがあります。そのため、多くの言語に対応したプログラムを作ろうと思えば、文字コードの種類だけプログラムを作成しなければなりませんし、それぞれの特性なども理解する必要がありました。
Unicodeは、この手間・不便さを解消する、多くの主要言語に対応した文字コードとして、IBM、Apple、マイクロソフト、オラクルなどの企業が加盟しているUnicodeコンソーシアムが中心となって提唱され、1993年にはISO/IEC 10646として標準化されました。XML、Javaなどに採用されています。
特徴としては、すべての文字を2バイト以上で表現すること、言語以外にもプラットフォームやプログラムにも依存しないこと、などが挙げられます。