ダブルバイト文字を理解する
- 文字の大きさコンピュータの世界では、文字は数字の列で表されます。 この数字の列一つ一つを「ビット」と呼び、8個のビットが集まって「バイト」を形成します。 このバイトこそが、文字の大きさを示す単位となるのです。英数字や記号など、比較的単純な文字は1バイトで表現できます。 これらの文字は種類も少なく、 8ビット、つまり2の8乗である256通りで十分に表現可能です。 しかし、日本語で使われる漢字は数千種類にも及びます。 これらの文字を表現するには、1バイトの256通りでは到底足りません。そこで登場するのが2バイト文字、つまりダブルバイト文字です。 2バイトは16ビットなので、2の16乗である65,536通りものパターンを表現できます。 日本語の漢字のように複雑な文字でも、この2バイトを用いることで表現できるようになるのです。このように、コンピュータ上で文字を表示するには、その文字の複雑さに応じたバイト数が必要となります。 1バイトで表現できる文字を「半角文字」、2バイトで表現できる文字を「全角文字」と呼ぶこともあります。