ミケネコ研究所 / 文字コードの部屋 / 文字セットの種類

文字セットの種類

いろいろありますねえ。


1. JIS X 0201

アルファベット、数字、記号、そして半角カナを収録します。ANK (Alhabet Numerals Katakana) と呼ぶこともあります。

C 6220-1969 情報交換用符号

JIS X 0201-1976 (JIS C 6220-1976)

ISO 646 の日本普及版です。前半 7bit は、ISO 646 に準拠した英数記号を収録し、後半 7bit は半角カタカナを収録しました。前半 7bit については、円記号「¥」とオーバーライン「 ̄」をのぞいて ASCII と同一です。

コードマップで見たときに、

0123 4567 89AB CDEF
0 制御
文字
アルファベット 制御
文字
カタカナ
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F

JIS ローマ字が左に、JIS カタカナが右に来るので、

X 0201 左側 ・・・・・ JIS X 0201 のローマ字のこと
X 0201 右側 ・・・・・ JIS X 0201 のカタカナのこと
のように、「X 0201 左側」「X 0201 右側」などと呼ぶことがあります。

「C 6220-1976」は、後に「JIS X 0201-1976」と名称だけ改められました。

JIS X 0201-1997

何が変わったの?


2. JIS X 0208

JIS X 0208-1978 (JIS C 6226-1978)

6802字。アルファベット、数字、ひらがなカタカナ、ギリシャ文字とキリル文字、これらの非漢字に加えて、JIS 第一水準、JIS 第二水準を収録します。

アルファベット、数字、カタカナの部分は、JIS X 201 と重複します。それで、

X 0201 ・・・・・ 半角文字
X 0208 ・・・・・ 全角文字
という呼ばれ方で区別がされました。

現在では「旧 JIS」と呼ばれます。1987年に「JIS C 6226-1978」から「JIS X 0208-1978」と名前が改められました。 NEC の PC-9801 シリーズは、かたくなに旧 JIS を使いつづけました。

JIS X 0208-1983 (JIS C 6226-1983)

6877字。

コードポイントの入れ替えは、各地で混乱を及ぼしました。あまりに多くの変更が加えられましたので、これを「新JIS」と呼び、JIS X 0208-1978 の「旧JIS」と区別しました。EPSON 社の NEC 互換機では、いち早く新 JIS を採用しました。

1987年に「JIS C 6226-1983」から「JIS X 0208-1983」と名前が改められました。

JIS X 0208-1990

6879字。

とくに大きな変更でもなく、「新JIS」と特に区別されません。

JIS X 0208:1997

6897字。文字自体に変更や追加はありませんが、過去の矛盾を清算しようとしました。

ユーザから見ればとくに大きな変更でもなく、「新JIS」と特に区別されません。


3. JIS X 0212

「JIS 補助漢字」です。

JIS X 0212-1990

6067字。

JIS X 208 では足りなかった漢字と、国際文書に対応できるように特殊アルファベットが追加されています。

Windows 98 以降のフォント「MSゴシック」「MS明朝」でサポートされ、Unicode 環境で利用できます。EUC で使用できます。


4. JIS X 0213

「JIS 第三水準」+ 「JIS 第四水準」

JIS X 0213:2000

X 0208の 6879字に、4344 文字を追加して合計 11223字を規定。JIS X 0212 (補助漢字) と重複する部分が多い。

5. JIS X 0221

「Unicode 1.1 (UCS-2)」

JIS X 0221-1995

ISO/IEC 10646-1:1993と同義。34168字。

Unicode 1.1 を基準としています。JIS X 0208、JIS X 0212 との相互変換テーブルが定められていますが、国際的な波から 2 年ほど遅れたために、相互変換のスタンダードとなっているのはむしろ Microsoft のテーブルであり、この規格は今では意味をなさず、混乱の元となります。


文字コードの部屋 http://mikeneko.creator.club.ne.jp/~lab/kcode/
お問い合わせ <lab@mikeneko.ne.jp>