【ASCIIコード (アスキー : American Standard Code for Infomation Interchange)】
英数字の最も標準的な文字コード体系。
63年にANSI(米国規格協会)が制定した。
コンピューターでは文字にコードを割り当てて利用しており、文字や記号、制御符号などが
一致していないとコンピューター間で正しくデータを伝送できない。
ASCIIコードはこうした情報交換に利用するため規定された。
1文字を7ビットのコードで表す。例えば「A」は7ビットの2進数で1000001
「W」は1010111となる。
英語用の規格のため、ひらがなやカタカナは割り当てられていない。
ASCIIコードにカタカナ用のコードを加えたものがJISコードである。
【シフトJISコード】
JIS8単位コードの未定義部分に漢字コードの上位8ビットを割り当てたもの。
よって、1バイト目をチェックすることで、英数カナ(1バイト系文字)コードと混在しても
漢字か否かの区別ができる。
【Unicode】
すべての文字を2バイトで表し、世界の文字を1つのコードで統一しようとするもの。
Apple社、IBM社、Microsoft社などが提唱する各国語に対応するために制定された2バイトの
コード体系。
1993年にISOで定められ、1995年にはJIS X 0221として定められている。
今までの文字コードは欧文の1バイト系コードを拡張したものであったため、日本語などの
2バイト系コードを処理する場合に特殊な操作が必要である。
そのため、海外で開発されたソフトで日本語がうまく動かないなどいろいろな問題があった。
Unicodeによりこれらの問題が解消し、欧文も日本語も同じように扱えるようになると
期待されている。
現在はJavaの標準文字コードやWindowsNTの内部文字コードとして採用されている。
【EUCコード (Extended Unix Code)】
拡張UNIXコードの略。
漢字コードはJIS規格にほぼ準拠する。
UNIXで使われている文字コード。
ISO 2022-1993で定義されている。
漢字2Byte、1Byte文字がある(AT&Tが定める)
【EBCDICコード】
IBMの汎用機で使用されているコード。
1文字を8ビットのコードで表す。
【BCDコード】
BCDコード(2進化10進符号)とは、10進数の各桁を4ビットの2進数で表した物をいう。
例)
BCDコードの”100100010101”は、10進数で幾らか。
解説)
BCDコードでは4桁で2進数を表現するので、
”100100010101”を4桁ごとに区切ると、以下のとおり。
1001 0001 0101 <2進数
↓ ↓ ↓
9 1 5 <10進数
よって、915