削除された内容 追加された内容
編集の要約なし
m cleanup
1行目:
'''日本語EUC''' ('''EUC-JP''') は[[UNIX]]上で[[日本語]]の文字を扱う場合にもっとも多く利用されている[[文字コード]]([[文字符号化方式|符号化方式]])のひとつで、UNIX以外の[[オペレーティングシステム|OS]]上で使われることもある
 
[[1980年代]]前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについての議論が行われ、議論の結果をもとに[[1985年]][[4月]]に同委員会から報告書が[[AT&T]]に出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、''[[Extended Unix Code|EUC]]''(Extended UNIX Codeの略である。)として日本語に限らず[[多言語]]に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。
UNIX上でも[[Shift_JIS]]などの他の文字コードで日本語を表すこともあれば、UNIX以外の[[オペレーティングシステム|OS]]上でも使われることもある。
 
EUCの[[文字符号化方式|エンコード方式]]上に[[American Standard Code for Information Interchange|ASCII]]と[[JIS X 0208]]文字集合を配置したもので、[[半角カナ]]([[JIS X 0201]])とJIS補助漢字([[JIS X 0212]])も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。[[ISO/IEC 2022]]に適合する。
[[1980年代]]前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについての議論が行われ、議論の結果をもとに[[1985年]][[4月]]に同委員会から報告書が[[AT&T]]に出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、''[[EUC]]''(Extended UNIX Codeの略である。)として日本語に限らず[[多言語]]に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。
 
日本語文字は[[JIS X 0208]]を[[GR]]領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80~0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、[[プログラム (コンピュータ)|プログラム]]上での扱いが楽である。
EUCの[[エンコード]]方式上に[[American Standard Code for Information Interchange|ASCII]]と[[JIS X 0208]]文字集合を配置したもの。
[[半角カナ]]([[JIS X 0201]])とJIS補助漢字([[JIS X 0212]])も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。
[[ISO/IEC 2022]]に適合する。
 
日本語文字は[[JIS X 0208]]を[[GR]]領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80~0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、[[プログラム (コンピュータ)|プログラム]]上での扱いが楽である。
ただし、補助漢字は制御文字SS3 (シングルシフトスリー、0x8F) に続けて現れるので、都合3バイトを要する。
 
21 ⟶ 17行目:
'''CP51932'''は[[Microsoft]]が策定した[[Windows-31J]]のEUC-JP互換表現。実装例は[[Internet Explorer]]4.0~、[[秀丸エディタ]]等。このコードは[[NEC]]の[[PC-9801]]の漢字コード(9~12区の特殊文字を除外したもの)を[[GR]]表現したような体裁を持つ。ただし、PC-9801の漢字コードは[[JIS C 6226-1978]]をベースにするのに対して、CP51932は[[JIS X 0208-1990]]をベースとする点が異なる。
 
<table class="wikitable">
<table border=1 cellpadding=1 cellspacing=0 width=854>
<tr>
<tdth rowspan="2"> &nbsp;</tdth>
<tdth colspan="3">CP51932</tdth>
<tdth colspan="4">eucJP-ms</tdth>
</tr>
<tr>
<tdth>面&区番号</tdth>
<tdth>1バイト目</tdth>
<tdth>2バイト目</tdth>
<tdth>面&区番号</tdth>
<tdth>1バイト目</tdth>
<tdth>2バイト目</tdth>
<tdth>3バイト目</tdth>
</tr>
<tr>
<tdth>JIS X 0208-1990<br />(第一水準漢字)</tdth>
<td>1面1区~8区<br/td>
</td>
<td>0xA1~0xA8</td>
<td rowspan="4">0xA1~0xFE</td>
<td>1面1区~8区<br/td>
</td>
<td>0xA1~0xA8</td>
<td rowspan="3">0xA1~0xFE</td>
49 ⟶ 43行目:
</tr>
<tr>
<tdth>NEC特殊文字</tdth>
<td>1面13区</td>
<td>0xAD</td>
56 ⟶ 50行目:
</tr>
<tr>
<tdth>JIS X 0208-1990<br />(第二水準漢字)</tdth>
<td>1面14区~84区</td>
<td>0xB0~0xF4</td>
63 ⟶ 57行目:
</tr>
<tr>
<tdth>NEC選定IBM拡張文字</tdth>
<td>1面89区~92区</td>
<td>0xF9~0xFC</td>
 
<td>―</td>
<td>―</td>
72 ⟶ 65行目:
</tr>
<tr>
<tdth>ユーザ定義文字<br />(前半)</tdth>
<td rowspan="5">―</td>
<td rowspan="5">―</td>
81 ⟶ 74行目:
</tr>
<tr>
<tdth>JIS X 0212-1990<br />(前半)</tdth>
<td>2面1区~11区<br/td>
</td>
<td rowspan="4">0x8F</td>
<td>0xA1~0xAB<br/td>
</td>
<td rowspan="4">0xA1~0xFE</td>
</tr>
<tr>
<tdth>JIS X 0212-1990<br />(後半)</tdth>
<td>2面14区~77区</td>
<td>0xB0~0xED</td>
</tr>
<tr>
<tdth>IBM拡張文字<br />(JIS X 0212 以外)</tdth>
<td>2面83区~84区</td>
<td>0xF3~0xF4</td>
</tr>
<tr>
<tdth>ユーザ定義文字<br />(後半)</tdth>
<td>2面85区~94区</td>
<td>0xF5~0xFE</td>