「EUC-JP」の版間の差分
削除された内容 追加された内容
m WP:D |
|||
(22人の利用者による、間の33版が非表示) | |||
1行目:
'''
EUC-JPはEUCの[[文字符号化方式|エンコード方式]]上に[[ASCII]]と[[JIS X 0208]]文字集合を配置したもので、[[半角カナ]] ([[JIS X 0201]]) とJIS補助漢字 ([[JIS X 0212]]) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。[[ISO/IEC 2022]]に適合する。
日本語文字は[[JIS X 0208]]を[[ISO/IEC_2022|GR領域]]に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに
[[JIS X 0213]]:2004に対応するEUCコードは[[EUC-JIS-2004]]
UNIX系OSの標準的な文字エンコードとして使用されてきた。かつて、[[Webサーバ]]にUNIX系OSが多く用いられていたことから日本語のウェブサイトではShift_JISと並んでEUC-JPが多く使われていたが、2006年頃から世界的に[[UTF-8]]が普及し始めている<ref>{{Cite web |title=Unicode over 60 percent of the web |url=https://googleblog.blogspot.com/2012/02/unicode-over-60-percent-of-web.html |website=Official Google Blog |access-date=2023-02-05 |language=en |date=2012-02-03 |last=Davis |first=Mark}}</ref>。全言語の主要なウェブサイトに占めるEUC-JPのシェアは、2010年から2019年にかけて0.7%から0.1%に低下している<ref>{{Cite web |title=Historical yearly trends in the usage statistics of character encodings for websites |url=https://w3techs.com/technologies/history_overview/character_encoding/ms/y |website=W3Techs |access-date=2023-02-05 |archive-url=https://archive.today/2021.06.08-122120/https://w3techs.com/technologies/history_overview/character_encoding/ms/y |archive-date=2021-06-08}}</ref>。
== 制定経緯 ==
1984年7月、当時UNIXのライセンスを販売していたAT&Tが東アジア・太平洋地域でライセンス事業を展開するため、子会社のAT&Tインターナショナル・ジャパンにUNIXシステム東京事務所(AT&Tユニックス・パシフィック)を設立。最初に日本で事業を展開するにあたり、UNIXの日本語化に向けて[[石田晴久]]を委員長に、[[日本電信電話公社]]、[[沖電気工業]]、[[東芝]]、[[日本電気]]、[[日立製作所]]、[[富士通]]、[[三菱電機]]といった当時のUNIXベンダーをメンバーとする日本語UNIXシステム諮問委員会を設置した。ここでUNIXで日本語を扱うための文字コードや機能について議論が行われ、その結果をもとに1985年4月30日付けで同委員会から報告書『UNIXシステム日本語機能の提案にあたって』がAT&T側へ提出された<ref>{{Cite journal|和書|author=AT&Tユニックス・パシフィック|year=1985|title=AT&Tおよび日本企業によるUNIXシステムV日本語機能の開発について|journal=情報科学|volume=21|issue=5|pages=46-62|publisher=情報科学研究所|ISSN=0368-3354}}</ref>。日本語EUCとしてのベースはこの報告書で概ね出来上がっていたが、AT&Tはこれを国際的に通用するよう、国際機能と各国語機能に分けて定義した。そして1986年2月に[[アナハイム]]で開催されたUNIXカンファレンス UniForum にて、各国語機能のサポート第1弾として Japanese Application Environment (JAE; 日本語アプリケーション・エンバイロメント) を発表。この中に文字コードの構造 (EUC) と日本語機能で使用される文字セットが定められた<ref>{{Cite journal|和書|author=門田|first=次郎|year=1986|title=日本市場におけるAT&TのUNIX戦略―これからのシステムV日本語機能の展開|journal=コンピュートピア|volume=20|issue=236|pages=72-75|publisher=コンピュータ・エージ社|ISSN=0010-4906}}</ref>。
1990年に[[JIS X 0212]]で補助漢字が制定されたことを受けて定義を拡張する必要が生じたため、1991年12月、[[Open Software Foundation]] (OSF) と[[UNIX International]] (UI)、UNIXシステムラボラトリーズ・パシフィック (USLP) はUNIX上の共通日本語文字コードとして'''日本語EUC'''を定義した<ref>{{Cite journal|和書|year=1992|title=UNIXの標準化2団体日本語EUC共通化|journal=標準化ジャーナル|volume=22|issue=3|page=90|publisher=日本規格協会|ISSN=0285-600X}}</ref>。
== EUC-JPの亜種 ==
EUC-JPには亜種が存在する。二種類を以下に解説する。
'''eucJP-ms'''は、[[オープン・グループ]]及び[[日本ベンダ協議会]]が策定した文字符号化方式。実装例は[[MySQL]] v5.
'''CP51932'''は[[
|-----
|-----
! 面&区番号
! 1バイト目
!
! 面&区番号
! 1バイト目
!
!
|-----
! JIS X 0208-1990<br />(ひらがな・カタカナ等)
| 1面1区 - 8区 || 0xA1 - 0xA8 || rowspan="4" | 0xA1 - 0xFE
| 1面1区 - 8区 || 0xA1 - 0xA8
| rowspan="3" | 0xA1 - 0xFE || rowspan="5" | ―
|-----
! NEC特殊文字
| 1面13区 || 0xAD || 1面13区 || 0xAD
|-----
! JIS X 0208-1990<br />(第一・第二水準漢字)
| 1面14区 - 84区 || 0xB0 - 0xF4 || 1面14区 - 84区 || 0xB0 - 0xF4
|-----
! NEC選定IBM拡張文字
| 1面89区 - 92区 || 0xF9 - 0xFC || ― || ― || ―
|-----
! ユーザ定義文字<br />(前半)
| rowspan="5" | ― || rowspan="5" | ― || rowspan="5" | ―
| 1面85区 - 94区 || 0xF5 - 0xFE || 0xA1 - 0xFE
|-----
! JIS X 0212-1990<br />(前半)
| 2面1区 - 11区 || rowspan="4" | 0x8F || 0xA1 - 0xAB
| rowspan="4" | 0xA1 - 0xFE
|-----
! JIS X 0212-1990<br />(後半)
| 2面16区 - 77区 || 0xB0 - 0xED
|-----
! IBM拡張文字<br />(JIS X 0212 以外)
| 2面83区 - 84区 || 0xF3 - 0xF4
|-----
! ユーザ定義文字<br />(後半)
| 2面85区 - 94区 || 0xF5 - 0xFE
|}
== 脚注 ==
{{Reflist}}
== 参考文献 ==
* {{Cite book|和書 |title=UNIX System V 日本語アプリケーション・エンバイロメント リリース 1.0 機能導入説明書 |publisher=AT&Tユニックス・パシフィック |year=1986}}
* {{Cite journal|和書|last=中原|first=康|year=1986|title=III. 日本語処理技術|url=https://doi.org/10.11526/ieejjournal1888.106.1198|journal=電氣學會雜誌|volume=106|issue=12|pages=1198-1202|ISSN=0020-2878}}
* 小野芳彦: UNIXの日本語化の実現方法, 情報処理, Vol.27, No.12 (1986年12月), pp.1393-1400.
* 中原康: 日本語EUCの定義と解説, Revision 1.7, UI-OSF-USLP共同技術資料 (1991年12月10日).
{{DEFAULTSORT:いいゆうしい-しえいひい}}
[[Category:日本語用の文字コード]]
[[de:Extended UNIX Coding#EUC-JP]]
109 ⟶ 87行目:
[[fr:Extended Unix Coding#EUC-JP]]
[[zh:EUC#EUC-JP]]
|