文字コード「ざっくり」研究
文字コード関連のプログラミングに役立ちそうな情報を集積していくページ。
1.書籍
この2冊と具体的な文字コード表とGoogle先生が居れば怖いものなし(?)。
- プログラマのための文字コード技術入門
- 文字コード「超」研究 改訂第2版
日本工業規格の規格書を購入するならば、書店か以下から。
- JSA 日本規格協会
JIS X 0201:1997やJIS X 0208:1997の規格書が買える。PDFのダウンロード購入も可能なよう(0208は冊子のみだった)。
2.ネット上の情報
正確な情報となると、このあたりでしょうか。
日本語 Windows の使用しているマイクロソフト標準キャラクタセットのう
ち、未使用の部分と外字部分を除いた文字コード表である。コードは左から、
区点番号、JIS コード、シフト JIS コード、日本語 EUC コード、Unicode
である。区点番号以外は16進表現である。
日本語文字コードとUnicodeとの対応表(テキスト形式)。URLが“OBSOLETE”なんだけど。。
- JIS X 0201 (1976) to Unicode 1.1 Table
- JIS X 0208 (1990) to Unicode
- JIS X 0212 (1990) to Unicode
- Shift-JIS to Unicode
ホームページから「JIS検索」→JIS企画番号からJISを検索にて「X0208」や「X0201」を入力して「一覧表示」を押下すると、以下を無料で参照できる。Google Chromeじゃ閲覧できないのが悔しい(Internet Explorer、Firefox限定の模様)。
- JISX0201:7ビット及び8ビットの情報交換用符号化文字集合
- JISX0208:7ビット及び8ビットの2バイト情報交換用符号化漢字集合
3.便利なツール
(TODO:「超」研究一押しのxyzzyとか、バイナリエディタとかかな?)
4.コード&データ
(TODO:書き散らしたコードとかPDF化した文字コード表とか公開したい)