Open棟梁 wiki
目次 †
概要 †
システム内部で使用する文字コードとエンコーディングを明記する。
- .NET、Javaなどのプログラム中の文字列はUTF-16で扱われる。
- 外部には既定でUTF-8でエンコーディングされた後に出力される。
文字コード †
- 従来のVB6.0などの標準GUIコントロールはUnicodeに対応しておらずShift-JISでの入力が一般的であったが、
既にWWWブラウザやWindows Formsなど殆どのアプリケーションでUnicode対応がなされ、Unicodeでの入力が一般的になっている。
- このため、システムで利用可能なキャラクタセットは、Unicodeで利用可能なキャラクタセットとすることが一般的である。
- 例外的にShift-JISのWebサイトも存在するが、WWWブラウザがUnicodeにのみ存在する文字を数値参照に
自動変換するという動きが問題となることがあるため、こちらもUnicodeが一般的である。
- 例えば、「鱓」は、
- POST時にWWWブラウザにより数値文字列参照(鱓)に変換される。
- HTTPリクエスト エンティティ ボディでは「%26%2340415%3B」になる。
- APサーバ HTTPリクエスト Formコレクションでは再び数値文字列参照(鱓)になる。
エンコーディング †
文字コードが異なる「ファイル ⇔ システム」、「システム ⇔ システム」間では、エンコーディングが必要になる。
- エンコーディングにより文字化けが発生するかどうかを「文字セット、文字エンコーディングの可逆変換性チェック」部品でチェックできる。
- この機能は、エンコード ~ デコードの処理をすべて自システム内で実行する場合にのみ保障される。
キャラクタセット †