- 追加された行はこの色です。
- 削除された行はこの色です。
[[Open棟梁>https://github.com/OpenTouryoProject]] wiki
-[[戻る>アプリケーション設計のポイント]]
*目次 [#r10713d2]
#contents
*概要 [#f0cfe3d9]
システム内部で使用する文字コードとエンコーディングを明記する。
-.NET、Javaなどのプログラム中の文字列はUTF-16で扱われる。
-外部には既定でUTF-8でエンコーディングされた後に出力される。
**文字コード [#u3b4459c]
-従来のVB6.0などの標準GUIコントロールはUnicodeに対応しておらずShift-JISでの入力が一般的であったが、~
既にWWWブラウザやWindows Formsなど殆どのアプリケーションでUnicode対応がなされ、Unicodeでの入力が一般的になっている。
-このため、システムで利用可能なキャラクタセットは、Unicodeで利用可能なキャラクタセットとすることが一般的である。
-例外的にShift-JISのWebサイトも存在するが、WWWブラウザがUnicodeにのみ存在する文字を数値参照に~
自動変換するという動きが問題となることがあるため、こちらもUnicodeが一般的である。
-- 例えば、「鱓」は、
---POST時にWWWブラウザにより数値文字列参照(鱓)に変換される。
---HTTPリクエスト エンティティ ボディでは「%26%2340415%3B」になる。
---APサーバ HTTPリクエスト Formコレクションでは再び数値文字列参照(鱓)になる。
-JIS X 0212(1990)to Unicode補助漢字コード表~
http://charset.7jp.net/jis0212.html
--0x9C53 → 40019
*エンコーディング [#x304d6b2]
文字コードが異なる「ファイル ⇔ システム」、「システム ⇔ システム」間では、エンコーディングが必要になる。
-エンコーディングにより文字化けが発生するかどうかを「文字セット、文字エンコーディングの可逆変換性チェック」部品でチェックできる。~
-この機能は、エンコード ~ デコードの処理をすべて自システム内で実行する場合にのみ保障される。
*キャラクタセット [#e594bafb]