文字コード、エンコーディング、キャラクタセット
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
「[[Open棟梁 wiki>https://opentouryo.osscons.jp]]」は、「...
-[[戻る>アプリケーション設計のポイント]]
*目次 [#r10713d2]
#contents
*概要 [#f0cfe3d9]
システム内部で使用する文字コードとエンコーディングを考慮...
-.NET、Javaなどのプログラム中の文字列はUTF-16で扱われる。
-外部には既定でUTF-8でエンコーディングされた後に出力され...
**考慮のための洗い出し例 [#fad9e510]
#ref(CharacterCodeAndEncoding.png,left,nowrap,文字コード...
*考え方 [#b95eae6a]
-入出力時のエンコーディングの問題は、Unicode → Unicodeで...
-データ転送時のエンコーディングは、クライアント、プロトコ...
-データ転送時に、エンコーディングが発生するのなら、転送後...
-Windowsの外字(機種依存文字)などは、他の環境でエンコー...
**文字コード [#u3b4459c]
-従来のVB6.0などの標準GUIコントロールはUnicodeに対応して...
既にWWWブラウザやWindows Formsなど殆どのアプリケーション...
-このため、システムで利用可能なキャラクタセットは、Unicod...
-例外的にShift-JISのWebサイトも存在するが、~
「[[WWWブラウザがUnicodeにのみ存在する文字を数値参照に自...
という動きが問題となることがあるため、こちらもUnicodeが一...
-JIS X 0212(1990)to Unicode補助漢字コード表~
http://charset.7jp.net/jis0212.html
--0x9C53 → 40019
**エンコーディング [#x304d6b2]
文字コードが異なる「ファイル ⇔ システム」、「システム ⇔ ...
-エンコーディングにより文字化けが発生するかどうかを「文字...
-この機能は、エンコード ~ デコードの処理をすべて自システ...
**キャラクタセット [#e594bafb]
-外字・機種依存文字を使用する際には注意する。通常、外部シ...
-また、Vista / 2008でサポートされたJIS2004がサポートされ...
-JIS X 0212(非漢字、補助漢字)、JIS X 0213(非漢字、第1...
*数値参照 [#c53f9fea]
-WWWブラウザがUnicodeにのみ存在する文字を数値参照に自動変...
-数値参照で、文字は「&#xxxx;」というフォーマットの文字列...
**WWWブラウザの自動変換 [#e6c8a6be]
HTMLの文字コード指定がShift-JISになっている場合、HTTPのPO...
この際、Shift-JISで表現できない文字は数値参照型 に変換さ...
-鱓 → 鱓(JIS90補正漢字)
-𪚲 → 𪚲(JIS2004の最後の文字)
現状の開発技術(Java、.NET)では、これらの文字の、数値文...
上記の「鱓」というデータが、数値文字参照のままの...
さらに、サーバ側のプログラムがXSS対策でサニタイジングHTML...
2重エンコードで「鱓」という値で出力され...
**例えば [#q8c091e5]
「鱓」は、
-POST時にWWWブラウザにより数値文字列参照(鱓)に...
-HTTPリクエスト エンティティ ボディでは「%26%2340415%3B」...
-APサーバ HTTPリクエスト Formコレクションでは再び数値文字...
*チェック [#g543725a]
**システム連携時、相互変換可能かをチェックする。 [#o73fb2...
システム連携時、相互変換が可能かどうか、”Open棟梁”に付属...
**JIS X 0208(非漢字、第1、第2水準漢字)以外をチェック...
相互変換が不可能な場合、”Open棟梁”に付属する「[[JIS X 020...
**JIS2004をチェックして除外する場合。 [#t1e0be98]
クライアント側でJIS2004表示が不可能な場合、”Open棟梁”に付...
**システム内部でJIS2004を扱う場合。 [#e1539419]
4バイト文字が存在するため、文字列操作を行う際は必要に応じ...
*参考 [#p614e81b]
-[[文字コード - マイクロソフト系技術情報 Wiki - 内部リン...
--[[JIS文字・漢字コード>http://techinfoofmicrosofttech.oss...
---[[JIS2004関連>http://techinfoofmicrosofttech.osscons.j...
--[[エンコーディング>http://techinfoofmicrosofttech.ossco...
--[[Windowsの外字>http://techinfoofmicrosofttech.osscons....
--[[文字のチェック方式>http://techinfoofmicrosofttech.oss...
--[[アプリケーションのUnicode化>http://techinfoofmicrosof...
終了行:
「[[Open棟梁 wiki>https://opentouryo.osscons.jp]]」は、「...
-[[戻る>アプリケーション設計のポイント]]
*目次 [#r10713d2]
#contents
*概要 [#f0cfe3d9]
システム内部で使用する文字コードとエンコーディングを考慮...
-.NET、Javaなどのプログラム中の文字列はUTF-16で扱われる。
-外部には既定でUTF-8でエンコーディングされた後に出力され...
**考慮のための洗い出し例 [#fad9e510]
#ref(CharacterCodeAndEncoding.png,left,nowrap,文字コード...
*考え方 [#b95eae6a]
-入出力時のエンコーディングの問題は、Unicode → Unicodeで...
-データ転送時のエンコーディングは、クライアント、プロトコ...
-データ転送時に、エンコーディングが発生するのなら、転送後...
-Windowsの外字(機種依存文字)などは、他の環境でエンコー...
**文字コード [#u3b4459c]
-従来のVB6.0などの標準GUIコントロールはUnicodeに対応して...
既にWWWブラウザやWindows Formsなど殆どのアプリケーション...
-このため、システムで利用可能なキャラクタセットは、Unicod...
-例外的にShift-JISのWebサイトも存在するが、~
「[[WWWブラウザがUnicodeにのみ存在する文字を数値参照に自...
という動きが問題となることがあるため、こちらもUnicodeが一...
-JIS X 0212(1990)to Unicode補助漢字コード表~
http://charset.7jp.net/jis0212.html
--0x9C53 → 40019
**エンコーディング [#x304d6b2]
文字コードが異なる「ファイル ⇔ システム」、「システム ⇔ ...
-エンコーディングにより文字化けが発生するかどうかを「文字...
-この機能は、エンコード ~ デコードの処理をすべて自システ...
**キャラクタセット [#e594bafb]
-外字・機種依存文字を使用する際には注意する。通常、外部シ...
-また、Vista / 2008でサポートされたJIS2004がサポートされ...
-JIS X 0212(非漢字、補助漢字)、JIS X 0213(非漢字、第1...
*数値参照 [#c53f9fea]
-WWWブラウザがUnicodeにのみ存在する文字を数値参照に自動変...
-数値参照で、文字は「&#xxxx;」というフォーマットの文字列...
**WWWブラウザの自動変換 [#e6c8a6be]
HTMLの文字コード指定がShift-JISになっている場合、HTTPのPO...
この際、Shift-JISで表現できない文字は数値参照型 に変換さ...
-鱓 → 鱓(JIS90補正漢字)
-𪚲 → 𪚲(JIS2004の最後の文字)
現状の開発技術(Java、.NET)では、これらの文字の、数値文...
上記の「鱓」というデータが、数値文字参照のままの...
さらに、サーバ側のプログラムがXSS対策でサニタイジングHTML...
2重エンコードで「鱓」という値で出力され...
**例えば [#q8c091e5]
「鱓」は、
-POST時にWWWブラウザにより数値文字列参照(鱓)に...
-HTTPリクエスト エンティティ ボディでは「%26%2340415%3B」...
-APサーバ HTTPリクエスト Formコレクションでは再び数値文字...
*チェック [#g543725a]
**システム連携時、相互変換可能かをチェックする。 [#o73fb2...
システム連携時、相互変換が可能かどうか、”Open棟梁”に付属...
**JIS X 0208(非漢字、第1、第2水準漢字)以外をチェック...
相互変換が不可能な場合、”Open棟梁”に付属する「[[JIS X 020...
**JIS2004をチェックして除外する場合。 [#t1e0be98]
クライアント側でJIS2004表示が不可能な場合、”Open棟梁”に付...
**システム内部でJIS2004を扱う場合。 [#e1539419]
4バイト文字が存在するため、文字列操作を行う際は必要に応じ...
*参考 [#p614e81b]
-[[文字コード - マイクロソフト系技術情報 Wiki - 内部リン...
--[[JIS文字・漢字コード>http://techinfoofmicrosofttech.oss...
---[[JIS2004関連>http://techinfoofmicrosofttech.osscons.j...
--[[エンコーディング>http://techinfoofmicrosofttech.ossco...
--[[Windowsの外字>http://techinfoofmicrosofttech.osscons....
--[[文字のチェック方式>http://techinfoofmicrosofttech.oss...
--[[アプリケーションのUnicode化>http://techinfoofmicrosof...
ページ名: