JSP 文字エンコーディングについて
関連項目
文字エンコーディングは、を特定の文字コードにマッピングし、シリアライズと順序の規則を定義するものです。多くの文字セットには、複数のエンコーディングがあります。たとえば、Java プログラムは日本語文字セットを、EUC-JP、Shift-JIS などのエンコーディングで表現できます。エンコーディングごとに、文字セットを表現およびシリアライズするための規則があります。特に一般的な 2 種類の文字エンコーディングについて説明します。
- ISO 8859 シリーズ。このシリーズは、数十の言語を表現できる 13 の文字エンコーディングを定義します。各 ISO-8859 文字エンコーディングに、最大 256 文字が含まれます。ISO 8859-1 (Latin-1) は、ASCII 文字セット、区別的発音符 (アクセント、分節記号、セディーユ、曲折アクセントなど) 付き文字、および追加記号で構成されます。
- UTF-8 (Unicode Transformation Format, 8-bit form)。可変幅文字のエンコーディングで、16 ビット Unicode 文字を 1 〜 4 バイトに符号化します。上位ビットがゼロの場合、UTF-8 の 1 バイトは 7 ビット ASCII と等価です。上位ビットがゼロでない場合、この文字はさまざまなバイト数で構成されます。UTF-8 は既存の Web コンテンツの多くと互換性があり、Unicode 文字セットへのアクセスを提供します。ブラウザおよび電子メールクライアントの現在のバージョンは UTF-8 をサポートしています。また、多くの新しい Web 標準は、文字エンコーディングとして UTF-8 を指定しています。たとえば、UTF-8 は、XML ドキュメントの 2 つの必須エンコーディングの 1 つです (もう 1 つは UTF-16 です)。
国際化 Web アプリケーションを作成する場合は、次を符号化する必要があります。
- 要求文字エンコーディング。着信要求のパラメータを変換するための文字エンコーディング。このエンコーディングによって、パラメータが文字列オブジェクトに変換されます。詳細については、ここをクリックしてください。
- ページ文字エンコーディング。JSP ファイルを作成するための文字エンコーディング。ページ文字エンコーディングが正しく設定されていない場合、ページを読み取る JSP パーサー、Web コンテナ、または Web サーバーが文字を認識できず、JSP ファイルをサーブレットに変換するなどの処理を実行できません。応答文字エンコーディングが個別に設定されていない場合にのみ、ページ文字エンコーディングが JSP ファイルの表示に使用されます。詳細については、ここをクリックしてください。
- 応答文字エンコーディング。Web コンポーネントが生成するテキスト応答の文字エンコーディング。これによって、ブラウザに送信するときに使用するページのエンコーディングを制御できます。指定されたロケールで正しく文字が表示されるように、Web ページエンコーディングを正しく設定する必要があります。詳細については、ここをクリックしてください。
UTF-8 は、最近のすべての Web ブラウザで認識されるため、応答に使用できる安全なエンコーディングです。IDE でのページレベルのエンコーディングにも適しています。そのため、UTF-8 がデフォルトのページ文字エンコーディングで、IDE で作成される JSP ファイルのデフォルトの応答文字エンコーディングにもなっています。
- 関連項目
|
|
著作権と商標について