关于 JSP 字符编码
另请参见
字符编码将 映射到特定宽度的单元上,并定义字节序列化和排序规则。很多字符集具有多种编码。例如,Java 程序可以使用 EUC-JP 或 Shift-JIS 等编码来表示日文字符集。每种编码都有用于表示和序列化字符集的规则。下面是两种比较常用的字符编码:
- ISO 8859 系列。此系列定义了 13 种字符编码,可以使用多种语言来表示文本。每种 ISO 8859 字符编码最多可包含 256 个字符。ISO 8859-1 (Latin-1) 由 ASCII 字符集、带有附加符号(重音、分音、变音和抑扬符号等)的字符以及其他符号组成。
- UTF-8(Unicode 变换格式,8 位形式)。这是宽度可变的字符编码,它将 16 位 Unicode 字符编码为 1 到 4 个字节。UTF-8 中的字节相当于 7 位 ASCII(如果其高序位为零);否则,字符由可变数量的字节组成。UTF-8 与大多数现有 Web 内容兼容,并且提供对 Unicode 字符集的访问。当前版本的浏览器和电子邮件客户端都支持 UTF-8。此外,很多新的 Web 标准也将 UTF-8 指定为字符编码。例如,UTF-8 是 XML 文档所需的两种编码之一(另一种编码是 UTF-16)。
要生成国际化的 Web 应用程序,您需要对以下内容进行编码:
- 请求字符编码。解释传入请求中的参数所使用的字符编码。此编码将参数转换为字符串对象。有关详细信息,请单击此处。
- 页面字符编码。编写 JSP 文件所使用的字符编码。除非正确设置了页面字符编码,否则,读取页面的 JSP 解析器、Web 容器或 Web 服务器在对字符进行某种操作(例如,将 JSP 文件转换为 Servlet)之前,将无法识别这些字符。仅当尚未单独设置响应字符编码时,才能使用页面字符编码来呈现 JSP 文件。有关详细信息,请单击此处。
- 响应字符编码。Web 组件生成的文本响应所使用的字符编码。此编码可用于控制页面在发送到浏览器时使用的编码。Web 页编码必须正确设置,才能确保字符在给定的语言环境正确呈现。有关详细信息,请单击此处。
目前所有 Web 浏览器均能识别 UTF-8,因此选择它作为响应编码是安全的。在 IDE 中,它在页面级别上也是一种很好的编码。这是为什么 UTF-8 是 IDE 中创建的 JSP 文件的缺省页面字符编码和缺省响应字符编码。
- 另请参见
|
|
法律声明