Internet Explorer 不支持国标汉字集 GB18030
国标18030是一套支持所有统一码汉字的字符集。在制作龙榆生先生纪念网站时,我曾希望使用此字符集来编码网页文件。如果使用了该字符集,有如下优点:
- 此字符集与现行的 GBK 编码比较兼容。
- 可支持统一码中的七万多个汉字。
- 使用的字节数比 UTF-8、UTF-16 等统一码编码方式要少很多。
- 在编译成 CHM 文件时,可被全文检索(如使用 UTF-8 等统一码编码,在 CHM 编译器在制作全文索引时不被支持,无法做全文索引)。
然而,当做好网页之后,使用 Internet Explorer 浏览,发现一些汉字居然变成了乱码。如以下附件即是。
|
乱码如下所示:
经测试,如果在出现乱码的地方前面加奇数个字符,乱码就会消失。操作系统为 Windows 2003,IE 7、IE 8 都是如此。但也有测试发现,加奇数个字符后,又会在其他地方出现乱码。
关于此现象的讨论,见:
注:在测试上述网页时,应选择浏览器编码为“GB18030”。有时候浏览器选择的编码为“GB2312”,这时不会出现乱码。