C#.net中所用到的编码名称和对应的代码页(Encoding.GetEncoding)
|
admin
2024年1月20日 11:35
本文热度 521
|
GetEncoding 方法依赖于基础平台(操作系统)支持大部分代码页。但是,对于下列情况提供系统支持:默认编码,即在执行此方法的计算机的区域设置中指定的编码;Little-Endian Unicode (UTF-16LE);Big-Endian Unicode (UTF-16BE);Windows 操作系统 (windows-1252);UTF-7;UTF-8;ASCII 以及 GB18030(简体中文)。
指定下表中列出的其中一个名称以获取具有对应代码页的系统支持的编码。
代码页 | 名称 |
---|
1200 | “UTF-16LE”、“utf-16”、“ucs-2”、“unicode”或“ISO-10646-UCS-2” |
1201 | “UTF-16BE”或“unicodeFFFE” |
1252 | “windows-1252” |
65000 | “utf-7”、“csUnicode11UTF7”、“unicode-1-1-utf-7”、“unicode-2-0-utf-7”、“x-unicode-1-1-utf-7”或“x-unicode-2-0-utf-7” |
65001 | “utf-8”、“unicode-1-1-utf-8”、“unicode-2-0-utf-8”、“x-unicode-1-1-utf-8”或“x-unicode-2-0-utf-8” |
20127 | “us-ascii”、“us”、“ascii”、“ANSI_X3.4-1968”、“ANSI_X3.4-1986”、“cp367”、“csASCII”、“IBM367”、“iso-ir-6”、“ISO646-US”或“ISO_646.irv:1991” |
54936 | “GB18030” |
某些平台可能不支持特定的代码页。例如,Windows 98 的美国版本可能不支持日语 Shift-jis 代码页(代码页 932)。这种情况下,GetEncoding 方法将在执行下面的 C# 代码时引发 NotSupportedException:
Encoding enc = Encoding.GetEncoding("shift-jis");
-------------------------------------------------------------------------------------------------------------------------------
全部代码页/编码名称对照表:
代码页(codepage)
名称(name)
显示名称
37
IBM037
IBM EBCDIC(美国 - 加拿大)
437
IBM437
OEM 美国
500
IBM500
IBM EBCDIC(国际)
708
ASMO-708
阿拉伯字符 (ASMO 708)
720
DOS-720
阿拉伯字符 (DOS)
737
ibm737
希腊字符 (DOS)
775
ibm775
波罗的海字符 (DOS)
850
ibm850
西欧字符 (DOS)
852
ibm852
中欧字符 (DOS)
855
IBM855
OEM 西里尔语
857
ibm857
土耳其字符 (DOS)
858
IBM00858
OEM 多语言拉丁语 I
860
IBM860
葡萄牙语 (DOS)
861
ibm861
冰岛语 (DOS)
862
DOS-862
希伯来字符 (DOS)
863
IBM863
加拿******************语 (DOS)
864
IBM864
阿拉伯字符 (864)
865
IBM865
北欧字符 (DOS)
866
cp866
西里尔字符 (DOS)
869
ibm869
现代希腊字符 (DOS)
870
IBM870
IBM EBCDIC(多语言拉丁语 2)
874
windows-874
泰语 (Windows)
875
cp875
IBM EBCDIC(现代希腊语)
932
shift_jis
日语 (Shift-JIS)
936
gb2312
简体中文 (GB2312)
*
949
ks_c_5601-1987
朝鲜语
950
big5
繁体中文 (Big5)
1026
IBM1026
IBM EBCDIC(土耳其拉丁语 5)
1047
IBM01047
IBM 拉丁语 1
1140
IBM01140
IBM EBCDIC(美国 - 加拿大 - 欧洲)
1141
IBM01141
IBM EBCDIC(德国 - 欧洲)
1142
IBM01142
IBM EBCDIC(丹麦 - 挪威 - 欧洲)
1143
IBM01143
IBM EBCDIC(芬兰 - 瑞典 - 欧洲)
1144
IBM01144
IBM EBCDIC(意大利 - 欧洲)
1145
IBM01145
IBM EBCDIC(西班牙 - 欧洲)
1146
IBM01146
IBM EBCDIC(英国 - 欧洲)
1147
IBM01147
IBM EBCDIC(法国 - 欧洲)
1148
IBM01148
IBM EBCDIC(国际 - 欧洲)
1149
IBM01149
IBM EBCDIC(冰岛语 - 欧洲)
1200
utf-16
Unicode
*
1201
UnicodeFFFE
Unicode (Big-Endian)
*
1250
windows-1250
中欧字符 (Windows)
1251
windows-1251
西里尔字符 (Windows)
1252
Windows-1252
西欧字符 (Windows)
*
1253
windows-1253
希腊字符 (Windows)
1254
windows-1254
土耳其字符 (Windows)
1255
windows-1255
希伯来字符 (Windows)
1256
windows-1256
阿拉伯字符 (Windows)
1257
windows-1257
波罗的海字符 (Windows)
1258
windows-1258
越南字符 (Windows)
1361
Johab
朝鲜语 (Johab)
10000
macintosh
西欧字符 (Mac)
10001
x-mac-japanese
日语 (Mac)
10002
x-mac-chinesetrad
繁体中文 (Mac)
10003
x-mac-korean
朝鲜语 (Mac)
*
10004
x-mac-arabic
阿拉伯字符 (Mac)
10005
x-mac-hebrew
希伯来字符 (Mac)
10006
x-mac-greek
希腊字符 (Mac)
10007
x-mac-cyrillic
西里尔字符 (Mac)
10008
x-mac-chinesesimp
简体中文 (Mac)
*
10010
x-mac-romanian
罗马尼亚语 (Mac)
10017
x-mac-ukrainian
乌克兰语 (Mac)
10021
x-mac-thai
泰语 (Mac)
10029
x-mac-ce
中欧字符 (Mac)
10079
x-mac-icelandic
冰岛语 (Mac)
10081
x-mac-turkish
土耳其字符 (Mac)
10082
x-mac-croatian
克罗地亚语 (Mac)
20000
x-Chinese-CNS
繁体中文 (CNS)
20001
x-cp20001
TCA 台湾
20002
x-Chinese-Eten
繁体中文 (Eten)
20003
x-cp20003
IBM5550 台湾
20004
x-cp20004
TeleText 台湾
20005
x-cp20005
Wang 台湾
20105
x-IA5
西欧字符 (IA5)
20106
x-IA5-German
德语 (IA5)
20107
x-IA5-Swedish
瑞典语 (IA5)
20108
x-IA5-Norwegian
挪威语 (IA5)
20127
us-ascii
US-ASCII
*
20261
x-cp20261
T.61
20269
x-cp20269
ISO-6937
20273
IBM273
IBM EBCDIC(德国)
20277
IBM277
IBM EBCDIC(丹麦 - 挪威)
20278
IBM278
IBM EBCDIC(芬兰 - 瑞典)
20280
IBM280
IBM EBCDIC(意大利)
20284
IBM284
IBM EBCDIC(西班牙)
20285
IBM285
IBM EBCDIC(英国)
20290
IBM290
IBM EBCDIC(日语片假名)
20297
IBM297
IBM EBCDIC(法国)
20420
IBM420
IBM EBCDIC(阿拉伯语)
20423
IBM423
IBM EBCDIC(希腊语)
20424
IBM424
IBM EBCDIC(希伯来语)
20833
x-EBCDIC-KoreanExtended
IBM EBCDIC(朝鲜语扩展)
20838
IBM-Thai
IBM EBCDIC(泰语)
20866
koi8-r
西里尔字符 (KOI8-R)
20871
IBM871
IBM EBCDIC(冰岛语)
20880
IBM880
IBM EBCDIC(西里尔俄语)
20905
IBM905
IBM EBCDIC(土耳其语)
20924
IBM00924
IBM 拉丁语 1
20932
EUC-JP
日语(JIS 0208-1990 和 0212-1990)
20936
x-cp20936
简体中文 (GB2312-80)
*
20949
x-cp20949
朝鲜语 Wansung
*
21025
cp1025
IBM EBCDIC(西里尔塞尔维亚 - 保加利亚语)
21866
koi8-u
西里尔字符 (KOI8-U)
28591
iso-8859-1
西欧字符 (ISO)
*
28592
iso-8859-2
中欧字符 (ISO)
28593
iso-8859-3
拉丁语 3 (ISO)
28594
iso-8859-4
波罗的海字符 (ISO)
28595
iso-8859-5
西里尔字符 (ISO)
28596
iso-8859-6
阿拉伯字符 (ISO)
28597
iso-8859-7
希腊字符 (ISO)
28598
iso-8859-8
希伯来字符 (ISO-Visual)
*
28599
iso-8859-9
土耳其字符 (ISO)
28603
iso-8859-13
爱沙尼亚语 (ISO)
28605
iso-8859-15
拉丁语 9 (ISO)
29001
x-Europa
欧罗巴
38598
iso-8859-8-i
希伯来字符 (ISO-Logical)
*
50220
iso-2022-jp
日语 (JIS)
*
50221
csISO2022JP
日语(JIS- 允许 1 字节假名)
*
50222
iso-2022-jp
日语(JIS- 允许 1 字节假名 - SO/SI)
*
50225
iso-2022-kr
朝鲜语 (ISO)
*
50227
x-cp50227
简体中文 (ISO-2022)
*
51932
euc-jp
日语 (EUC)
*
51936
EUC-CN
简体中文 (EUC)
*
51949
euc-kr
朝鲜语 (EUC)
*
52936
hz-gb-2312
简体中文 (HZ)
*
54936
GB18030
简体中文 (GB18030)
*
57002
x-iscii-de
ISCII 梵文
*
57003
x-iscii-be
ISCII 孟加拉语
*
57004
x-iscii-ta
ISCII 泰米尔语
*
57005
x-iscii-te
ISCII 泰卢固语
*
57006
x-iscii-as
ISCII 阿萨姆语
*
57007
x-iscii-or
ISCII 奥里雅语
*
57008
x-iscii-ka
ISCII 卡纳达语
*
57009
x-iscii-ma
ISCII 马拉雅拉姆语
*
57010
x-iscii-gu
ISCII 古吉拉特语
*
57011
x-iscii-pa
ISCII 旁遮普语
*
65000
utf-7
Unicode (UTF-7)
*
65001
utf-8
Unicode (UTF-8)
*
65005
utf-32
Unicode (UTF-32)
*
65006
utf-32BE
Unicode (UTF-32 Big-Endian)
该文章在 2024/1/22 2:12:41 编辑过