Emacs для начинающих

       

Codeeqv


Cyrillic Codepages Crosstable 1

Сводная таблица символов

в популярных кириллических кодировках

Символ

DOS

KOI

WIN



MAC

ISO

Unicode

Unicode 2.0 Name

Русские буквы

А

80

E1

C0

80

B0

U+0410

Capital Letter A

Б

81

E2

C1

81

B1

U+0411

Capital Letter Be

В

82

F7

C2

82

B2

U+0412

Capital Letter Ve

Г

83

E7

C3

83

B3

U+0413

Capital Letter Ghe

Д

84

E4

C4

84

B4

U+0414

Capital Letter De

Е

85

E5

C5

85

B5

U+0415

Capital Letter Ie

Ж

86

F6

C6

86

B6

U+0416

Capital Letter Zhe

З

87

FA

C7

87

B7

U+0417

Capital Letter Ze

И

88

E9

C8

88

B8

U+0418

Capital Letter I

Й

89

EA

C9

89

B9

U+0419

Capital Letter Short I

К

8A

EB

CA

8A

BA

U+041A

Capital Letter Ka

Л

8B

EC

CB

8B

BB

U+041B

Capital Letter El

М

8C

ED

CC

8C

BC

U+041C

Capital Letter Em

Н

8D

EE

CD

8D

BD

U+041D

Capital Letter En

О

8E

EF

CE

8E

BE

U+041E

Capital Letter O

П

8F

F0

CF

8F

BF

U+041F

Capital Letter Pe

Р

90

F2

D0

90

C0

U+0420

Capital Letter Er

С

91

F3

D1

91

C1

U+0421

Capital Letter Es

Т

92

F4

D2

92

C2

U+0422

Capital Letter Te

У

93

F5

D3

93

C3

U+0423

Capital Letter U

Ф

94

E6

D4

94

C4

U+0424

Capital Letter Ef

Х

95

E8

D5

95

C5

U+0425

Capital Letter Ha

Ц

96

E3

D6

96

C6

U+0426

Capital Letter Tse

Ч

97

FE

D7

97

C7

U+0427

Capital Letter Che

Ш

98

FB

D8

98

C8

U+0428

Capital Letter Sha

Щ

99

FD

D9

99

C9

U+0429

Capital Letter Shcha

Ъ

9A

FF

DA

9A

CA

U+042A

Capital Letter Hard Sign

Ы

9B

F9

DB

9B

CB

U+042B

Capital Letter Yeru

Ь

9C

F8

DC

9C

CC

U+042C

Capital Letter Soft Sign

Э

9D

FC

DD

9D

CD

U+042D

Capital Letter E

Ю

9E

E0

DE

9E

CE

U+042E

Capital Letter Yu

Я

9F

F1

DF

9F

CF

U+042F

Capital Letter Ya

а

A0

C1

E0

E0

D0

U+0430

Small Letter A

б

A1

E2

E1

E1

D1

U+0431

Small Letter Be

в

A2

F7

E2

E2

D2

U+0432

Small Letter Ve

г

A3

E7

E3

E3

D3

U+0433

Small Letter Ghe

д

A4

E4

E4

E4

D4

U+0434

Small Letter De

е

A5

E5

E5

E5

D5

U+0435

Small Letter Ie

ж

A6

F6

E6

E6

D6

U+0436

Small Letter Zhe

з

A7

FA

E7

E7

D7

U+0437

Small Letter Ze

и

A8

E9

E8

E8

D8

U+0438

Small Letter I

й

A9

EA

E9

E9

D9

U+0439

Small Letter Short I

к

AA

EB

EA

EA

DA

U+043A

Small Letter Ka

л

AB

EC

EB

EB

DB

U+043B

Small Letter El

м

AC

ED

EC

EC

DC

U+043C

Small Letter Em

н

AD

EE

ED

ED

DD

U+043D

Small Letter En

о

AE

EF

EE

EE

DE

U+043E

Small Letter O

п

AF

F0

EF

EF

DF

U+043F

Small Letter Pe

р

E0

F2

F0

F0

E0

U+0440

Small Letter Er

с

E1

F3

F1

F1

E1

U+0441

Small Letter Es

т

E2

F4

F2

F2

E2

U+0442

Small Letter Te

у

E3

F5

F3

F3

E3

U+0443

Small Letter U

ф

E4

E6

F4

F4

E4

U+0444

Small Letter Ef

х

E5

E8

F5

F5

E5

U+0445

Small Letter Ha

ц

E6

E3

F6

F6

E6

U+0446

Small Letter Tse

ч

E7

FE

F7

F7

E7

U+0447

Small Letter Che

ш

E8

FB

F8

F8

E8

U+0448

Small Letter Sha

щ

E9

FD

F9

F9

E9

U+0449

Small Letter Shcha

ъ

EA

FF

FA

FA

EA

U+044A

Small Letter Hard Sign

ы

EB

F9

FB

FB

EB

U+044B

Small Letter Yeru

ь

EC

F8

FC

FC

EC

U+044C

Small Letter Soft Sign

э

ED

FC

FD

FD

ED

U+044D

Small Letter E

ю

EE

E0

FE

FE

EE

U+044E

Small Letter Yu

я

EF

F1

FF

DF

EF

U+044F

Small Letter Ya

Ё

F0

B3

A8

DD

F1

U+0401

Capital Io

ё

F1

A3

B8

DE

F1

U+0451

Small Io

Кириллица из нерусских славянских языков

Ђ

80

AB

A2

U+0402

Capital Dje

Ѓ

*83 Г

*E7 Г

81

AE

A3

U+0403

Capital Gje

Є

F2

AA

B8

A4

U+0404

Capital Ukrainian Ie

Ѕ

*53 S

*53 S

BD

C1

A5

U+0405

Capital Dze

І

*49 I

*49 I

B2

A7

A6

U+0406

Capital Byelorussian-Ukrainian I

Ї

F4

AF

BA

A7

U+0407

Capital Yi

Ј

*4A J

*4A J

A3

B7

A8

U+0408

Serbian Capital Je

Љ

8A

BC

A9

U+0409

Serbian Capital Lje

Њ

8C

BE

AA

U+040A

Serbian Capital Nje

Ћ

8E

CB

AB

U+040B

Serbian Capital Tshe

Ќ

*8A К

*EB К

8D

CD

AC

U+040C

Capital Kje

Ў

F6

A1

D8

AE

U+040E

Capital Short U

Џ

8F

DA

AF

U+040F

Serbian Capital Dzhe

ђ

90

AC

F2

U+0452

Serbian Small Dje

ѓ

*A3 г

*C7 г

83

AF

F3

U+0453

Small Gje

є

F3

BA

B9

F4

U+0454

Small Ukrainian Ie

ѕ

*73 s

*73 s

BE

CF

F5

U+0455

Small Dze

і

*69 i

*69 i

B3

B4

F6

U+0456

Small Byelorussian-Ukrainian I

ї

F5

BF

BB

F7

U+0457

Small Yi

ј

*6A j

*6A j

BC

C0

F8

U+0458

Serbian Small Je

љ

9A

BD

F9

U+0459

Serbian Small Lje

?

9C

BF

FA

U+045A

Serbian Small Nje

ћ

9E

CC

FB

U+045B

Serbian Small Tshe

ќ

*AA К

*CB К

9D

CE

FC

U+045C

Small Kje

ў

F7

A2

D9

FE

U+045E

Small Short U

џ

9F

DB

FF

U+045F

Serbian Small Dzhe

Ґ

*83 Г

*E7 Г

A5

A2

*B3 Г

U+0490

Capital Ghe With Upturn

ґ

*A3 г

*C7 г

B4

B6

*D3 г

U+0491

Small Ghe With Upturn

Знаки (преимущественно Windows/Mac)

(No-Break Space)

*FF

9A

A0

CA

A0

U+00A0

No-Break Space

­

*20 Sp

*20 Sp

AD

*20 Sp

AE

U+00AD

Soft Hyphen

¤

FD

A4

FF ?

U+00A4

Currency Sign

¦

*B3 ³

*83 ³

A6

U+00A6

Broken Bar

§

*15 §

*15 §

A7

A4

FD

U+00A7

Section Sign

©

FC

BF

A9

A9

*43 C

U+00A9

Copyright Sign

«

*3C <

*3C <

AB

C7

*3C <

U+00AB

Left-Pointing Double Angle Quotation Mark

¬

*2D -

*2D -

AC

C2

*2D -

U+00AC

Not Sign

®

*52 R

*52 R

AE

A8

*52 R

U+00AE

Registered Sign

°

F8

9C

B0

A1

U+00B0

Degree Sign

±

*2B +

*2B +

B1

B1

*2B +

U+00B1

Plus-Minus Sign

ý

FD

9D

U+00B2

Superscript Two

µ

*E7 ч

*DE ч

B5

B5

*E7 ч

U+00B5

Micro Sign

B6

A6

U+00B6

Pilcrow Sign

·

FA

9E

B7

*2E .

*2E .

U+00B7 or 2219

Middle Dot or Bullet Operator

»

*3E >

*3E >

BB

C8

*3E >

U+00BB

Right-Pointing Double Angle Quotation Mark

ö

F6

9F

D6

U+00F7

Division Sign

*2D -

*2D -

96

D0

*2D -

U+2013

En Dash

*2D -

*2D -

97

D1

*2D -

U+2014

Em Dash

*27 '

*27 '

91

D4

*27 '

U+2018

Left Single Quotation Mark

*27 '

*27 '

92

D5

*27 '

U+2019

Right Single Quotation Mark

*27 '

*27 '

82

*27 '

*27 '

U+201A

Single Low-9 Quotation Mark

*22 "

*22 "

93

D2

*22 "

U+201C

Left Double Quotation Mark

*22 "

*22 "

94

D3

*22 "

U+201D

Right Double Quotation Mark

*22 "

*22 "

84

D7

*22 "

U+201E

Double Low-9 Quotation Mark

*C5 Å

*8A Å

86

A0

U+2020

Dagger

*D8 Ø

*BC Ø

87

U+2021

Double Dagger

F9

95

95

A5

U+2022 or 2219

Bullet or Bullet Operator

*3A :

*3A :

85

C9

U+2026

Horizontal Ellipsis

*25 %

*25 %

89

*25 %

*25 %

U+2030

Per Mille Sign

*3C <

*3C <

8B

*3C <

*3C <

U+2039

Single Left-Pointing Angle Quotation Mark

?

*3E >

*3E >

9B

*3E >

*3E >

U+203A

Single Right-Pointing Angle Quotation Mark

FC

B9

DC

F0

U+2116

Numero Sign

*54 T

*54 T

99

AA

*54 T

U+2122

Trade Mark Sign

Знаки, специфичные для DOS/KOI8-R

û

FB

96

*76 v

C3

*76 v

U+221A

Square Root

÷

F7

97

C5

U+2248

Almost Equal To

ó

F3

98

B2

U+2264

Less-Than Or Equal To

ò

F2

99

B3

U+2265

Greater-Than Or Equal To

ô

F4

93

U+2320

Top Half Integral

õ

F5

9B

U+2321

Bottom Half Integral

þ

FE

94

CA ?

U+25A0

Black Square

Знаки, специфичные для Mac

£

*4C L

*4C L

*4C L

A3

*4C L

U+00A3

Pound Sign

¦

*66 f

*66 f

*66 f

C4

*66 f

U+0192

Latin Small Letter F With Hook

D

C6

U+2206

Increment

¥

B0

U+221E

Infinity

¹

*23 #

*23 #

*23 #

AD

*23 #

U+2260

Not Equal To

Псевдографика (DOS/KOI8-R/ГОСТ)

°

B0

90

*20 Sp or *2D -

*20 Sp or *2D -

9B

U+2591

Light Shade

±

B1

91

*20 Sp or *2D -

*20 Sp or *2D -

9C

U+2592

Medium Shade

²

B2

92

*20 Sp or *2D -

*20 Sp or *2D -

9D

U+2593

Dark Shade

³

B3

81

*A6 ¦

*7C |

A5

U+2502

Box Drawings Light Vertical

´

B4

87

*A6 ¦

*7C |

A7

U+2524

Box Drawings Light Vertical And Left

µ

B5

B2

*A6 ¦

*7C |

83

U+2561

Box Drawings Vertical Single And Left Double

B6

B4

*A6 ¦

*7C |

84

U+2562

Box Drawings Vertical Double And Left Single

·

B7

A7

*2B +

or

*AC ¬

*2B +

or

*C2 ¬

85

U+2556

Box Drawings Down Double And Left Single

¸

B8

A6

*2B +

or

AC ¬

*2B +

or

*C2 ¬

86

U+2555

Box Drawings Down Single And Left Double

¹

B9

B5

*A6 ¦

*7C |

97

U+2563

Box Drawings Double Vertical And Left

º

BA

A1

*A6 ¦

*7C |

95

U+2551

Box Drawings Double Vertical

»

BB

A8

*2B +

or

*AC ¬

*2B +

or

*C2 ¬

91

U+2557

Box Drawings Double Down And Left

¼

BC

AE

*2B +

*2B +

92

U+255D

Box Drawings Double Up And Left

½

BD

AD

*2B +

*2B +

8B

U+255C

Box Drawings Up Double And Left Single

¾

BE

AC

*2B +

*2B +

8C

U+255B

Box Drawings Up Single And Left Double

¿

BF

83

*2B +

or

*AC ¬

*2B +

or

*C2 ¬

A1

U+2510

Box Drawings Light Down And Left

À

C0

84

*2B +

or

*4C L

*2B +

or

*4C L

A3

U+2514

Box Drawings Light Up And Right

Á

C1

89

*2D -

*2D -

A8

U+2534

Box Drawings Light Up And Horizontal

Â

C2

88

*2D -

or

*54 T

*2D -

or

*54 T

A6

U+252C

Box Drawings Light Down And Horizontal

Ã

C3

86

*2B +

*2B +

A9

U+251C

Box Drawings Light Vertical And Right

Ä

C4

80

*2D -

*2D -

A4

U+2500

Box Drawings Light Horizontal

Å

C5

8A

*2B +

*2B +

AA

U+253C

Box Drawings Light Vertical And Horizontal

Æ

C6

AF

*A6 ¦

*7C |

8D

U+255E

Box Drawings Vertical Single And Right Double

Ç

C7

B0

*A6 ¦

*7C |

8E

U+255F

Box Drawings Vertical Double And Right Single

È

C8

AB

*2B +

or

*4C L

*2B +

or

*4C L

93

U+255A

Box Drawings Double Up And Right

É

C9

A5

*2B +

or

*E3 г

*2B +

or

*E3 г

90

U+2554

Box Drawings Double Down And Right

Ê

CA

BB

*2D -

*2D -

98

U+2569

Box Drawings Double Up And Horizontal

Ë

CB

B8

*2D - or

*54 T

*2D - or

*54 T

96

U+2566

Box Drawings Double Down And Horizontal

Ì

CC

B1

*A6 ¦

*7C |

99

U+2560

Box Drawings Double Vertical And Right

Í

CD

A0

*2D -

or

*3D =

*2D -

or

*3D =

94

U+2550

Box Drawings Double Horizontal

Î

CE

BE

*2B +

*2B +

9A

U+256C

Box Drawings Double Vertical And Horizontal

Ï

CF

B9

*2D -

*2D -

80

U+2567

Box Drawings Up Single And Horizontal Double

Ð

D0

BA

*2D -

*2D -

81

U+2568

Box Drawings Up Double And Horizontal Single

Ñ

D1

B6

*2D -

or

*54 T

*2D -

or

*54 T

82

U+2564

Box Drawings Down Single And Horizontal Double

Ò

D2

B7

*2D -

or

*54 T

*2D -

or

*54 T

87

U+2565

Box Drawings Down Double And Horizontal Single

Ó

D3

AA

*2B +

or

*4C L

*2B +

or

*4C L

88

U+2559

Box Drawings Up Double And Right Single

Ô

D4

A9

*2B +

or

*4C L

*2B +

or

*4C L

89

U+2558

Box Drawings Up Single And Right Double

Õ

D5

A2

*2B +

*2B +

8A

U+2552

Box Drawings Down Single And Right Double

Ö

D6

A4

*2B +or

*E3 г

*2B +

or

*E3 г

8F

U+2553

Box Drawings Down Double And Right Single

×

D7

BD

*2B +

*2B +

9E

U+256B

Box Drawings Vertical Double And Horizontal Single

Ø

D8

BC

*2B +

*2B +

9F

U+256A

Box Drawings Vertical Single And Horizontal Double

Ù

D9

85

*2B +

*2B +

A2

U+2518

Box Drawings Light Up And Left

Ú

DA

82

*2B +

*2B +

A0

U+250C

Box Drawings Light Down And Right

Û

DB

8D

*5F _

*5F _

AB

U+2588

Full Block

Ü

DC

8C

*5F _

*5F _

AC

U+2584

Lower Half Block

Ý

DD

8E

*5F _

*5F _

AD

U+258C

Left Half Block

Þ

DE

8F

*5F _

*5F _

AE

U+2590

Right Half Block

ß

DF

8B

*5F _

*5F _

AF

U+2580

Upper Half Block

<
Примечания.

1) Все числовые значения кодов шестнадцатеричные.

2) Если в данной кодировке точное соответствие символа отсутствует, а приводится похожий символ, то его код отмечается звездочкой (*) и приводится сам заменяющий символ. Для DOS/Windows кодировок по возможности указываются стандартные для Windows соответствия, определяемые файлом xlat866.bin, однако в 32-битных программах Windows’95 этот файл не используется и соответствия отчасти другие (указываемые через союз or).

Впрочем, от некоторых отступлений, учитывая реальное отсутствие нормативности, я все равно не удержался.

3) Вопросительным знаком отмечены соответствия, сомнительные в отношении их стандартности.

4) Имена символов в Unicode в стандарте написаны полностью большими буквами. В большинстве из них содержится убранное мной определение CYRILLIC, в то же время для специфически сербских букв мной добавлено определение Serbian.

5) Псевдографические символы последней части таблицы содержатся в кодировке ГОСТ (“основной”), но не содержатся в ISO-8859-5, в свою очередь буквы нерусских славянских языков содержатся кодировке ISO-8859-5, но не содержатся в кодировке ГОСТ.

(Исправлены опечатки версии 03-Ноя-97.)

6) Указанные 2 значения UNICODE для двух “буллетов” связаны с фактической эквивалентностью middot и bullet operator (U+00B7

и U+2219), представляющих собой маленькую точку в центре позиции буквы, и с неоднозначностью трактовки и перекодировки “толстой точки” с кодом F9 в CP866. По смыслу это должен быть “буллет” (U+2022), но в определении KOI8-R в RFC-1489 стоит U+2219

(“маленькая точка").

7) Unicode Names не совпадают с Postscript Names, содержащимися в шрифтах TrueType. Postscript Names русских букв имеют вид “afii10xx”.

21-Mar-98 Костя Каз. (kazarn@glas.apc.org)


Содержание раздела