КОИ-8




КОИ-8 (код обмена информацией, 8 бит), KOI8 — восьмибитовая кодовая страница, совместимая с ASCII. Разработана для кодирования букв кириллических алфавитов. Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако ближе к 2010 году, с распространением Юникода, постепенно выходит из употребления.


Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74.


Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убрать восьмой бит каждого символа, то получится «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.


Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющие определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U, таджикский — в KOI8-T.


В 1990-х годах KOI8-R стал фактически стандартом для кодирования русской кириллицы в UNIX-подобных операционных системах и электронной почте. Автор данной кодировки (RFC 1489) — Андрей Чернов в начале 1990-х годов работал в компании Демос (сеть Релком) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами. КОИ-8 стала первой русской стандартизированной кодировкой в интернете.


IETF утвердил несколько RFC по вариантам кодировки KOI-8:




  • RFC 1489 — KOI8-R (буквы русского алфавита);


  • RFC 2319 — KOI8-U (буквы украинского алфавита);


  • RFC 1345 — ISO-IR-111 (с ошибкой в определении основного диапазона).


IANA зарегистрировала кодировки в своём списке.


Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.


В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.


Начало таблицы кодировки (латиница) полностью соответствует кодировке ASCII.


В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.




Содержание






  • 1 Кодировка KOI8-R (русская)


  • 2 Другие варианты


    • 2.1 Кодировка KOI8-U (русско-украинская)


    • 2.2 Кодировка KOI8-RU (русско-белорусско-украинская)


    • 2.3 Кодировка KOI8-C (Центральная Азия)


    • 2.4 Кодировка KOI8-T (таджикская)


    • 2.5 Кодировка KOI8-O, KOI8-S (славянская, старая орфография)


    • 2.6 Кодировка ISO-IR-111, KOI8-E


    • 2.7 Кодировка KOI8-Unified, KOI8-F




  • 3 Некириллические варианты КОИ-8


  • 4 Примечания


  • 5 Ссылки





Кодировка KOI8-R (русская) |















































































































































































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
 
8.
 


2500


2502


250C


2510


2514


2518


251C


2524


252C


2534


253C


2580


2584


2588


258C


2590
 
9.
 


2591


2592


2593


2320


25A0


2219


221A


2248


2264


2265

 
A0


2321

°
B0

²
B2

·
B7

÷
F7
 
A.
 


2550


2551


2552

ё
451


2553


2554


2555


2556


2557


2558


2559


255A


255B


255C


255D


255E
 
B.
 


255F


2560


2561

Ё
401


2562


2563


2564


2565


2566


2567


2568


2569


256A


256B


256C

©
A9
 
C.
 

ю
44E

а
430

б
431

ц
446

д
434

е
435

ф
444

г
433

х
445

и
438

й
439

к
43A

л
43B

м
43C

н
43D

о
43E
 
D.
 

п
43F

я
44F

р
440

с
441

т
442

у
443

ж
436

в
432

ь
44C

ы
44B

з
437

ш
448

э
44D

щ
449

ч
447

ъ
44A
 
E.
 

Ю
42E

А
410

Б
411

Ц
426

Д
414

Е
415

Ф
424

Г
413

Х
425

И
418

Й
419

К
41A

Л
41B

М
41C

Н
41D

О
41E
 
F.
 

П
41F

Я
42F

Р
420

С
421

Т
422

У
423

Ж
416

В
412

Ь
42C

Ы
42B

З
417

Ш
428

Э
42D

Щ
429

Ч
427

Ъ
42A


Другие варианты |


Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.



Кодировка KOI8-U (русско-украинская) |





























































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
 
A.
 


2550


2551


2552

ё
451

є
454


2554

і
456

ї
457


2557


2558


2559


255A


255B

ґ
491


255D


255E
 
B.
 


255F


2560


2561

Ё
401

Є
404


2563

І
406

Ї
407


2566


2567


2568


2569


256A

Ґ
490


256C

©
A9


Кодировка KOI8-RU (русско-белорусско-украинская) |





























































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
 
A.
 


2550


2551


2552

ё
451

є
454


2554

і
456

ї
457


2557


2558


2559


255A


255B

ґ
491

ў
45E


255E
 
B.
 


255F


2560


2561

Ё
401

Є
404


2563

І
406

Ї
407


2566


2567


2568


2569


256A

Ґ
490

Ў
40E

©
A9


Кодировка KOI8-C (Центральная Азия) |



































































































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
8.
ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ә
4D9
ӣ
4E3
ө
4E9
ӯ
4EF
9.
Ғ
492
Җ
496
Қ
49A
Ҝ
49C
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
A.
 
A0
ђ
452
ѓ
453
ё
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45A
ћ
45B
ќ
45C
ґ
491
ў
45E
џ
45F
B.

2116
Ђ
402
Ѓ
403
Ё
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A
Ћ
40B
Ќ
40C
Ґ
490
Ў
40E
Џ
40F


Кодировка KOI8-T (таджикская) |



































































































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
8.
қ
49B
ғ
493

201A
Ғ
492

201E

2026

2020

2021
 
2030
ҳ
4B3

2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
 
9.
Қ
49A

2018

2019

201C

201D

2022

2013

2014
 
2122
 
203A
   
   
A.
  ӯ
4EF
Ӯ
4EE
ё
451
¤
A4
ӣ
4E3
¦
A6
§
A7
   
  «
AB
¬
AC


AD
®
AE
 
B.
°
B0
±
B1
²
B2
Ё
401
  Ӣ
4E2

B6
·
B7
 
2116
  »
BB
   
  ©
A9


Кодировка KOI8-O, KOI8-S (славянская, старая орфография) |



0407

































































































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
 
8.
 

Ђ
0402

Ѓ
0403

¸
00B8

ѓ
0453


201E


2026


2020

§
00A7


20AC

¨
00A8

Љ
0409


2039

Њ
040A

Ќ
040C

Ћ
040B

Џ
040F
 
9.
 

ђ
0452


2018


2019


201C


201D


2022


2013


2014

£
00A3

·
00B7

љ
0459


203A

њ
045A

ќ
045C

ћ
045B

џ
045F
 
A.
 

 
00A0

ѵ
0475

ѣ
0463

ё
0451

є
0454

ѕ
0455

і
0456

ї
0457

ј
0458

®
00AE


2122

«
00AB

ѳ
0473

ґ
0491

ў
045E

´
00B4
 
B.
 

°
00B0

Ѵ
0474

Ѣ
0462

Ё
0401

Є
0404

Ѕ
0405

І
0406

Ї
0407

Ј
0408


2116

¢
00A2

»
00BB

Ѳ
0472

Ґ
0490

Ў
040E

©
00A9


Кодировка ISO-IR-111, KOI8-E |





























































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
 
A.
 

 
00A0

ђ
0452

ѓ
0453

ё
0451

є
0454

ѕ
0455

і
0456

ї
0457

ј
0458

љ
0459

њ
045A

ћ
045B

ќ
045C

­
00AD

ў
045E

џ
045F
 
B.
 


2116

Ђ
0402

Ѓ
0403

Ё
0401

Є
0404

Ѕ
0405

І
0406

Ї
0407

Ј
0408

Љ
0409

Њ
040A

Ћ
040B

Ќ
040C

¤
00A4

Ў
040E

Џ
040F


Кодировка KOI8-Unified, KOI8-F |


Кодировка KOI8-Unified (KOI8-F) предложена компанией «Fingertip Software»[1].



































































































.0 .1
.2 .3
.4 .5
.6 .7
.8 .9
.A .B
.C .D
.E .F
 
8.
 


2500


2502


250C


2510


2514


2518


251C


2524


252C


2534


253C


2580


2584


2588


258C


2590
 
9.
 


2591


2018


2019


201C


201D


2022


2013


2014

©
00A9


2122

 
00A0

»
00BB

®
00AE

«
00AB

·
00B7

¤
00A4
 
A.
 

 
00A0

ђ
0452

ѓ
0453

ё
0451

є
0454

ѕ
0455

і
0456

ї
0457

ј
0458

љ
0459

њ
045A

ћ
045B

ќ
045C

ґ
0491

ў
045E

џ
045F
 
B.
 


2116

Ђ
0402

Ѓ
0403

Ё
0401

Є
0404

Ѕ
0405

І
0406

Ї
0407

Ј
0408

Љ
0409

Њ
040A

Ћ
040B

Ќ
040C

Ґ
0490

Ў
040E

Џ
040F


Некириллические варианты КОИ-8 |


В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным.



Примечания |





  1. KOI8 Unified // Fingertip Software site




Ссылки |



  • Сводка кириллических 8-битных кодировок

  • RFC 1489

  • RFC 2319
























































Кодировки символов
Основы

алфавит • текст (файл • данные) • набор символов • конверсия

Исторические кодировки

Докомп.:

семафорная (Макарова) • Морзе • Бодо • МТК-2

Комп.:

6-битная • УПП • RADIX-50 • EBCDIC (ДКОИ-8) • КОИ-7 • ISO 646

современное
8-битное
представление


символы

ASCII (управляющие • печатные) • не-ASCII (псевдографика)
8-битные код.стр.
Кириллица: КОИ-8 • Основная кодировка • MacCyrillic

ISO 8859

1 (лат.) • 2 • 3 • 4 • 5 (кир.) • 6 • 7 • 8 • 9 • 10 • 11 • 12 • 13 • 14 • 15 (€) • 16
Windows

1250 • 1251 (кир.) • 1252 • 1253 • 1254 • 1255 • 1256 • 1257 • 1258 • WGL4
IBM & DOS

437 • 850 • 852 • 855 • 866 «альт.» • МИК

Многобайтные
Традиционные

DBCS (GB2312) • HTML

Unicode

UTF-32 • UTF-16 • UTF-8 • список символов (кириллица)

Связанные темы

интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • транслит • нестандартные шрифты

Утилиты

iconv • recode



Popular posts from this blog

Сан-Квентин

8-я гвардейская общевойсковая армия

Алькесар