КОИ-8
КОИ-8 (код обмена информацией, 8 бит), KOI8 — восьмибитовая кодовая страница, совместимая с ASCII. Разработана для кодирования букв кириллических алфавитов. Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако ближе к 2010 году, с распространением Юникода, постепенно выходит из употребления.
Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74.
Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убрать восьмой бит каждого символа, то получится «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.
Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющие определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U, таджикский — в KOI8-T.
В 1990-х годах KOI8-R стал фактически стандартом для кодирования русской кириллицы в UNIX-подобных операционных системах и электронной почте. Автор данной кодировки (RFC 1489) — Андрей Чернов в начале 1990-х годов работал в компании Демос (сеть Релком) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами. КОИ-8 стала первой русской стандартизированной кодировкой в интернете.
IETF утвердил несколько RFC по вариантам кодировки KOI-8:
RFC 1489 — KOI8-R (буквы русского алфавита);
RFC 2319 — KOI8-U (буквы украинского алфавита);
RFC 1345 — ISO-IR-111 (с ошибкой в определении основного диапазона).
IANA зарегистрировала кодировки в своём списке.
Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.
В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.
Начало таблицы кодировки (латиница) полностью соответствует кодировке ASCII.
В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.
Содержание
1 Кодировка KOI8-R (русская)
2 Другие варианты
2.1 Кодировка KOI8-U (русско-украинская)
2.2 Кодировка KOI8-RU (русско-белорусско-украинская)
2.3 Кодировка KOI8-C (Центральная Азия)
2.4 Кодировка KOI8-T (таджикская)
2.5 Кодировка KOI8-O, KOI8-S (славянская, старая орфография)
2.6 Кодировка ISO-IR-111, KOI8-E
2.7 Кодировка KOI8-Unified, KOI8-F
3 Некириллические варианты КОИ-8
4 Примечания
5 Ссылки
Кодировка KOI8-R (русская) |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9. | ░ 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √ 221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | A0 | ⌡ 2321 | ° B0 | ² B2 | · B7 | ÷ F7 |
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | ╓ 2553 | ╔ 2554 | ╕ 2555 | ╖ 2556 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ╜ 255C | ╝ 255D | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | ╢ 2562 | ╣ 2563 | ╤ 2564 | ╥ 2565 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | ╫ 256B | ╬ 256C | © A9 |
C. | ю 44E | а 430 | б 431 | ц 446 | д 434 | е 435 | ф 444 | г 433 | х 445 | и 438 | й 439 | к 43A | л 43B | м 43C | н 43D | о 43E |
D. | п 43F | я 44F | р 440 | с 441 | т 442 | у 443 | ж 436 | в 432 | ь 44C | ы 44B | з 437 | ш 448 | э 44D | щ 449 | ч 447 | ъ 44A |
E. | Ю 42E | А 410 | Б 411 | Ц 426 | Д 414 | Е 415 | Ф 424 | Г 413 | Х 425 | И 418 | Й 419 | К 41A | Л 41B | М 41C | Н 41D | О 41E |
F. | П 41F | Я 42F | Р 420 | С 421 | Т 422 | У 423 | Ж 416 | В 412 | Ь 42C | Ы 42B | З 417 | Ш 428 | Э 42D | Щ 429 | Ч 427 | Ъ 42A |
Другие варианты |
Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.
Кодировка KOI8-U (русско-украинская) |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ╝ 255D | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | ╬ 256C | © A9 |
Кодировка KOI8-RU (русско-белорусско-украинская) |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ў 45E | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | Ў 40E | © A9 |
Кодировка KOI8-C (Центральная Азия) |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ғ 493 | җ 497 | қ 49B | ҝ 49D | ң 4A3 | ү 4AF | ұ 4B1 | ҳ 4B3 | ҷ 4B7 | ҹ 4B9 | һ 4BB | ▀ 2580 | ә 4D9 | ӣ 4E3 | ө 4E9 | ӯ 4EF |
9. | Ғ 492 | Җ 496 | Қ 49A | Ҝ 49C | Ң 4A2 | Ү 4AE | Ұ 4B0 | Ҳ 4B2 | Ҷ 4B6 | Ҹ 4B8 | Һ 4BA | ⌡ 2321 | Ә 4D8 | Ӣ 4E2 | Ө 4E8 | Ӯ 4EE |
A. | A0 | ђ 452 | ѓ 453 | ё 451 | є 454 | ѕ 455 | і 456 | ї 457 | ј 458 | љ 459 | њ 45A | ћ 45B | ќ 45C | ґ 491 | ў 45E | џ 45F |
B. | № 2116 | Ђ 402 | Ѓ 403 | Ё 401 | Є 404 | Ѕ 405 | І 406 | Ї 407 | Ј 408 | Љ 409 | Њ 40A | Ћ 40B | Ќ 40C | Ґ 490 | Ў 40E | Џ 40F |
Кодировка KOI8-T (таджикская) |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | қ 49B | ғ 493 | ‚ 201A | Ғ 492 | „ 201E | … 2026 | † 2020 | ‡ 2021 | ‰ 2030 | ҳ 4B3 | ‹ 2039 | Ҳ 4B2 | ҷ 4B7 | Ҷ 4B6 | | |
9. | Қ 49A | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | ™ 2122 | › 203A | | | ||||
A. | ӯ 4EF | Ӯ 4EE | ё 451 | ¤ A4 | ӣ 4E3 | ¦ A6 | § A7 | | « AB | ¬ AC | AD | ® AE | | |||
B. | ° B0 | ± B1 | ² B2 | Ё 401 | Ӣ 4E2 | ¶ B6 | · B7 | № 2116 | » BB | | © A9 |
Кодировка KOI8-O, KOI8-S (славянская, старая орфография) |
0407
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | Ђ 0402 | Ѓ 0403 | ¸ 00B8 | ѓ 0453 | „ 201E | … 2026 | † 2020 | § 00A7 | € 20AC | ¨ 00A8 | Љ 0409 | ‹ 2039 | Њ 040A | Ќ 040C | Ћ 040B | Џ 040F |
9. | ђ 0452 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | £ 00A3 | · 00B7 | љ 0459 | › 203A | њ 045A | ќ 045C | ћ 045B | џ 045F |
A. | 00A0 | ѵ 0475 | ѣ 0463 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | ® 00AE | ™ 2122 | « 00AB | ѳ 0473 | ґ 0491 | ў 045E | ´ 00B4 |
B. | ° 00B0 | Ѵ 0474 | Ѣ 0462 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | № 2116 | ¢ 00A2 | » 00BB | Ѳ 0472 | Ґ 0490 | Ў 040E | © 00A9 |
Кодировка ISO-IR-111, KOI8-E |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | 00AD | ў 045E | џ 045F |
B. | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | ¤ 00A4 | Ў 040E | Џ 040F |
Кодировка KOI8-Unified, KOI8-F |
Кодировка KOI8-Unified (KOI8-F) предложена компанией «Fingertip Software»[1].
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9. | ░ 2591 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | © 00A9 | ™ 2122 | 00A0 | » 00BB | ® 00AE | « 00AB | · 00B7 | ¤ 00A4 |
A. | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | ґ 0491 | ў 045E | џ 045F |
B. | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | Ґ 0490 | Ў 040E | Џ 040F |
Некириллические варианты КОИ-8 |
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным.
Примечания |
↑ KOI8 Unified // Fingertip Software site
Ссылки |
- Сводка кириллических 8-битных кодировок
- RFC 1489
- RFC 2319
Кодировки символов | ||
---|---|---|
Основы | алфавит • текст (файл • данные) • набор символов • конверсия | |
Исторические кодировки | Докомп.: | семафорная (Макарова) • Морзе • Бодо • МТК-2 |
Комп.: | 6-битная • УПП • RADIX-50 • EBCDIC (ДКОИ-8) • КОИ-7 • ISO 646 | |
современное 8-битное представление | символы | ASCII (управляющие • печатные) • не-ASCII (псевдографика) |
8-битные код.стр. | Кириллица: КОИ-8 • Основная кодировка • MacCyrillic | |
ISO 8859 | 1 (лат.) • 2 • 3 • 4 • 5 (кир.) • 6 • 7 • 8 • 9 • 10 • 11 • 12 • 13 • 14 • 15 (€) • 16 | |
Windows | 1250 • 1251 (кир.) • 1252 • 1253 • 1254 • 1255 • 1256 • 1257 • 1258 • WGL4 | |
IBM & DOS | 437 • 850 • 852 • 855 • 866 «альт.» • МИК | |
Многобайтные | Традиционные | DBCS (GB2312) • HTML |
Unicode | UTF-32 • UTF-16 • UTF-8 • список символов (кириллица) | |
Связанные темы | интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • транслит • нестандартные шрифты | |
Утилиты | iconv • recode |