ascii



Предыдущая | Следующая

ascii American Standard Code for Information Interchange. Американский стандартный код для обмена информацией. Набор из 128 кодов символов для их машинного представления.
ascii os'kee/ (американский стандартный код для обмена информацией), ущ. Код для представления текстовой информации, используемый в боль-инстве вычислительных систем. Каждый символ представлен семью битами; ругие кодировки, включая ранние версии ASCII, использовали меньшее чи-ю разрядов. Увеличение числа разрядов позволило включить в код строчные уквы (главная победа; см. win), но, по-прежнему, не позволяет пользовать-я диакритическими знаками или буквами, не входящими в английский ал-авит (например, некоторые буквы немецкого или норвежского алфавитов). Хотя могло быть и хуже. Могло быть гораздо хуже и чтобы понять это, см. BCDIC. Компьютер воспринимает каждый символ буквально; в отличие от людей н не может понимать всей многозначности речи, и поэтому хакеры предельно точны и аккуратны, когда говорят о символах. Они придумали для них множество собственных определений. Каждый символ имеет одно или несколь-о имен – некоторые из них формальные, некоторые глупые, некоторые же просто краткая форма формального определения. Здесь представлены самые аспространенные жаргонные названия ASCII-символов. См. также пункты Словаря для символов bang, excl, open, ques, semi, shriek, splat, twiddle и Yu-hiang Whole Fish. Этот список взят из версии 2.3 руководства по произношению символов ASCII, которое циркулирует в USENET. Одиночные символы перечислены в порядке ASCII-кодировки; пары символов сортируются по первому символу. Для каждого символа все часто используемые названия даются в порядке, приблизительно соответствующем степени популярности конкретного имени, после чего идут редко применяемые названия; официальные ANSI/CCITT названия заключены в обычные угловые скобки: <>. Глупые имена, в избытке поставляемые INTERCAL, заключены в квадратные скобки [ ]. В обычных круглых скобках даются перевод и некоторая полезная информация. ! Обычно: bang (ax); pling (ба-бах); excl (воскл); shriek (визг); <exclamation mark (восклицательный знак)>. Редко: factorial (факториал); exclam (восклиц); smash (бамц); cuss (крутой парень); boing (боинг?); yell (y-лю-лю); wow (ба); hey (эй); wham (yx); [spark-spot (искра-точка)]; soldier (солдат). » Обычно: двойная кавычка. Редко: знак литерации; двойной глюк; <знак кавычки>; <dieresis (диерезис)>; dirk (двойная заноза или кинжал); [заячьи уши]; double prime (двойная обычная). 1.Обычно: <знак номера>; фунт; знак фунта; hash (мешанина); sharp (диез); crunch (хрустеть); hex(от hexadecimal), [mesh (сито)]; octothorpe (восемь концов). Редко: grid (сетка); Crosshatch (решетка); octothorpe (восьмиконечник); flash (вспышка); <square> (квадрат), pig-pen (загон для свиней); tictactoe (крестики-нолики); scratchmark (царапины); thud (бум); thump (бац); splat (шмяк). $ Обычно: доллар, <знак долларах Редко: валюта, бак, наличные, строка (из BASIC); escape (когда используется как эхо ASCII-символа ESC); ding (звонок); cache (заначка); big money (большие деньги). У, Обычно: процент; <знак процента>; mod (отделения по модулю, стиляга); виноградины. Редко: [double-oh-seven (два-о-семерка)]. & Обычно: <ampersand (амперсанд)>; ампер; и. Редко: адрес (язык Си); ссылка (Си ++); andpersand; bitand (бит-и); background (фон (от sh(l))); крекер; amp. (INTERCAL называет этот символ амперсандом – что может быть глупее?) » Обычно: одиночная кавычка; кавычка; <знак апострофах Редко: обычная; глюк; tick (тик); irk (заноза); pop(хлопок); [spark (искра)]; <знак закрывающей одиночной кавычки>; <acute accent (значок над гласной в некоторых языках романской группы)>.  ( ) Обычно: левая/правая скобки; левый/правый; открыть/закрыть; левый/ правый банан. Редко: так/уже; <открывающая/закрывающая скобки>; открытая/закрытая круглые скобки; [wax-wane (убывать-прибывать)]; левое/правое ухо. Обычно: звездочка; [[[splat]] (шмяк)]; <астериск>. Редко: wildcard (знак универсального сопоставления); gear (шестерня); dingle (звонок); умножить; паук; астер; times (умножить) twinkle (мерцалка); glob (крошка) (см. glob); NathanHale. + Обычно: <плюс>; прибавить. Редко: крест; [пересечение]. , Обычно: <запятая>. Редко: <седилла>; [хвост]. - Обычно: черта; <дефис>; <минус>. Редко: [глист]; выбор, перенос, bithorpe (два конца). . Обычно: точка; <период>; <десятичная точках Редко: точка начала координат, полный стоп; [spot (прыщ)]. / Обычно: слэш; штрих; <косая>; прямой слэш. Редко: диагональ; solidus (косая черта); over (над); slak; косая; [перекладина].  Обычно: <двоеточие>. Редко: точки; [два прыща]. Обычно <semicolon (точка с запятой)>; semi. Редко: бутерброд; [гибрид], pit-thwong. <> Обычно: <меньше/больше чем>; левая/правая угловые скобки; bra/ket. Редко: из/в; по направлению; читать из/писать в; вдох/выдох; придти из/гозинта; в/из; crunch/zap(сжать/разжать) (все из UNIXa); [угол/правый угол]. = Обычно: <равняется>; становится; берется; Редко: quadrathorpe (четыре конца); [полсита]. ? Обычно: вопрос; <знак вопросах Ques. Редко: знак что; [что]; знак по умолчанию; huh (хук); hook (крюк); кнопка с крючком; горб. <3 Обычно: знак «at»; at; струдель. Редко: каждый; смерч; [завиток]; собака; плюшка; циклон; улитка; обезьяна; кошка; роза; капуста; коммерческое «at'x \/ Редко: [книга]. <tbody></tbody>   [ ]
 

  .0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
0. NUL SOH STX ETX EOT ENQ ACK BEL BS TAB LF VT FF CR SO SI
1. DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2.    ! " # $  % & ' ( ) * + , . /
3. 0 1 2 3 4 5 6 7 8 9  :  ; < = >  ?
4. @ A B C D E F G H I J K L M N O
5. P Q R S T U V W X Y Z [ \ ] ^ _
6. ` a b c d e f g h i j k l m n o
7. p q r s t u v w x y z { | } ~ DEL

Символ 0x5e в первой версии стандарта ASCII (1963) соответствовал стрелке вверх, а символ 0x5f — стрелке влево. Стандарт ECMA-6 (1965) заменил их на знак вставки (используемый также в роли циркумфлекса) и нижнюю черту (подчёркивание) соответственно.

Поскольку ASCII изначально предназначался для обмена информацией (по телетайпу), в нём, кроме информационных символов, используются символы-команды для управления связью. Это обычный набор спецсигналов, применявшийся и в других докомпьютерных средствах обмена сообщениями (азбука Морзе, семафорная азбука), дополненный с учётом специфики устройства.

(После названия каждого символа указан его 16-ричный код)

  • NUL, 00 — Null, пустой. Всегда игнорировался. На перфолентах 1 представлялась дырочкой, 0 — отсутствием дырочки. Поэтому пустые части перфоленты до начала и после конца сообщения состояли из таких символов. Сейчас используется во многих языках программирования как конец строки. (Строка понимается как последовательность символов.) В некоторых операционных системах NUL — последний символ любого текстового файла.
  • SOH, 01 — Start Of Heading, начало заголовка.
  • STX, 02 — Start of Text, начало текста. Текстом называлась часть сообщения, предназначенная для печати. Адрес, контрольная сумма и т. д. входили или в заголовок, или в часть сообщения после текста.
  • ETX, 03 — End of Text, конец текста. Здесь телетайп прекращал печатать. Использование символа Ctrl-C, имеющего код 03, для прекращения работы чего-то (обычно программы), восходит ещё к тем временам.
  • EOT, 04 — End of Transmission, конец передачи. В системе UNIX Ctrl-D, имеющий тот же код, означает конец файла при вводе с клавиатуры.
  • ENQ, 05 — Enquire. Прошу подтверждения.
  • ACK, 06 — Acknowledgement. Подтверждаю.
  • BEL, 07 — Bell, звонок, звуковой сигнал. Сейчас тоже используется. В языках программирования C и C++ обозначается \a.
  • BS, 08 — Backspace, возврат на один символ. Сейчас стирает предыдущий символ.
  • TAB, 09 — Tabulation. Обозначался также HT — Horizontal Tabulation, горизонтальная табуляция. Во многих языках программирования обозначается \t .
  • LF, 0A — Line Feed, перевод строки. Сейчас в конце каждой строчки текстового файла ставится либо этот символ, либо CR, либо и тот и другой (CR, затем LF), в зависимости от операционной системы. Во многих языках программирования обозначается \n и при выводе текста приводит к переводу строки.
  • VT, 0B — Vertical Tab, вертикальная табуляция.
  • FF, 0C — Form Feed, новая страница.
  • CR, 0D — Carriage Return, возврат каретки. Во многих языках программирования этот символ, обозначаемый \r, можно использовать для возврата в начало строчки без перевода строки. В некоторых операционных системах этот же символ, обозначаемый Ctrl-M, ставится в конце каждой строчки текстового файла перед LF.
  • SO, 0E — Shift Out, измени цвет ленты (использовался для двуцветных лент; цвет менялся обычно на красный). В дальнейшем обозначал начало использования национальной кодировки.
  • SI, 0F — Shift In, обратно к Shift Out.
  • DLE, 10 — Data Link Escape, следующие символы имеют специальный смысл.
  • DC1, 11 — Device Control 1, 1-й символ управления устройством — включить устройство чтения перфоленты.
  • DC2, 12 — Device Control 2, 2-й символ управления устройством — включить перфоратор.
  • DC3, 13 — Device Control 3, 3-й символ управления устройством — выключить устройство чтения перфоленты.
  • DC4, 14 — Device Control 4, 4-й символ управления устройством — выключить перфоратор.
  • NAK, 15 — Negative Acknowledgment, не подтверждаю. Обратно к Acknowledgment.
  • SYN, 16 — Synchronization. Этот символ передавался, когда для синхронизации было необходимо что-нибудь передать.
  • ETB, 17 — End of Text Block, конец текстового блока. Иногда текст по техническим причинам разбивался на блоки.
  • CAN, 18 — Cancel, отмена (того, что было передано ранее).
  • EM, 19 — End of Medium, кончилась перфолента и т. д.
  • SUB, 1A — Substitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче. Сейчас Ctrl-Z используется как конец файла при вводе с клавиатуры в системах DOS и Windows. У этой функции нет никакой очевидной связи с символом SUB.
  • ESC, 1B — Escape. Следующие символы — что-то специальное.
  • FS, 1C — File Separator, разделитель файлов.
  • GS, 1D — Group Separator, разделитель групп.
  • RS, 1E — Record Separator, разделитель записей.
  • US, 1F — Unit Separator, разделитель юнитов. То есть поддерживалось 4 уровня структуризации данных: сообщение могло состоять из файлов, файлы из групп, группы из записей, записи из юнитов.
  • DEL, 7F — Delete, стереть последний символ. Символом DEL, состоящим в двоичном коде из всех единиц, можно было забить любой символ. Устройства и программы игнорировали DEL так же, как NUL. Код этого символа происходит из первых текстовых процессоров с памятью на перфоленте: в них удаление символа происходило забиванием его кода дырочками (обозначавшими логические единицы).