Emacs для начинающих

       

Language


    Информация, полученная из "человеческого" мира и предназначенная для машинной обработки, как правило имеет специальный арибут  : язык или language (lang). Причем, не только текстовая, но например audio :

Content-Description: Russian Argo audio sample :-) Content-Type: audio/basic Content-Language: ru

(, )

    Однако нас инересует именно текстовая

информация.

    Большинство языков мира имеют письменнось, а некоторые языки даже несколько (например кириллица и глаголица для славянских языков или kana и kanji в японском и т.д.). Определенная система письменности называется script. Системы письменности существуют самые разнообразные (например узелковое :-), но большинство письменностей - это изображение

последовательности специальных символов

(character).

* ПРИМЕЧАНИЕ : Объяснение концепции символа

выходит далеко за рамки данного документа. Мы не будем вдаваться в филологические и философские подробности, а рассмотрим лишь узкий аспект -- способы представления символов

(национального) языка для автоматической (машинной) обработки. Тогда термин "символ" (character) можно определить как "единицу текстовой информации" (unit of textual information), которая передается письменно и участвует в машинной обрабоке. Очень важно четко представлять себе, что речь идет об "абстрактном"

символе.



Содержание раздела