System of standards on information, librarianship and publishing. Rules of transliteration of Cyrillic script by Latin alphabet
Дата введения - 1 июля 2002 г.
Взамен ГОСТ 16876-71
Французский язык в тексте не приводится
Предисловие
1 Разработан Всероссийским институтом научной и технической информации Российской Академии наук и Министерства науки и технологий Российской Федерации, Техническим комитетом по стандартизации ТК 191 "Научно-техническая информация, библиотечное и издательское дело"
Внесен Госстандартом России
2 Принят Межгосударственным Советом по стандартизации, метрологии и сертификации (отчет Технического секретариата N 17 от 19 - 22 июня 2000 г.)
За принятие проголосовали:
Наименование государства |
Наименование национального органа по стандартизации |
Азербайджанская Республика |
Азгосстандарт |
Республика Армения |
Армгосстандарт |
Республика Беларусь |
Госстандарт Республики Беларусь |
Республика Казахстан |
Госстандарт Республики Казахстан |
Кыргызская Республика |
Кыргызстандарт |
Российская Федерация |
Госстандарт России |
Республика Таджикистан |
Таджикстандарт |
Туркменистан |
Главгосслужба "Туркменстандартлары" |
Республика Узбекистан |
Узгосстандарт |
3 Настоящий стандарт представляет собой аутентичный текст ИСО 9-95 "Информация и документация. Транслитерация кириллических букв латинскими. Славянские и неславянские языки"
4 Постановлением Государственного комитета Российской Федерации по стандартизации и метрологии от 4 сентября 2001 г. N 371-ст межгосударственный стандарт ГОСТ 7.79-2000 введен в действие непосредственно в качестве государственного стандарта Российской Федерации с 1 июля 2002 г.
5 Взамен ГОСТ 16876-71
1 Область применения
Настоящий стандарт распространяется на правила транслитерации средствами латинского алфавита отдельных букв, слов, выражений, а также связанных текстов на языках, письменность которых базируется на кирилловском алфавите. Правила согласно настоящему стандарту применяют везде, где требуется обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи, в частности при передаче документов по компьютерным сетям.
Настоящий стандарт не распространяется на правила передачи латинскими буквами звукового облика слов, записанных кириллицей.
Правила представления национальных географических наименований на картах определяются руководящими документами соответствующих картографических служб.
2 Нормативные ссылки
ГОСТ 7.28-80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного латинского алфавита для обмена информацией на магнитных лентах
ГОСТ 7.29-80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного кирилловского алфавита для обмена информацией на магнитных лентах
ГОСТ 27465-87 Системы обработки информации. Символы. Классификация, наименование и обозначение
3 Определения
В настоящем стандарте применяют следующие термины с соответствующими определениями:
3.1 система письма: Совокупность начертательных (графических) символов и приемов, принятая для фиксации на бумаге или другом материале текстов, высказываний, сообщений, составленных на некотором языке;
3.2 конверсия систем письма: Представление текстов, составленных на определенном языке, средствами системы письма, принятой для другого языка;
3.3 транслитерация: Конверсия систем письма, при которой каждый графический элемент (знак) одной системы письма представляется (заменяется) одним и тем же графическим элементом другой системы письма;
3.3.1 строгая транслитерация: Замена каждой буквы исходного текста только одной буквой другой письменности;
3.3.2 ослабленная транслитерация: Замена некоторых букв исходного текста сочетанием двух или более букв чужого алфавита;
3.3.3 расширенная транслитерация; Представление некоторых буквосочетаний исходного текста особым образом;
3.4 алфавит: Конечный набор графических символов (букв), используемый в определенной системе письма для передачи элементов звуковой речи;
3.5 буква: Графический символ, входящий в состав алфавита.
Примечание - Каждая система письма устанавливает пределы, в которых может варьировать начертание букв без изменения их алфавитного значения;
3.6 алфавитная система письма: Система письма, основанная на использовании алфавита;
3.7 латиница: Система письма, принятая в разных вариантах западно-европейскими и большим числом других языков мира и основанная на письменной традиции латинского языка;
3.8 латинский алфавит; Алфавит, используемый в том или ином варианте латиницы;
3.9 кириллица: Система письма, принятая в разных вариантах рядом славянских и других языков Европы и Азии и созданная на основе греческого уставного письма в традиции перевода Священного Писания на старославянский язык;
3.10 кирилловский алфавит: Алфавит, используемый в том или ином варианте кириллицы;
3.11 базовый (основной) алфавит: Алфавит, содержащий только те буквы, которые используются большинством систем письма, основанных на алфавите определенного типа.
Примечание - В настоящем стандарте в качестве базового латинского алфавита принят набор латинских букв, установленный ГОСТ 27465;
3.12 расширенный алфавит: Алфавит, включающий в себя буквы базового алфавита, а также буквы, употребляемые лишь некоторыми языками, письменность которых основана на алфавите определенного типа.
Примечание - В настоящем стандарте в качестве расширенного латинского алфавита принят набор символов, установленный ГОСТ 7.28, и в качестве расширенного кирилловского алфавита - набор букв - по ГОСТ 7.29;
3.13 диакритический знак: Графический символ, добавляемый к букве сверху или снизу или наносимый на изображение буквы для изменения ее начертания и функций в системе письма;
3.14 диакритика: Система диакритических знаков.
4 Общие положения
4.1 Настоящий стандарт является одним из серии международных и национальных стандартов, устанавливающих правила конверсии систем письма с целью обеспечения международного обращения письменных сообщений как в автоматизированных информационных и коммуникационных системах, так и при интеллектуальной обработке, требующей точного и однозначного представления текстовых данных, созданных на одном языке, средствами другого языка.
Такие правила должны обладать следующими необходимыми свойствами:
- однозначностью, обеспечивающей стабильность представления элементов исходной письменности (букв, слов, выражений) средствами другой (конвертирующей) письменности;
- обратимостью, обеспечивающей возможность однозначного точного восстановления текста на исходном языке;
- простотой, обеспечивающей автоматическое выполнение процедуры перехода от исходного текста к конвертированному и обратно на основе простых алгоритмов, преимущественно сводящихся к применению таблиц замены знаков одной системы письма знаками другой системы письма.
При применении правил конверсии могут не всегда соблюдаться требования звукового соответствия знаков конвертируемых систем письма, эстетические соображения и традиционные нормы, хотя в каждом отдельном случае желательна разработка таких правил, чтобы нарушение традиционных, фонетических и эстетических норм было минимальным. Однако каждый, кто знает исходный язык и правила конверсии, имеет возможность восстановить исходный текст и прочитать его по правилам исходного языка.
Для алфавитных систем письма способом, удовлетворяющим сформулированным выше требованиям, является транслитерация.
4.2 Устанавливают две системы транслитерации кирилловских алфавитов латинскими буквами:
А) с использованием диакритики - см. раздел 5,
Б) с использованием буквосочетаний - см; раздел 6.
Использование системы А или Б определяет орган, производящий транслитерацию, и это должно быть указано в сопроводительных материалах к документу. В составе одного документа следует использовать только одну систему, либо каждый раз вид транслитерации оговаривать особо и обозначать специальными указателями в тексте. Исключение из этого правила делается только для документов, в которых цитируются тексты, транслитерируемые в другом (цитируемом) документе, с указанием источника цитирования.
4.3 Транслитерированный текст на машиночитаемых носителях должен быть снабжен указателями, определяющими его границы, исходную письменность и способ транслитерации. Спецификация таких указателей должна быть задана стандартами на язык разметки структуры документов.
4.4 Небуквенные знаки письма (знаки препинания и др.), указанные в приложении Б, при транслитерации сохраняются, как правило, без изменения.
При отсутствии нужных символов в печатающем устройстве используют символы, предусмотренные ГОСТ 27465, при этом допускается:
- изменять вид кавычек (вместо открывающих строчных кавычек использовать подстрочные кавычки либо надстрочные кавычки, а вместо закрывающих строчных кавычек использовать надстрочные кавычки);
- заменять тире дефисом, окруженным с двух сторон пробелами;
- заменять многоточие тремя последовательными точками;
- заменять символ номера знаком # или сочетанием No.
Не допускается заменять верхние кавычки двумя апострофами или двумя ударениями, а нижние - двумя запятыми.
5 Система А - транслитерация с использованием диакритики
5.1 Транслитерация с использованием диакритики (система А) является строгой транслитерацией. Она задает единое для всех языков, указанных в приложении А, отображение расширенного кирилловского алфавита на расширенный латинский алфавит. Для славянских языков это отображение показано в таблице 1, для неславянских - в таблице 2.
5.2 Транслитерация дополнительных букв славянских языков, которые не вошли в таблицу 1, но употребляются в особых случаях, задается таблицей 2.
5.3 Заглавные (прописные) буквы кирилловских алфавитов транслитерируют соответствующими заглавными (прописными) буквами латинского алфавита, строчные буквы транслитерируют строчными. Не допускается заменять заглавные (прописные) буквы с диакритическими знаками буквами без диакритики.
5.4 Арабские цифры 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 при транслитерации сохраняются без изменений.
Римские цифры I, V, X, С, М, L, D и их комбинации транслитерации не подлежат. Они должны быть выделены из транслитерируемого текста специальными указателями.
5.5 Таблица 3 определяет обратный переход от транслитерированного текста к исходному.
Таблица 1 - Транслитерация славянских алфавитов по системе А
Продолжение таблицы 1
Продолжение таблицы 1
Продолжение таблицы 1
Окончание таблицы 1
Таблица 2 - Транслитерация неславянских алфавитов по системе А
Таблица 3 - Ретранслитерация по системе А
6 Система Б - транслитерация с использованием буквосочетаний
6.1 Транслитерация с использованием буквосочетаний (система Б) является ослабленной транслитерацией. Она задает для каждой кирилловской буквы представление в виде одной буквы основного (ограниченного) латинского алфавита или в виде такого сочетания букв, которое не может встретиться в тексте иначе чем при представлении данной буквы.
В состав используемых для транслитерации букв входят:
а, b, с, d, е, f, g, h, i, j, k, I, m, n, о, p, q, r, s, t, u, v, w, x, y, z, (апостроф),`(слабоеударение),атакжезнакипрепинанияи специальные знаки, используемые распространенными массовыми печатающими устройствами.
6.2 Для каждого языка разрабатывается специальная таблица транслитерации, в максимальной степени учитывающая фонетические и графические особенности данного языка. Таблица 4 определяет переход от кирилловских букв к латинским для славянских языков: русского, белорусского, украинского, болгарского и македонского. Представление сербохорватского текста латинскими буквами осуществляется при помощи национальной латинской системы письма, используемой в этом языке наряду с кириллицей.
Системы транслитерации с использованием буквосочетаний для неславянских языков должны быть установлены отдельными (национальными) стандартами.
6.3 При транслитерации заглавных (прописных) букв буквосочетанием в транслитерированном тексте заглавный (прописной) вариант выбирается только для первой буквы сочетания, если в данном слове имеются строчные. Если все буквы исходного слова заглавные (прописные), то в транслитерированном слове заглавными пишут все буквы сочетания.
6.4 В таблицу 4 включены также ныне не используемые буквы , , , , которые прежде широко употреблялись в славянских языках и могут потребоваться для передачи текстов, написанных по старой орфографии.
Таблица 4 - Транслитерация славянских алфавитов по системе Б
Окончание таблицы 4
6.5 Однозначная обратимость таблицы 4 обеспечивается специфическим употреблением латинских букв h, у, с и символа `. Буквы h, у не означают сами по себе никаких кирилловских букв и употребляются только в буквосочетаниях.
6.6 Для кирилловских букв Ц и I установлены два варианта транслитерации.
Ц передается либо латинской С, либо сочетанием CZ. Рекомендуется употреблять С перед буквами I, Е, Y, J, а в остальных случаях - CZ.
Кирилловская I в украинском и белорусском языках всегда передается через латинскую I. Также она передается в русских и болгарских текстах, написанных по старой орфографии, где она, как правило, употребляется перед гласными буквами. В редких случаях употребления ее перед согласной (например, в слове "мiрь"), она передается сочетанием .
6.7 Таблица 5 определяет обратный переход от транслитерированного текста к исходному. Она предполагает замену на кирилловские буквы сначала трехсимвольных сочетаний, затем двухсимвольных и, наконец, одиночных букв. В таблицу 5 включены также некоторые написания, не предусмотренные таблицей 4, но реально встречающиеся на практике.
Таблица 5 - Ретранслитсрация по системе Б
Окончание таблицы 5
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Межгосударственный стандарт ГОСТ 7.79-2000 (ИСО 9-95) "Система стандартов по информации, библиотечному и издательскому делу. Правила транслитерации кирилловского письма латинским алфавитом" (введен в действие постановлением Государственного комитета Российской Федерации по стандартизации и метрологии от 4 сентября 2001 г. N 371-ст)
Дата введения - 1 июля 2002 г.