Information technology. Participant identifiers
Дата введения - 1 сентября 2013 г.
Введен впервые
Предисловие
Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. N 184-ФЗ "О техническом регулировании", а правила применения национальных стандартов Российской Федерации - ГОСТ Р 1.0-2004 г. "Стандартизация в Российской Федерации. Основные положения"
Введение
ИСО (Международная организация по стандартизации) и МЭК (Международная электротехническая комиссия) являются частью специализированной системы всемирной стандартизации. Национальные организации, которые являются участниками ИСО или МЭК, принимают участие в разработке международных стандартов посредством технических комитетов, основанных соответствующими организациями для работы в определенных областях технической деятельности. Сотрудничество технических комитетов лежит в сфере общих интересов. Другие международные организации, как государственные, так и коммерческие, поддерживают связь с ИСО и МЭК и также участвуют в их работе. В сфере информационных технологий ИСО и МЭК создали объединенный технический комитет - ИСО/МЭК СТК 1.
Международные стандарты разрабатываются в соответствии с правилами, описанными в директивах ИСО/МЭК, часть 2.
Главная задача объединенного технического комитета - подготовка международных стандартов. Предварительные проекты международных стандартов, утвержденные объединенным техническим комитетом, передаются в государственные организации для голосования. Для публикации международного стандарта требуется, как минимум, 75% голосов организаций, участвующих в голосовании.
Следует обратить внимание, что некоторые части международного стандарта могут быть объектом патентных прав. ИСО и МЭК не несут ответственность за идентификацию некоторых или всех таких патентных прав.
ИСО/МЭК 24703 был подготовлен объединенным техническим комитетом ИСО/МЭК СТК 1 "Информационные технологии", а именно подкомитетом SC 36 "Информационная технология для обучения, образования и подготовки".
От Российской Федерации функции постоянно действующего национального рабочего органа JTC1 ISO/IEC SC 36 выполняет ТК 461 "Информационно-коммуникационные технологии в образовании (ИКТО)", активно участвующий в разработке международных стандартов и осуществляющий разработку комплекса национальных стандартов ИКТО.
Цель настоящего стандарта - определение типа данных идентификаторов, применяемых для идентификации участников процессов обучения, образования и подготовки. Участниками могут быть пользователи, преподаватели, агенты, группы, организации, учреждения и т.д.
1 Область применения
Настоящий стандарт определяет типы данных идентификаторов, применяемых для идентификации участников процессов обучения, образования и подготовки.
Безопасность и защита анкетных данных, связанных с использованием идентификаторов участников, не рассматриваются в настоящем стандарте. Политика обозначения, регистрация и установление подлинности идентификаторов участников также выходят за рамки применения настоящего стандарта.
Примечание - При использовании идентификатора существует риск несанкционированного доступа к персональным данным и личной информации. Разработчик при введении в эксплуатацию идентификатора участника должен гарантировать его правомерное использование.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие международные стандарты. Для датированных документов используют только указанное издание. Для недатированных документов используют самое последнее издание ссылочного документа (с учетом всех изменений):
ИСО/МЭК 2382-1 Информационные технологии. Словарь. Часть 1. Основные термины (ISO/IEC 2382-1, Information technology - Vocabulary - Part 1: Fundamental terms)
ИСО/МЭК 10646 Информационные технологии. Универсальный набор кодированных символов (UCS) (ISO/IEC 10646, Information technology - Universal Coded Character Set (UCS))
ИСО/МЭКТО 10176 Информационные технологии. Руководящие указания по подготовке стандартов на языки программирования (ISO/IEC TR 10176, Information technology - Guidelines for the preparation of programming language standards)
ИСО/МЭК 11404 Информационные технологии. Типы данных общего назначения (GPD) (ISO/IEC 11404, Information technology - General - Purpose Datatypes (GPD)
3 Термины и определения
В настоящем стандарте применены следующие термины с соответствующими определениями:
3.1 абстрактный символ (abstract character): Кодовая комбинация УНС спектра согласно ИСО/МЭК 10646, которая не зависит от кодирования.
3.2 связывание (binding): Применение одной платформы или спецификации к другой или перенос с одной платформы или спецификации на другую.
3.3 тип данных (datatype): Набор определенных значений, характеризуемый свойствами этих значений и операциями с этими значениями.
3.4 кодирование (encoding): Формат представления информации в виде битов и байтов.
3.5 линия поведения, определяемая реализацией (implementation-defined behaviour): Неустановленная линия поведения, при которой выбор параметров документируется отдельно в каждой реализации.
3.6 идентификатор участника (participant identifier): Обозначение, связанное с участником.
Примечание - У участника может быть более одного идентификатора. Ограничение количества идентификаторов выходит за рамки настоящего стандарта.
3.7 сведения об участнике (participant information): Данные, связанные с участниками, отслеживаемые участниками, для участников и об участниках в информационных системах.
3.8 наименьший допустимый максимум; НДМ (smallest permitted maximum; SPM): Наименьшее максимальное значение величины, удовлетворяющее требованию.
Примечание - Примером НДМ может служить наименьшая допустимая максимальная длина поля X, равная 25.
3.9 универсальный набор символов; УНС (universal character set): Набор символов, определенный ИСО/МЭК 10646.
3.10 неустановленная линия поведения (unspecified behaviour): Способ выполнения работ, для которого стандарт предоставляет две или более возможностей и не налагает никаких требований в дальнейшем, т.е. при котором есть возможность выбора параметров.
4 Соответствие
Идентификатор участника должен соответствовать требованиям, определенным в разделах 5, 6 и 7 настоящего стандарта, а также по крайней мере одного из пунктов разделов 8 и 9.
5 Функциональность
Идентификатор участника представляет собой указатель.
Идентификатор участника должен быть представлен в виде легко произносимой печатной текстовой строки.
Примечания
1 С одним участником может быть сопоставлено несколько идентификаторов.
2 Последовательность из 10 цифр воспроизвести легче, чем последовательность из 256 символов латинского алфавита, набранных в разных регистрах.
6 Концептуальная модель
Идентификатор участника - последовательность абстрактных символов, связанная с участником. Сама последовательность не несет никакой информации, например, последовательность "35267901" не имеет какого-то конкретного смысла. Допускаются идентификаторы, напротив, содержащие информацию, например, "doe.john" или "building2 - doe.john".
Идентификатор участника может использоваться в различных контекстах, например, быть включенным в имена файлов, адреса веб-ресурсов или адреса электронной почты. В рамках информационных систем, управляющих сведениями об участниках, идентификаторы участников могут использоваться для связи хранилищ данных, чтобы обеспечить общие и/или объединенные методы идентификации.
7 Семантика
7.1 Компоненты идентификатора участника
Идентификатор участника состоит из сегментов, разделенных разделительными знаками сегмента. Сегмент идентификатора должен состоять из символов идентификатора из абстрактного набора символов. В качестве разделителя сегментов рекомендуется использовать символ "." (точка).
7.2 Тип данных
Идентификатор участника относится к типу данных "текстовая строка" (characterstring, ИСО/МЭК 10646). Наименьший допустимый максимум для идентификатора участника составляет 50 абстрактных символов.
Примечание - ИСО/МЭК 10646 определяет набор абстрактных символов, но не способ кодирования.
7.3 Допустимые абстрактные символы
Абстрактные символы идентификатора участника должны быть ограничены приведенным ниже набором. Символы перечислены в соответствии с их 16-битовыми шестнадцатеричными наименованиями в рамках Основной многоязычной системы УНС. Данное подмножество абстрактных символов основано на техническом отчете ИСО/МЭК ТО 10176.
7.3.1 Символы идентификатора
Нецифровые, неспециальные абстрактные символы по алфавитам:
- латинский: 0041-005A, 0061-007A, 00AA, 00BA, 00C0-00D6, 00D8-00F6, 00F8-01F5, 01FA-0217, 0250-02A8, 1E00-1E9B, 1EA0-1EF9, 207F;
- греческий: 0386, 0388-038A, 038C, 038E-03A1, 03A3-03CE, 03D0-03D6, 03DA, 03DC, 03DE, 03E0, 03E2-03F3, 1F00-1F15, 1F18-1F1D, 1F20-1F45, 1F48-1F4D, 1F50-1F57, 1F59, 1F5B, 1F5D, 1F5F-1F7D, 1F80-1FB4, 1FB6-1FBC, 1FC2-1FC4, 1FC6-1FCC, 1FD0-1FD3, 1FD6-1FDB, 1FE0-1FEC, 1FF2-1FF4, 1FF6-1FFC;
- кириллица: 0401-040C, 040E-044F, 0451-045C, 045E-0481, 0490-04C4, 04C7-04C8, 04CB-04CC, 04D0-04EB, 04EE-04F5, 04F8-04F9;
- армянский: 0531-0556, 0561-0587;
- иврит: 05B0-05B9, 05BB-05BD, 05BF, 05C1-05C2, 05D0-05EA, 05F0-05F2;
- арабский: 0621-063A, 0640-0652, 0670-06B7, 06BA-06BE, 06C0-06CE, 06D0-06DC, 06E5-06E8, 06EA-06ED;
- хинди (деванагари): 0901-0903, 0905-0939, 093E-094D, 0950-0952, 0958-0963;
- бенгальский: 0981-0983, 0985-098C, 098F-0990, 0993-09A8, 09AA-09B0, 09B2, 09B6-09B9, 09BE-09C4, 09C7-09C8, 09CB-09CD, 09DC-09DD, 09DF-09E3, 09F0-09F1;
- панджаби (гурмукхи): 0A02, 0A05-0A0A, 0A0F-0A10, 0A13-0A28, 0A2A-0A30, 0A32-0A33, 0A35-0A36, 0A38-0A39, 0A3E-0A42, 0A47-0A48, 0A4B-0A4D, 0A59-0A5C, 0A5E, 0A74;
- гуджарати: 0A81-0A83, 0A85-0A8B, 0A8D, 0A8F-0A91, 0A93-0AA8, 0AAA-0AB0, 0AB2-0AB3, 0AB5-0AB9, 0ABD-0AC5, 0AC7-0AC9, 0ACB-0ACD, 0AD0, 0AE0;
- ория: 0B01-0B03, 0B05-0B0C, 0B0F-0B10, 0B13-0B28, 0B2A-0B30, 0B32-0B33, 0B36-0B39, 0B3E-0B43, 0B47-0B48, 0B4B-0B4D, 0B5C-0B5D, 0B5F-0B61;
- тамильский: 0B82-0B83, 0B85-0B8A, 0B8E-0B90, 0B92-0B95, 0B99-0B9A, 0B9C, 0B9E-0B9F, 0BA3-0BA4, 0BA8-0BAA, 0BAE-0BB5, 0BB7-0BB9, 0BBE-0BC2, 0BC6-0BC8, 0BCA-0BCD;
- телугу: 0C01-0C03, 0C05-0C0C, 0C0E-0C10, 0C12-0C28, 0C2A-0C33, 0C35-0C39, 0C3E-0C44, 0C46-0C48, 0C4A-0C4D, 0C60-0C61;
- каннада: 0C82-0C83, 0C85-0C8C, 0C8E-0C90, 0C92-0CA8, 0CAA-0CB3, 0CB5-0CB9, 0CBE-0CC4, 0CC6-0CC8, 0CCA-0CCD, 0CDE, 0CE0-0CE1;
- малаялам: 0D02-0D03, 0D05-0D0C, 0D0E-0D10, 0D12-0D28, 0D2A-0D39, 0D3E-0D43, 0D46-0D48, 0D4A-0D4D, 0D60-0D61;
- тайский: 0E01-0E3A, 0E40-0E5B;
- лаосский: 0E81-0E82, 0E84, 0E87-0E88, 0E8A, 0E8D, 0E94-0E97, 0E99-0E9F, 0EA1-0EA3, 0EA5, 0EA7, 0EAA-0EAB, 0EAD-0EAE, 0EB0-0EB9, 0EBB-0EBD, 0EC0-0EC4, 0EC6, 0EC8-0ECD, 0EDC-0EDD;
- тибетский: 0F00, 0F18-0F19, 0F35, 0F37, 0F39, 0F3E-0F47, 0F49-0F69, 0F71-0F84, 0F86-0F8B, 0F90-0F95, 0F97, 0F99-0FAD, 0FB1-0FB7, 0FB9;
- грузинский: 10A0-10C5, 10D0-10F6;
- хирагана: 3041-3093, 309B-309C;
- катакана: 30A1-30F6, 30FB-30FC;
- чжуинь фухао: 3105-312C;
- универсальные идеограммы CJK: 4E00-9FA5;
- корейский (хангыль): AC00-D7A3.
7.3.2 Цифры идентификатора
Цифровые символы идентификатора: 0030-0039, 0660-0669, 06F0-06F9, 0966-096F, 09E6-09EF, 0A66-0A6F, 0AE6-0AEF, 0B66-0B6F, 0BE7-0BEF, 0C66-0C6F, 0CE6-0CEF, 0D66-0D6F, 0E50-0E59, 0ED0-0ED9, 0F20-0F33.
7.3.3 Специальные символы
Специальные символы: 005F, 00B5, 00B7, 02B0-02B8, 02BB, 02BD-02C1, 02D0-02D1, 02E0-02E4, 037A, 0559, 093D, 0B3D, 1FBE, 203F-2040, 2102, 2107, 210A-2113, 2115, 2118-211D, 2124, 2126, 2128, 212A-2131, 2133-2138, 2160-2182, 3005-3007, 3021-3029.
7.4 Кодирующие символы
Для кодирования используется следующий набор символов:
A B C D E F G H I J K L M
N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m
n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 _ -
Примечания
1 Набор кодирующих символов должен быть гармонизирован со спецификацией IETF RFC 2396.
2 Символ "%" (процент) используется в кодировании идентификаторов участников, но не входит в состав набора кодирующих символов.
8 Связывание
8.1 Экземпляр данных
Каждый идентификатор участника кодируется массивом байт.
8.2 Связывание с платформой C, C++
Приложения и программные среды, для которых необходимо согласование с синтаксисом языков программирования C/C++, должны использовать базовый тип "символ" (или совместимый с ним) для структур, указателей, массивов и функций, в которых хранится идентификатор участника.
Примечание - Если используется 7-битовое кодирование в среде C/C++, то требование к наименьшему допустимому максимуму подразумевает, что длина идентификатора участника должна быть не менее 501 символа: ("%U" + 8 шестнадцатеричных цифр) 50 + 1 завершающий пустой символ.
8.3 Связывание с платформой Java
Приложения и программные среды, для которых необходимо согласование с синтаксисом языка программирования Java, должны использовать тип "строка" (или совместимый с ним) для классов, массивов и методов, в которых хранится идентификатор участника.
8.4 Связывание с платформой ECMAScript (JavaScript)
Приложения и программные среды, для которых необходимо согласование с синтаксисом языка программирования ECMAScript (JavaScript), должны использовать тип "строка" (или совместимый с ним) для массивов и функций, в которых хранится участвующий идентификатор.
9 Кодирование
При связывании с другими языковыми системами должно использоваться кодирование, определенное в настоящем разделе.
Примечание 1 - Приложения и пользовательские интерфейсы могут позволить вход и показ этих участвующих идентификаторов в формах, более естественных для восприятия людьми, например, экран входа в систему для японского пользователя может использовать только символы Кандзи, при этом специальное приложение преобразовывает эти символы Кандзи в формат кодирования идентификатора участника.
Идентификатор участника должен использовать одну из следующих схем кодирования символов для каждого абстрактного символа. Символ "h" обозначает 4 бита информации в виде шестнадцатеричной цифры (0-9, A-F, без учета регистра).
Абстрактные символы, которые входят в набор кодирующих символов, могут представлять сами себя.
Абстрактные символы в диапазоне от 0000 до 00FF в УНС могут использовать следующую схему кодирования:
%hh,
где "h" обозначает один символ в шестнадцатеричной системе.
Абстрактные символы в диапазоне от 0000 до FFFF в УНС могут использовать следующую схему кодирования:
%uhhhh,
где "h" обозначает один символ в шестнадцатеричной системе, а "u" - строчная буква.
Абстрактные символы в диапазоне от 00000000 до FFFFFFFF в УНС могут использовать следующую схему кодирования:
%Uhhhhhhhh,
где "h" обозначает один символ в шестнадцатеричной системе, а "U" - прописная буква.
Примечания
2 Эти схемы кодирования гармонизированы с существующими стандартами и спецификациями C, C++, Java, и IETF.
3 Приведенные схемы допускают применение 7-битного формата данных для кодирования идентификаторов участников, основанных на наборе символов УНС. Возможны реализации с индивидуальной классификацией без использования символа "%", но с использованием прямых методов, если наборы символов допускают это. Например, символы Unicode могут использоваться без перекодировки (никакого преобразования с "%uhhhh"), если для передачи данных применяется набор УНС-2.
4 Настоящий стандарт не отдает предпочтения какой-либо определенной схеме кодирования. Схема кодирования выбирается исходя из реализации.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Национальный стандарт РФ ГОСТ Р ИСО/МЭК 24703-2011 "Информационная технология. Идентификаторы участников" ISO/IEC 24703:2004. Information technology - Participant identifiers (IDT)" (утв. и введен в действие приказом Федерального агентства по техническому регулированию и метрологии от 13 декабря 2011 г. N 1245-ст)
Дата введения - 1 сентября 2013 г.
Текст ГОСТа приводится по официальному изданию Федерального агентства по техническому регулированию и метрологии, Москва, Стандартинформ, 2013 г.
Сведения о стандарте
1 Подготовлен Федеральным государственным бюджетным образовательным учреждением высшего профессионального образования "Московский государственный технологический университет "СТАНКИН"на основе собственного аутентичного перевода на русский язык стандарта, указанного в пункте 4
2 Внесен Техническим комитетом по стандартизации ТК 461 "Информационно-коммуникационные технологии в образовании (ИКТО)"
3 Утвержден и введен в действие Приказом Федерального агентства по техническому регулированию и метрологии от 13 декабря 2011 г. N 1245-ст
4 Настоящий стандарт идентичен международному стандарту ИСО/МЭК 24703:2004 "Информационная технология. Идентификаторы участников" (ISO/IEC 24703:2004 "Information technology - Participant identifiers")
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА
5 Введен впервые