Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение А
(обязательное)
Требования
к тестовым данным 1
Тестовые данные формируют на основании заданного списка команд управления и включают пары аудио- и текстовых файлов, содержащие произнесение и текст голосовой команды соответственно.
Объем тестовых данных определен количеством команд в заданном списке команд управления и количеством дикторов (каждая команда должна быть произнесена каждым диктором).
При формировании тестовых данных должны быть учтены следующие требования:
- все голосовые команды должны быть исполнены на одном языке носителями данного языка;
- количество дикторов должно быть не менее 20: одинаковое количество мужчин и женщин в возрасте от 20 до 50 лет;
- темп речи должен соответствовать средним значениям для выбранного языка (например, для русского языка темп должен составлять от 80 до 120 слов в минуту);
- в речи дикторов должны отсутствовать выраженные дефекты произнесения;
- все аудиозаписи должны быть приведены к единому формату [рекомендуемый формат - Windows PCM (*.wav), 16 кГц, 16 бит];
- длительность пауз не должна превышать 500 мс;
- отношение сигнал/шум аудиофайлов должно соответствовать одному из условий таблицы А.1 и должно быть выбрано исходя из наиболее похожих условий, предполагаемых в качестве стандартных для работы системы распознавания голосовых команд.
Таблица А.1 - Акустические условия записи
Условие |
Описание |
ОСШ 1, дБ |
Офисное акустическое окружение |
Офис, т.е. комната, в которой люди работают за письменным столом, обычно или возможно с компьютером |
Более 20 |
Домашнее акустическое окружение |
Жилое помещение, т.е. комната с мебелью, местами. Могут присутствовать телевизор или аудиоустройства |
От 10 до 20 |
Общественное место |
Внушительного размера помещение (холл) или улица, где обычно присутствует большое количество людей |
От 10 до 15 |
Автомобиль |
Салон автомобиля |
5-15 |
Сложные условия |
Высокий уровень внешних шумов, например военный полигон, техника, производящая сильный шум |
Менее 7 |
1 Отношение сигнал/шум. |
Для той команды, которая содержит один или несколько параметров, каждый диктор должен записать по одной реализации. Если диапазон значений параметров команды превышает количество дикторов, каждый диктор фиксирует уникальную реализацию данной команды, в противном случае записывают все возможные реализации, часть которых может быть произнесена несколькими дикторами.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.