CrossLingua’2013 < 11 — 15.05.13 < Ukraine, Crimea, Parthenit

МЕТОДЫ АВТОМАТИЗАЦИИ ПРОЦЕССА ДЕШИФРОВКИ ЗНАМЕННЫХ ПЕСНОПЕНИЙ

Андрей Юрьевич Филиппович

кандидат технических наук, доцент

МГТУ им. Н.Э. Баумана

Москва, Россия

E-mail: philippovich@list.ru

Марина Владимировна Даньшина

аспирантка

МГТУ им. Н.Э. Баумана

Москва, Россия

E-mail: marina_danshina@mail.ru

 

 


Современная технология записи нот на линейках проста в понимании и позволяет передать мелодии с высокой точностью, однако до ее изобретения и повсеместного распространения использовались другие музыкальные системы. Например, в певческой культуре Древней Руси широко использовалась знаменная нотация, которая состояла из множества специальных знаков, называемых крюками или знаменами. Они имели сложную структуру и соответствовали комбинации нот различной высоты и длительности.

Первые музыкальные рукописи – церковные песнопения   не содержали подсказок исполнителю о высоте или длительности нот, что вызывало трудности для правильного исполнения, поэтому в более поздние музыкальные записи стали добавлять специальные пометы. Распространение нотолинейных музыкальных систем привело к появлению специальных книг (азбук), в которых фиксировались правила расшифровки (дешифровки) знамен и их комбинаций, а также особого класса рукописей – двузнаменников (двознаменников), которые содержали описания правил исполнения в двух нотациях – знаменной и линейной.

Такие книги можно считать аналогами параллельных корпусов текстов на разных языках, и именно они являются главным источником информации для расшифровки знаменных песнопений. Общее количество знамен, с помощью которых производилась запись, оценивается по-разному. В нашем исследовании было экспериментально выявлено более 200 различных знамен, которые могут переводиться одной или несколькими нотами. Помимо этого следует учитывать, что рукописи содержат специальные структуры (фиты, лица), которые как и фразеологизмы в тексте необходимо интерпретировать особенным образом.

Для расшифровки древних безлинейных нотаций применяются два подхода:

Первый подход затруднен тем, что имеющиеся двузнаменники и азбуки неполны и противоречивы, а их всесторонний анализ трудно реализуем без средств автоматизации. В рамках второго подхода требуется построение динамической модели развития музыкальных систем записи, с научно обоснованным указанием причин и механизмов тех или иных изменений. Подобная исследовательская деятельность еще более сложна для формализации, т.к. требует работы с большим количеством исторических фактов, которые представлены в многочисленных древних рукописях и могут быть по разному интерпретированы.

В рамках проекта «Компьютерная семиография» (semio) для дешифровки знаменных песнопений предлагается использовать методы машинного перевода (МП), которые можно разделить на три основные группы:

Несмотря на полувековую историю МП и множество исследований в области лингвистики, на сегодняшний день еще не созданы системы автоматического перевода с одного языка на другой, способные заменить человека. В области компьютерной расшифровки древнерусских музыкальных рукописей делаются только первые шаги, да и музыкальные модели менее изучены, поэтому и здесь реализовать полностью автоматическую систему перевода из одной нотации в другую пока невозможно. В связи с этим в проекте «Компьютерная семиография» реализуются задачи по созданию конкретных инструментов, позволяющие автоматизировать рутинные операции и проводить проверку различных гипотез.

При поддержке гранта Российского гуманитарного научного фонда №110412025в "Автоматизированная система научных исследований в области компьютерной семиографии (АСНИ КС)" был разработан ряд сервисов, предназначенных для экспертов в области музыкальной медиевистики, которые помогают осуществлять перевод из знаменной в нотолинейную нотацию, и обосновывать его научно.

На их основе была спроектирована компонентная методика автоматизированной дешифровки, которая включает модели, методы, алгоритмы, реализованные программные комплексы, результаты статистических исследований и рекомендации, а также шрифты, технологии ввода и структуры данных, которые учитывают специфику знаменной нотации.

Для автоматизации задач перевода в качестве основных исходных данных были выбраны четыре типа музыкальных рукописей:

Для обработки каждого типа рукописей предложены отдельные инструменты и технологии. Например, для перевода на основе азбук можно составить список продукционных правил с приоритетами и осуществить экспериментальную дешифровку в музыкальном проигрывателе, который показывает результаты перевода не только визуально, но и дает возможность проанализировать мелодию на слух. Приоритеты используются в тех случаях, когда при дешифровке нужно переводить сочетания знамен.

Для анализа двузнаменников разработаны и апробированы различные технологии статистического перевода:

В перспективе планируется дополнить механизмы перевода методами синтаксического анализа, построенными на основе выявленных моделей, а также разработать возможность гибкой настройки параметров дешифровки.