VALID – cистема идентификации и синхронизации видео- и аудиосигналов
Многие считают, если звук и изображение записываются или передаются одновременно, то проблем с их синхронизацией не возникает, однако, временные задержки могут происходить и в этом случае. Чаще всего они обусловлены синхронизацией кадровой памяти (framestore synchronizer), при которой единичный кадр видео сохраняется, перенастраивается для синхронизации с определенным опорным сигналом, и только затем выдается. Устройство, обеспечивающее эти процессы, может создавать задержки в последовательности видео до одного кадра — 1/25-ой секунды (в системах с 625 строками). В процессе обработки видео на разных этапах передачи может быть использовано подобных устройств, и каждое будет привносить дополнительные задержки.
Синхронизатор памяти кадров — не единственное устройство, которое может вызывать подобную проблему. Большая часть оборудования, предназначенного для обработки видео, будет добавлять задержки — иногда на незначительные доли секунды, а порой и до целого кадра. Даже такие простые устройства, как видеомагнитофоны, могут добавлять незначительные задержки видео, так как в видеомагнитофоне для коррекции временных искажений на выходе используется сохранение кадра в памяти.
На нарушение синхронизации звука и изображения могут оказывать влияние и другие факторы. Так, компрессионные системы создают группы картинок (иногда с использованием нескольких кадров), в результате возникают присущие видео задержки, которых нет у аудио. Для таких систем задержки более чем на 120 миллисекунд не являются чем-то необычным. Поэтому после прохождения по технологической линии суммарные временные расхождения могут достигать 10 — 15 кадров. Согласно же рекомендациям Международного союза по телекоммуникациям (ITU), допустимое суммарное расхождение при речевой синхронизации составляет +2 — -1 кадр, а расхождение +4 — -2 кадра уже являются «субъективно раздражающими». Если аудио отстает от видео, то такое расхождение обозначается «+Х кадров», а если аудио убегает вперед по отношению к видео, то расхождение обозначается «-Х кадров».
Электронный нумератор-хлопушка (Clapper Board)
В киноиндустрии проблема речевой синхронизации была решена много лет тому назад с помощью простого устройства — нумератора-хлопушки. Среди отдельных кадров киноленты всегда можно найти точный кадр, на котором рычаг нумератора-хлопушки замкнет контакт. Если определить соответствующий ему звуковой эквивалент на аудиозаписи, то можно считать, что синхронизация выполнена.
Упорядоченное расположение маркеров синхронизации использовалось и для видеоприложений. Обычно видеонумератор-хлопушка содержит данные об обрабатываемом фрагменте и отображает тайм-код, который будет записан для видео- и аудио. Поэтому подбор соответствующих значений тайм-кода для видео- и аудиосоставляющих обеспечивает синхронизацию этих сигналов. Недостатком такого варианта решения, является то, что синхронизация не может быть реализована в режиме реального времени. Тем не менее, нумератор-хлопушка послужила хорошей моделью для создания системы VALID, предназначенной для идентификации и синхронизации идентификации.
Расширенные возможности
Если создавать сигнал, который может быть использован для подтверждения речевой синхронизации, то было бы не плохо расширить его возможности. Например, если какие-либо из устройств, предназначенных для сохранения кадровой памяти и ответственных за задержки видео, находятся в режиме «заморозки» (freeze mode), то хорошо бы знать об этом. В этом случае движущееся изображение предстанет «застывшим», но определить «заморожены» ли контрольные цветные полосы невозможно. А поскольку кадровые синхронизаторы могут генерировать на выходе обратную последовательность кадров, в результате чего происходят потери в разрешении и качестве изображения (картинки), возможность определения правильной последовательности кадров будет очень полезной. Некоторые виды компрессии (например, MPEG-1) воздействуют только на единичный кадр, поэтому возможность определения последовательности кадров будет полезна и в этом случае.
Не лишней будет и возможность определения любых сдвигов или искажений в размере картинки или ее расположении, которые могут возникать в результате различных процессов преобразования сигнала. Так, конвертеры соотношения сторон кадра, если их правильно не отрегулировать, также могут привносить искажения, поэтому важно быть уверенным в том, что сигнал был преобразован корректно. А так как после прохождения через электронный нумератор-хлопушку сигнал будет содержать и какую-то часть аудиоинформации, то почему бы ни сделать так, чтобы получать подтверждение о совместном усилении сигнала по каналу перемодуляции без инверсии фазы или перестановки каналов.
Основополагающие элементы сигнала VALID уже используются многочисленными телевизионными вещательными корпорациями. Речь идет о звуковом тональном сигнале с прерываниями (иногда называют тональным сигналом GLITS) и тестовом шаблоне со сжатыми полосами и временными отметками, которая применяется в качестве базового теста в случае преобразования сторон кадра (Aspect Ratio Conversion). Компания Vistek отдает должное BBC и другим организациям, принимавшим участие в разработке этих сигналов.
Главное преимущество системы VALID заключается в том, что в ней все эти элементы объединены в одном сигнале, который используется для тестирования и идентификации.
Сигнал VALID состоит из двух компонентов — видео и тонового аудио. Видеосигнал соответствует всем требованиям, которые предъявляются к видео с 525 или 625 строками, и будет пропускаться любыми электронными устройствами, сконструированными для работы с такими сигналами, поэтому его можно легко записать на пленку или диск. Аудиосигнал, как правило, содержит стерео (левый и правый) сигналы и может представлять собой две AES пары.
Использование сигнала VALID в качестве электронного нумератора-хлопушки заключается в выводе на экран движущегося шаблона с расположенной в центре картинкой, который позволяет легко определить синхронизацию аудиосигнала (рис. 1). Вращающийся маркер («хвост кометы») совершает полный оборот за 4 секунды. Когда точно на 375 миллисекунд прервется тоновый аудиосигнал в левом канале, начало «хвоста кометы» будет находиться в верхней «мертвой» точке круга. Через 750 миллисекунд тоновый аудиосигнал в правом канале опять прервется на 375 миллисекунд (рис. 2). Так как в левом канале происходит одно прерывание, а в правом — два, различить их очень просто.
Вращающийся по кругу «хвост кометы» и связанное с ним прерывание аудиосигнала позволяют быстро визуально оценить задержку аудио. Но для ее точного расчета в самом начале первой задержки для 1-го кадра генерируется черный перекрестный шаблон (black cross pattern). В системе VALID предусмотрен считывающий модуль, который определяет и выводит на экран точное значение задержки и пересылает это значение в модуль задержки аудио для коррекции.
Так как сигнал VALID может передаваться по четырем аудиоканалам аудио (2 пары AES), то каждая пара левого и правого сигналов имеет разные тональные частоты: первая – 997 Гц (AES 1), вторая – 440 Гц (AES 2). А так как распределение прерываний по времени точно прокалибровано, появляется возможность для определения фазовой инверсии для любого канала.
Версия сигнала VALID для соотношения сторон кадра 16:9 представлена на рис. 1. По форме круга, который расположен в центре, можно легко определить, отличается ли сигнал, выводимый на экран от соотношения сторон монитора (в случае отличий круг становится сжатым с боков или сплюснутый). А движущийся по кругу маркер «хвост кометы», дает возможность увидеть, не «замораживается» ли сигнал.
На рис.3 показана версия сигнала VALID для соотношения сторон кадра 4:3. Здесь также используется круг с маркером «хвост кометы», этот шаблон работает по тому же принципу, что и электронный нумератор-хлопушка. Дополнительные маркеры, присутствующие на экране, позволяют увидеть ошибки, возникающие при преобразовании этого сигнала в сигнал с соотношением сторон кадра 16:9.
увидеть относительное положение пауз в звуковом тональном сигнале, используемого для работы нумератора-хлопушки, вместо маркера «хвост кометы» используется его альтернативная версия в виде трех раздельных полос, вращающихся в кольце (рис. 4). Красная полоса начнет двигаться с верхнего «мертвого» центра в момент начала прерывания аудиосигнала в левом канале и достигнет нижнего «мертвого» центра в момент его окончания. Первая из зеленых полос позволяет по тому же принципу определять прерывания в правом канале. Данная версия представления сигналов особенно удобна, если в левом и правом каналах используются различные прерывания.
Рис. 4 VALID генератор видеосигнала с соотношением сторон 4:3 с трехполосным шаблоном
(Bar Pattern) вместо маркера «хвост кометы» (Comet Tail).
Грубые ошибки в соотношении сторон кадра можно легко определить по форме центрального круга. Но при изменении масштаба, позиционировании изображения или гашении часто возникают незначительные отклонения от стандартных значений, идентифицировать которые по форме центрального круга достаточно сложно. Тем не менее, подобные ошибки могут оказаться весьма критичными и заметными для зрителя.
Поэтому на картинке, которая выводится на экран генератором VALID, предусмотрено несколько маркеров, которые помогают оценить, насколько правильно выполнено любое преобразования. Два маркера разных оттенков зеленого расположены в углах «картинки» выходного сигнала с соотношением сторон 16:9. Они позволяют мгновенно определять, корректность преобразования сигнала 14:9 в сигнал 4:3. Т-образные маркеры, становятся видимыми в верхних и нижних углах изображения (рис. 5) при преобразовании соотношения сторон кадра к 4:3 или 14:9. В обоих случаях, если в отношении сигнала использовалось только цифровое гашение, должны быть различимы небольшие зеленые участки, если же применялось аналоговое гашение PAL, но их не будет видно тогда.
Рис. 5. VALID генератор: видеосигнал с соотношением сторон 16:9
был корректно преобразован в сигнал с соотношением сторон кадра 4:3.
Если преобразование проведено неправильно, это сразу же станет даже, если правильная форма центрального круга сохранится (рис. 6).
Горизонтальные линии, расположенные вверху и внизу сгенерированной VALID «картинки» для сигнала 4:3 могут использоваться для определения корректности преобразования в сигнал 16:9: при правильно выполненной операции пунктирные линии останутся видимыми (рис.7).
Для более точной оценки ошибок преобразования в каждой версии сгенерированной VALID сигналом «картинки» тщательно отслеживаются расположение и размеры вертикальных черных полос, поэтому на индикаторе формы сигналов или осциллографе можно увидеть осциллограмму определенной формы. Если преобразование из 16:9 в 4:3 прошло успешно, то осциллограмма будет иметь форму, похожую на ту, что представлена на рис. 8.
В этом случае использовалось изменение масштаба в 1,3333 раза — правильное значение для преобразования 16:9 в 4:3. При большем изменении масштаба, максимумы (вершины) в начале и в конце гашения будут более короткими (рис. 9).
При очень маленьком коэффициенте осциллограмма будет иметь более широкие и сглаженные максимумы (рис. 10).
Применение системы VALID
Компания Vistek разработала два рабочих элемента, выполненных в виде плагинов для системы VALID с модульным интерфейсом Vistek V1600 (Modular Interface System).
Генератор V1681 предназначен для генерирования видео и аудио VALID сигналов. Выходной сигнал в формате SDI может быть направлен в обход, что позволяет использовать этот модуль в режиме понижения скорости поток данных. Выходной сигнал можно использовать в качестве автономного (несинхронизированного) сигнала или в качестве опорного после синхронизации с входным сигналом. Выходной аудиосигнал может быть как цифровым, так и аналоговым, а также внедренным в выходной сигнал SDI. Наличие аудиовхода допускает введение синхронизации от внешнего звукового источника.
Для идентификации сигнала в генератор V1681 включен простой знакогенератор, который позволяет выводить на экран до четырех строк текста.
Эквивалентный считывающий модуль V1682 оборудован входами и выходами стандарта SDI, может генерировать входной цифровой, аналоговый или внедренный аудиосигнал, а также выходной аудиосигнал. Он может определять задержку аудиосигнала и выводить ее значение в кадрах или миллисекундах на переднюю панель или на любую систему дистанционного управления Vistek.
Считывающий модуль имеет собственный внутренний генератор для вывода видеосигнала на дисплей, который отображает гистограмму задержек аудио на устройствах, подключенных к выходу считывающего блока. Этот генератор позволяет измерять уровень входного аудиосигнала и выводить результаты измерений в виде частотной гистограммы.
Перспективы
Для различных организаций могут потребоваться разные варианты системы VALID. Это связано со степенью преобразования аудиосигналов (MIL и MOL). Поэтому компания Vistek планирует разработать варианты системы, позволяющие выводить на экран цифровое значение аналогового, а при необходимости и цифрового уровня, на который настроен генератор, а также информацию, указывающую на телевизионный стандарт исходного сигнала. Полезной была бы и возможность определения и отображения уровней видеосигналов, изменений в размере изображения и его позиционирования относительно первоначальных параметров. Целесообразно было бы также обеспечить некоторую степень автоматизации при применении коррекции, тогда при работе с системой управления Vistek, значение задержки автоматически передавалось бы в модуль задержки аудио Vistek для последующей компенсации.
Резюме
Система VALID объединяет несколько подходов в едином тестовом сигнале, который имеет широчайшую область применения. Она проста в использовании и позволяет выполнять как тестовые испытания, в которых важна точность измерений, так и мгновенно визуально идентифицировать возникшую проблему. Сигнал достаточно устойчив: обработка или запись не оказывают на исходный сигнал никакого воздействия, за исключением тех случаев, когда такие операции настроены некорректно, но это обнаруживается сразу же.
Компания Vistek намерена максимально широко рекламировать формат сигнала VALID, чтобы добиться одобрения его в качестве «стандарта» для оборудования, применяемого в телеиндустрии.