Исследование особенностей дискового планирования серверов мультимедиа

М. С. Косяков, А. А. Петров (Санкт-Петербург)

1. Введение

При организации сервера, обеспечивающего хранение и предоставляющего доступ как к традиционным текст-ориентированным, так и к мультимедийным данным, возможны два принципиально различных подхода [1]:

·        сервера раздельной архитектуры, выделяющие независимый пул ресурсов (дисковый массив и оперативную память) для данных каждого типа;

·        сервера интегрированной архитектуры, предоставляющие свои ресурсы для совместного использования данными обоих типов.

Из-за возможности динамического выделения ресурсов сервера интегрированной архитектуры являются предпочтительными в случае изменяющейся во времени нагрузки. Кроме того, в данном случае на обслуживание каждого запроса выделяется больше ресурсов, что обеспечивает лучшую производительность сервера [2]. Однако необходимость единой поддержки различных типов данных с различными требованиями к их воспроизведению и наличие механизмов предотвращения их взаимного влияния друг на друга (обслуживание запросов к текстовым данным не должно влиять на качество воспроизведения мультимедийных объектов) приводят к усложнению методов организации данных и способов доступа к ним.

Большинство современных подходов основывается на стратегии разбиения мультимедийных объектов согласно постоянному шагу данных [3] и организации файлов в виде последовательности логических блоков фиксированного размера (кластеров) [4, 5]. В свою очередь метод разбиения мультимедийных объектов согласно постоянному шагу времени воспроизведения [3] сильно упрощает поддержку компрессированных мультимедийных данных и реализацию алгоритма контроля допустимости. По сравнению с блочной организацией мультимедийных файлов этот метод приводит либо к меньшим потерям дискового пространства для случая блока большого размера, либо к более высокой производительности сервера для случая блока небольшого размера [3].

В связи с этим в данной работе рассматриваются методы дискового планирования серверов интегрированной архитектуры с размещением мультимедийных объектов согласно постоянному шагу времени воспроизведения. Предлагаются имитационные модели определения значений стохастических критериев качества обслуживания запросов к данным различных типов, а также нахождения среднего времени пребывания запросов к текстовым данным в подсистеме ввода/вывода. С их помощью проводится исследование влияния длительности периода обслуживания Т на производительность системы. При этом, в отличие от [6], указанный анализ осуществляется при рассмотрении различных типов входящего потока.

2. Параметры и характеристики моделирования

Для размещения мультимедийных данных в адресном пространстве подсистемы ввода/вывода соответствующие мультимедийные объекты разбиваются на фрагменты, соответствующие фиксированному времени воспроизведения Т. Каждый фрагмент целиком размещается на одном диске, и фрагменты, принадлежащие одному объекту, распределяются в циклическом порядке по набору дисков. Т. к. степень сжатия мультимедийных данных может меняться, фрагменты различаются по размеру даже в пределах одного и того же объекта, что требует поддержки со стороны файловой системы функций чтения/записи данных экстентами. Кроме того, экстентное размещение рассматривается также и для текстовых данных.

Подобная схема организации данных позволяет реализовать циклический метод доступа к данным, когда в течение каждого цикла с периодом Т для каждого из потоков считывается ровно один фрагмент независимо от различий в степени сжатия и скорости воспроизведения. Отсюда следует, что при указанном методе размещения данных величина периода Т является важным параметром, который определяется на этапе создания файловой системы: дальнейшее изменение его значения потребует остановки системы и полного перераспределения мультимедийных объектов.

С учетом приведенной схемы размещения данных в адресном пространстве подсистемы ввода/вывода в работе рассматриваются методы смешанного динамического и смешанного статического дискового планирования FCFS с дисциплиной обслуживания очереди запросов к диску LOOK [7]. Согласно указанным алгоритмам назначение на обслуживание запросов к текстовым данным осуществляется модулем контроля допустимости либо статически, основываясь на стохастической модели нахождения их времени пребывания, либо динамически, каждый раз вычисляя общее время пребывания всех выбранных из очереди запросов. Для выбора запросов из очереди используется дисциплина FCFS, позволяющая обеспечить минимальную дисперсию пребывания запросов этого типа в подсистеме ввода/вывода. В отличие от рассмотренного в [5] алгоритма дискового планирования Cello [8] указанные алгоритмы не разбивают цикл обслуживания на подпериоды, соответствующие обслуживанию отдельно запросов к текстовым данным и отдельно – к мультимедийным, т. е. обеспечивают «смешанное» обслуживание. В течение цикла запросы обслуживаются независимо от их типа согласно дисциплине LOOK. Тем самым увеличивается производительность работы диска и уменьшается вероятность возникновения разрыва в воспроизводимом потоке мультимедийных данных.

Описанные выше методы размещения данных и дискового планирования были реализованы в соответствующих имитационных моделях, при этом использовался язык имитационного моделирования GPSS.

В качестве структурных параметров модели использовались параметры, соответствующие жесткому диску IBM DDYS-T36950 [9]. Нагрузочные параметры описывались следующим образом:

·        часть нагрузки, создаваемая запросами к текстовым данным, описывается как простейший, эрланговский или гиперэкспонециальный поток с интенсивностью поступления запросов l;

·        часть нагрузки, создаваемая запросами к мультимедийным данным, описывается как замкнутая система с фиксированным мультипрограммным уровнем N;

·        размеры фрагментов запрашиваемых данных описываются случайной величиной, имеющей Гамма-распределение с параметрами, соответствующими распределению размеров html-файлов для запросов к текстовым данным и распределению размеров фрагментов MPEG2-объектов для мультимедийных запросов [10, 11];

·        номера цилиндров и секторов в пределах дорожки, адресуемых запросами, описываются случайными величинами, имеющими равномерное распределение.

 

При оценке производительности моделируемой системы использовались стохастические требования к качеству обслуживания запросов:

·        вероятность того, что время пребывания запроса к текстовым данным в дисковой подсистеме сервера uD превысит uDгар =2 сек., должна оставаться менее 0,01: PD = P(uD > uDгар) < 0,01;

·        вероятность того, что количество разрывов gK в потоке мультимедийных данных превысит значение 0,01 К на К циклов, должна оставаться менее 0,01:
PC = P(gK > 0,01K) < 0,01.

При сравнении производительности подсистемы ввода/вывода при статическом и динамическом ограничении числа запросов, выбираемых на обслуживание, в качестве модельной характеристики рассматривается среднее значение времени пребывания запросов к текстовым данным в подсистеме ввода/вывода M(TП).

При определении значения периода обслуживания Т = Тopt, позволяющего максимизировать производительность подсистемы ввода/вывода, под производительностью мы понимаем площадь области допустимой нагрузки, определяемой числом одновременно воспроизводимых мультимедийных потоков и значениями интенсивности поступления запросов к текстовым данным, которые могут поддерживаться системой в рамках требуемого качества обслуживания.

3. Сравнение производительности подсистемы ввода/вывода при статическом и динамическом ограничении числа запросов, выбираемых на обслуживание

На рис. 1 приведены зависимости среднего времени пребывания запросов в системе M(TП) от интенсивности их поступления l для случаев смешанного статического и смешанного динамического дискового планирования. Для первого случая значения М, ограничивающие количество запросов к текстовым данным, обслуживаемых за период, также определялись из экспериментов как максимально допустимые в рамках требуемого качества обслуживания. При этом рассматривался простейший входящий поток запросов.

Рис. 1. Зависимости среднего времени пребывания запросов в системе M(TП) от интенсивности их поступления l для случаев смешанного динамического и смешанного статического дискового планирования

Как видно, применение динамического ограничения числа запросов, выбираемых на обслуживание, позволяет получить почти в два раза большую производительность, чем при применении статического ограничения. В связи с этим, в дальнейшем в работе рассматривается именно метод смешанного динамического дискового планирования FCFS с дисциплиной обслуживания очереди запросов к диску LOOK.

4. Определение оптимального значения периода обслуживания

На рис. 2, 3 и 4 представлены графики, определяющие границу области допустимой нагрузки при различных значениях продолжительности периода обслуживания Т. По оси Ох откладывается максимально допустимое число одновременно воспроизводимых мультимедийных потоков Nmax, а по оси Оу максимально допустимая интенсивность поступления запросов к текстовым данным lmax. Таким образом, все точки (Nl), расположенные левее и ниже представленной границы, соответствуют нагрузкам, которые могут быть поддержаны дисковой подсистемой с требуемым качеством обслуживания; все точки, расположенные правее и выше кривой, соответствуют нагрузкам, поддержка которых с требуемым качеством обслуживания невозможна.

Как видно, при увеличении периода обслуживания Т до значения Тopt = 2,25 сек. происходит расширение (рис. 2а, 3a, 4a), а по превышении этого значения – сужение области допустимой нагрузки (рис. 2b, 3b, 4b) вне зависимости от типа входящего потока.  

Рис. 2. Области допустимых нагрузок, соответствующие различным значениям периода обслуживания Т; поток запросов к текстовым данным простейший, uDгар=2 сек

Рис. 3. Области допустимых нагрузок, соответствующие различным значениям периода обслуживания Т; эрланговское распределение интервалов поступления запросов к текстовым данным (коэффициент вариации n=0,25), uDгар=2 сек

Рис. 4. Области допустимых нагрузок, соответствующие различным значениям периода обслуживания Т; гиперэкспоненциальное распределение интервалов поступления запросов к текстовым данным (коэффициент вариации n=3), uDгар=2 сек

На рис. 5 представлены графики, определяющие границу области допустимой нагрузки при значении требуемого времени пребывания запросов к текстовым данным uDгар=1 сек. Как видно, в этом случае оптимальное значение периода обслуживания составляет Тopt = 1,15 сек. С учетом результатов, представленных на рис. 2, 3 и 4, следует сделать вывод, что для любых значений требуемого времени пребывания запросов к текстовым данным uDгар длительность периода обслуживания Тopt, позволяющая максимизировать площадь области допустимой нагрузки составляет около 115% от значения uDгар.

Рис. 5. Области допустимых нагрузок, соответствующие различным
значениям периода обслуживания Т; поток запросов
к текстовым данным простейший,
uDгар=1 сек  

Подобное поведение объясняется следующим образом. При увеличении длительности периода обслуживания Т соответственно возрастают размеры запрашиваемых фрагментов мультимедийных данных. Это приводит к снижению относительной доли накладных расходов, связанных со временем позиционирования читающих головок и, как следствие, увеличению пропускной способности диска. Кроме того возрастает среднее число запросов к текстовым данным, обслуживаемых за один период. Однако в течение периода запросы обоих типов обслуживаются безотносительно времени их поступления согласно дисциплине LOOK. Т. е. некоторое количество запросов к текстовым данным, поступивших с систему в течение предыдущего цикла, назначается на обслуживание только в конце текущего. В связи с этим с превышением длительности периода обслуживания Т значения uDгар растет доля текстовых запросов, время пребывания которых больше требуемого вследствие их назначения на обслуживание в конце периода. Таким образом, при увеличении длительности периода обслуживания Т сверх порогового значения Тopt пропускная способность дисковой подсистемы продолжает возрастать, однако качество обслуживания запросов к текстовым данным начинает снижаться, что приводит к необходимости уменьшения нагрузки.

На рис. 6 представлены зависимости вероятностей PD и PC от длительности периода обслуживания Т, отражающие данное поведение.

Рис. 6. Зависимости вероятностей PD и PC, определяющих критерии качества обслуживания, от длительности периода Т

  5. Выводы

Для серверов мультимедиа интегрированной архитектуры в работе рассмотрены методы смешанного динамического и смешанного статического дискового планирования FCFS с дисциплиной обслуживания очереди запросов к диску LOOK. Для данных методов построены имитационные модели, позволяющие оценивать среднее время пребывания запросов к текстовым данным в дисковой подсистеме, а также определять значения стохастических критериев качества обслуживания. В связи с этим, предлагаемые модели могут быть использованы для построения таблиц зависимостей качества обслуживания клиентов от параметров нагрузки, применяемых для реализации блока контроля допустимости.

С помощью построенных моделей было показано, что использование динамического ограничения числа запросов, выбираемых на обслуживание, позволяет получить почти в два раза большую производительность, чем при применении статического ограничения. Для метода смешанного динамического дискового планирования построены области допустимой нагрузки при различных значениях длительности периода обслуживания Т. Показано, что значение продолжительности периода обслуживания Тopt, позволяющее максимизировать площадь области допустимой нагрузки на дисковую подсистему сервера, составляет около 115% от требуемого времени пребывания запросов к тестовым данным uDгар. При этом при увеличении длительности периода обслуживания Т сверх порогового значения Тopt пропускная способность дисковой подсистемы возрастает, однако качество обслуживания запросов к текстовым данным начинает снижаться, что приводит к необходимости уменьшения нагрузки. Кроме того, при значениях длительности периода обслуживания Т, близких к оптимальному Тopt, область допустимой нагрузки имеет практически идеальную форму (зависимость максимально допустимого значения lmax от Nmax близка к линейной).

Литература

1.      P. Shenoy, P. Goyal, H.M. Vin. Architectural Considerations for Next Generation File Systems. Proceedings of the Seventh ACM Multimedia Conference, Orlando, November 1999.

2.      М.С. Косяков, Т.И. Алиев. Сравнение архитектур построения серверов мультимедиа//В кн.: Научно-технический вестник СПб ГИТМО (ТУ). Выпуск 10. Информация и управление в технических системах/Под ред. Ю.А.Гатчина. СПб: СПб ГИТМО (ТУ), 2003. С. 77–85.

3.      Э. Таненбаум. Современные операционные системы. 2-е изд. – СПб.: Питер, 2002.

4.      R. Haskin. Tiger Shark – A Scalable File System for Multimedia. IBM Journal of Research and Development, 42(2), pages 185–197, March 1998.

5.      P. Shenoy, P. Goyal, S.S. Rao, H.M. Vin. Symphony: An Integrated Multimedia File System. Proceedings of the SPIE/ACM Conference on Multimedia Computing and Networking (MMCN’98), San Jose, CA, pages 124–138, January 1998.

6.      А.А. Петров, М.С. Косяков, Т.И. Алиев. Оптимизация работы дисковой подсистемы сервера мультимедиа//В кн.: Научно-технический вестник СПб ГИТМО (ТУ). Выпуск 10. Информация и управление в технических системах/Под ред. Ю.А.Гатчина. СПб: СПб ГИТМО (ТУ), 2003. С. 99–107.

7.      G. Nerjes, P. Muth, M. Paterakis, Y. Romboyannakis, P. Triantafillou, and G. Weikum. Incremental Scheduling of Mixed Workloads in Multimedia Information Servers. Multimedia Tools and Applications Journal, September 2000.

8.      P. Shenoy, H.M. Vin. Cello: A Disk Scheduling Framework for Next Generation Operating Systems. Proceedings of ACM SIGMETRICS Conference, Madison, WI, pages 44–55, June 1998.

9.      Hard disk drive specification. Ultrastar 36LZX, Models: DDYS-T36950, DDYS-T18350, DDYS-T09170. Revision 2.1. IBM Corp. 9 June 2000.

10.  S. Saroiu, K.P. Gummadi, R.J. Dunn, S.D. Gribble, H.M. Levy. An Analysis of Internet Content Delivery Systems. Proceedings of the 5th Symposium on Operating Systems Design and Implementation (OSDI 2002), December 2002.

11.  M. Krunz, H. Hughes. A Traffic Model for MPEG-Coded VBR Streams. Proceedings ACM SIGMETRICS International Conference on Measurement and Modeling of Computer Systems, Ottawa, Canada, May 1995.