Up ] Docs Home ]

(.gif) Graphics Interchange Format

Back ] Next ]

Введение
Общий формат файла
Идентификатор GIF
Дескриптор экрана
Глобальная таблица цветов
Дескриптор изображения
Локальная таблица цветов
Растровый данные
Терминатор GIF
Расширенный блок GIF
Приложение A - Глоссарий
Приложение B - Взаимодействующие последовательности
Приложение C - Упаковка и сжатие изображения
Приложение D - Обработка нескольких изображений


Введение

'GIF' (tm) - это стандарт фирмы CompuServe для определения растровых цветных изображений. Этот формат позволяет высвечивать на различном оборудовании графические высококачественные изображения с большим разрешением и подразумевает механизм обмена и высвечивания изображений. Описанный в настоящем документе формат изображений был разработан для поддержки настоящей и будущей технологии обработки изображений и будет в дальнейшем служить основой для будущих графических продуктов CompuServe.

Главная задача настоящего документа состоит в том, чтобы снабдить программистов необходимой технической информацией для написания декодеров и кодировщиков GIF. Поэтому в документе используется терминология связанная с общими вопросами графики и программирования.

Первый раздел настоящего документа описывает формат данных GIF и его компоненты в приложении к декодерам GIF, вне зависимости от того являются ли они отдельной программой или частью пакета связи. Приложение B относится к декодерам являющимися частью пакетов связи и описывает протокол, необходимый для входа и существования режима GIF и отвечает на ряд специфических вопросов. Глоссарий в приложении A определяет некоторые термины, использованные в документе. Приложение C дает подробное объяснение того, как сами графические изображения пакуются в виде последовательности байтов.

Общий формат файла

Идентификатор GIF

Наличие в начале файла специальной "подписи" указывает, что последующие данные являются действительно потоком данных изображения в формате GIF. Эта "подпись" состоит из следующих шести символов:
G I F 8 7 a

Три последних символа '87a' могут рассматриваться как номер версии для данного конкретного определения GIF и будут использоваться в дальнейшем в качестве ссылки на документ с описанием GIF в зависимости от номера версии.

Дескриптор экрана

Дескриптор экрана описывает общие параметры для всех последующих изображений в формате GIF. Он определяет размеры пространства изображения или требуемого логического экрана, существование информации о таблице цветов и "глубине" экрана. Эта информация запоминается в виде серии 8-битовых байтов, как показано ниже.

Биты Номер байта Описание
7 6 5 4 3 2 1 0
Ширина экрана 1 Ширина растра в пикселях (сначала LSB)
2
Высота экрана 3 Высота растра в пикселях (сначала LSB)
4
M cr 0 pixel 5 M = 1, За дескриптором следует глобальная таблица цветов
cr + 1 = число битов цветового разрешения
pixel + 1 = число бит/пиксель в изображении

background

6 фон = цветовой индекс фона экрана (цвет определяется из глобальной таблицы цветов или из таблицы по умолчанию)
0 0 0 0 0 0 0 0 7

Ширина и высота логического экрана могут быть больше размеров физического экрана. Способ высвечивания изображений больших, чем размеры физического экрана зависит от реализации и может использовать преимущества конкретного оборудования (например, окна скроллинга в Macintosh scrolling windows). В противном случае изображение будет усечено по краям экрана.

Значение 'pixel' также определяет число цветов в изображении. Диапазон значений 'pixel' составляет от 0 до 7, что соответствует от 1 до 8 битам. Это транслируется в диапазон от 2 (черно-белые изображения) до 256 цветов. Бит 3 в байте 5 зарезервирован для будущих определений и должен быть нулевым.

Глобальная таблица цветов

Глобальная таблица цветов является необязательной и рекомендуется для изображений, где требуется точная передача цветов. На существование этой таблицы указывает поле 'M' в байте 5 дескриптора экрана. Цветовая таблица может быть также связана с каждым изображением в GIF-файле, что будет описано позже. Однако обычно эта глобальная таблица будет использоваться, из-за ограничений, существующих в настоящее время в доступном оборудовании. Флаг 'M' в дескрипторе конкретного изображения обычно равен 0. Если глобальная таблица цветов присутствует, ее определение следует непосредственно за дескриптором экрана. Число элементов цветовой таблицы, следующей за описателем экрана равно 2**(число бит/пиксел), причем каждый элемент состоит из трех байтов, значения которых описывают соответственно относительную интенсивность красного, зеленого и синего цветов. Структура блока цветовой таблицы:

Биты Номер байта Описание
7 6 5 4 3 2 1 0
интенсивность красного

1

Значение красного для цвета 0
интенсивность зеленого 2 Значение зеленого для цвета 0
интенсивность синего 3 Значение синего для цвета 0
интенсивность красного 4 Значение красного для цвета 1
интенсивность зеленого 5 Значение зеленого для цвета 1
интенсивность синего 6 Значение синего для цвета 1
... ... (Продолжение для остальных цветов)

Получаемое значение каждого пикселя при высвечивании изображения будет соответствовать ближайшему доступному цвету из цветовой таблицы дисплея. Цветовые компоненты представляют собой значение относительной интенсивности от нулевой (0) до полной (255). Белый цвет может быть представлен как (255,255,255), черный как (0,0,0) и желтый как (180,180,0). При высвечивании на дисплеях, которые поддерживают менее 8 бит на цветовую компоненту, используются старшие биты. При создании элементов цветовой таблицы GIF на аппаратуре, поддерживающей менее 8 бит на компоненту, значение аппаратной компоненты должно быть конвертировано в 8-битный формат по следующей формуле:
<значение_в_таблице> = <компонента>*255/(2**<число_бит> -1)

Это обеспечивает точный перевод цветов для всех дисплеев. В случае создания изображения GIF на аппаратуре без возможности цветовой палитры, должна быть создана фиксированная палитра на основе доступных для данного оборудования цветов. Если указано отсутствие глобальной таблицы цветов, цветовая таблица по умолчанию генерируется внутренним образом так, что каждый цветовой индекс равен аппаратному цветовому индексу modulo <n>, где <n> - число доступных цветов на оборудовании.

Дескриптор изображения

Дескриптор изображения определяет действительное расположение и размеры последующего изображения внутри пространства, определенного в дескрипторе экрана. Также определяются флаги, указывающие на присутствие локальной таблицы для поиска цветов и определения последовательности высвечивания пикселов. Каждый дескриптор изображения начинается с символа-разделителя изображений. Роль разделителя изображений состоит просто в синхронизации при входе в дескриптор изображения. Это желательно, если GIF-файл состоит более, чем из одного изображения. Этот символ определен как шестнадцатеричное 0x2C или ',' (запятая). Как только этот символ встречается между изображениями, непосредственно за ним следует дескриптор изображения.

Любой символ, встреченный между концом предыдущего изображения и символом-разделителем изображения игнорируется. Это позволит при последующих модификациях GIF допускать присутствие нескольких форматов и правильно игнорировать их старыми декодерами.

Биты Номер байта Описание
7 6 5 4 3 2 1 0
0 0 1 0 1 1 0 0 1 ',' - Символ-разделитель изображения
Левый край 2 Начало изображения в пикселях относительно левого края экрана (сначала LSB)
3
Верхний край 4 Начало изображения в пикселях относительно верхнего края экрана (сначала LSB)
5
Ширина 6 Ширина изображения в пикселях (сначала LSB)
7
Высота 8 Высота изображения в пикселях (сначала LSB)
9
M I 0 0 0 pixel 10
M = 0 Использовать глобальную таблицу цветов, игнорировать 'pixel'
M = 1 Далее следует локальная таблица цветов, использовать 'pixel'
I = 0 Изображение отформатировано в последовательном порядке
I = 1 Изображение отформатировано в порядке переплетения
pixel + 1 число бит на пиксель в данном изображении

Описание положения и размеров экрана должно быть находиться внутри матрицы, определенной в дескрипторе экрана. С другой стороны, нет необходимости, чтобы изображение полностью заполняло весь экран.

Локальная таблица цветов

Локальная таблица цветов необязательна и определена здесь для будущего использования. Если установлен бит 'M' байта 10 в дескрипторе изображения, то вслед за дескриптором изображения следует локальная таблица цветов, которая относится только к последующему изображению. После обработки изображения цветовую таблицу следует привести к той, которая была определена после дескриптора экрана. Заметим, что поле 'pixel' байта 10 в дескрипторе изображения используется только в том случае, если указана локальная таблица цветов. Она определяет не только размер пикселя (число битов в нем), но число элементов последующей цветовой таблицы. Число битов на пиксель также следует восстановить к тому значению, которое было определено в дескрипторе экрана, после того, как закончится обработка изображения.

Растровый данные

Формат самого изображения определен как серия значений номеров пикселов, которые образуют изображение. Пиксели запоминаются слева направо последовательно по строкам изображения. По умолчанию строки записываются последовательно, сверху вниз. В том случае, если установлен бит 'I' в байте 10 дескриптора изображения, то порядок строк при записи изображения соответствует четырех проходному процессу. При первом проходе записывается каждая 8-ая строка, начиная с верхней строки окна изображения. При втором проходе записывается каждая 8-ая строка, начиная с пятой строки сверху. На третьем проходе записывается каждая 4-ая строка, начиная с третьей строки окна. Четвертый проход завершает изображение, записывая каждую вторую строку, начиная со второй строки с сверху. Ниже приведено графическое описание этого процесса.

Страница Проход № 1 Проход № 2 Проход № 3 Проход № 4 Результат
1 **1a** **1a**
2 **4a** **4a**
3 **3a** **3a**
4 **4b** **4b**
5 **2a** **2a**
6 **4c** **4c**
7 **3b** **3b**
8 **1d** **1d**
9 **4e** **4e**
10 **3c** **3c**
11 **4f** **4f**
12 **2b** **2b**

...

Значения пикселов изображения обрабатываются как цветовые индексы, указывающие на существующую таблицу цветов. В результате получается цветовое значение из таблицы, которое реально воспроизводится на экране. Эти серии цветовых индексов, число которых равно ширине_изображения*высоту_изображения, пропускаются через поток данных изображения GIF по одному значению на пиксел, сжимаются и упаковываются в соответствии с версией алгоритма сжатия LZW, как это определено в Приложении C.

Терминатор GIF

Для того, чтобы обеспечить синхронизацию с окончанием файла изображения GIF, декодер GIF должен обрабатывать окончание режима GIF по символу шестнадцатеричное 0x3B или ';', найденному после окончания обработки изображения. По соглашению декодирующие программы должны делать паузу и ждать действий, указывающих, что пользователь готов к продолжению. Это может быть возврат каретки, введенный с клавиатуры или щелчок кнопкой мыши. Для интерактивных приложений эти действия пользователя должны быть переданы в ядро программы как перевод каретки, для того, чтобы вычислительный процесс мог продолжаться. Обычно декодирующая программа покидает графический режим и возвращается к предыдущему процессу.

Расширенный блок GIF

Для того, чтобы обеспечить аккуратное расширение определения GIF, необходим механизм для определения упаковки внутри потока данных GIF. Указанное расширение было определено и документировано CompuServe для того, чтобы предусмотреть управляемый способ усовершенствований.

Расширенный блок GIF пакуется способом, похожим на тот, который использовался для растровых данных, но не сжимается.

Основная структура блока:

Биты Номер байта Описание
7 6 5 4 3 2 1 0
0 0 1 0 0 0 0 1 1 '!' - Идентификатор расширенного блока
функциональный код 2 Расширенный функциональный код (0-255)
байт-счетчик Повторяется столько раз, сколько необходимо
функциональные. байты данных
...
0 0 0 0 0 0 0 0 нулевой байт-счетчик (терминатор блока)

Расширенный блок GIF может непосредственно предшествовать дескриптору изображения или находиться перед терминатором GIF.

Все декодеры GIF должны быть способны распознавать присутствие расширенного блока GIF и затем читать его, если они не могут обработать функциональный код. Это гарантирует, что старые декодеры смогут обрабатывать файлы изображений GIF в будущем, хотя и без дополнительных функциональных возможностей.

Приложение A - Глоссарий

Пиксель Наименьший элемент графического изображения. Обычно соответствует отдельной точке на графическом экране. Разрешение изображения обычно задается в пикселах. Например, одним из довольно стандартных экранных графических форматов является 320 пикселов по горизонтали на 200 по вертикали. Каждый пиксель может быть окрашен одним из нескольких цветов в зависимости от возможностей графического оборудования.
Растр Горизонтальные уровни пикселов, представляющие одну строку изображения. Типичный метод порождения изображения, поскольку большинство образцов видеоборудования ориентировано на наиболее эффективную работу именно таким образом.
LSB Сокращение от Least Significant Byte ( младший по значению байт). Ссылается на соглашение для двух байтов числового значения, согласно которому младший по значению байт предшествует более старшему. Такое соглашение типично для микрокомпьютеров.
Таблица цветов Список определений для каждого цвета, используемый в изображениях GIF. Желаемые цвета конвертируются в доступные цвета с помощью таблицы, причем по входным цветовым индексам изображения образуются выходные цветовые индексы оборудования. Если для изображения GIF указана таблица цветов, то цвета выходных пикселов будут изменены на основе используемого оборудования и его способности соответствовать заданным цветам.
Переплетение Метод высвечивания изображений GIF, при котором совершаются несколько проходов с выводом разнесенных строк растра, что дает возможность визуализации общего содержания всего изображения до того, как обработаны все данные.
B Протокол Свободно распространяемый протокол передачи файлов с исправлением ошибок, разработанный CompuServe и реализованный в продукте VIDTEX фирмы CompuServe. Такой механизм обнаружения ошибок будет использован при передаче изображений GIF для интерактивных приложений.
LZW Совершенный алгоритм сжатия данных, основанный на работе, сделанной Lempel-Ziv и Welch, который обеспечивает возможность высокоэффективного однопроходного кодирования и декодирования. Это позволяет одновременно раскрывать и высвечивать изображения. Исходная статья, в которой был описан указанный метод:
Terry A. Welch, "A Technique for High Performance Data Compression", IEEE Computer, vol 17 no 6 (June 1984)

Этот базовый алгоритм также используется в свободно распространяемых утилитах ARC для сжатия файлов. Адаптация алгоритма LZW, выполненная CompuServe для GIF описана в
приложении C.

Приложение B - Взаимодействующие последовательности

Последовательность обменов gif для интерактивной среды

Для управления на интерактивной линии связи между
отправителем и получателем GIF определена следующая
последовательность действий. Эта последовательность не применяется
в приложениях, включающих загрузку статических GIF-файлов и не
является частью GIF-файлов.

Запрос возможностей gif - Gif Capabilities Enquiry

Последовательность GCE идет из головного процесса и требует, чтобы интерактивный декодер GIF вернул ответное сообщение, которое определяет графические параметры для декодирования. Оно включает возвращаемую информацию о доступных размерах экрана, числе битов на цвет и поддерживаемом количестве цветов. Esc-последовательность для GCE определена следующим образом:
ESC [ > 0 g (g в нижнем регистре, пробелы вставлены для ясности)
(0x1B 0x5B 0x3E 0x30 0x67)

Сообщение возможностей gif - Gif Capabilities Response

Ответное сообщение о возможностях GIF возвращается интерактивным декодером и определяет возможности дисплея декодера для всех графических режимов, поддерживаемых математическим обеспечением. Заметьте, что оно может также включать графический принтер, а не только экран монитора. Общий формат этого сообщения:

#version;protocol{;dev,width,height,color-bits,color-res}... <CR>

'#' GCR символ-идентификатор (Знак номера) version - номер версии формата GIF; из начально '87a'
protocol='0' Протокол end-to-end не поддерживается декодером. Передача данных ведется непосредственным 8-битным потоком.
protocol='1' Может поддерживать протокол коррекции ошибок при передаче данных от прямого хозяина на дисплей.
dev = '0' Далее следуют параметры экрана
dev = '1' Далее следуют параметры принтера
width Максимальная ширина дисплея в пикселях
height Максимальная высота дисплея в пикселях
color-bits Поддерживаемое число битов на пиксель. Следовательно, поддерживаемое число цветов 2**color-bits.
color-res Число битов на компоненту цвета, поддерживаемое аппаратной цветовой палитрой. Если color-res равен '0', таблица аппаратной палитры недоступна.

Заметьте, что все значения в GCR возвращаются в десятичных числах ASCII и сообщение заканчивается символом "Возврат каретки".

Следующее GCR-сообщение описывает три стандартных режима EGA с конфигурацией без принтера, поток данных GIF может обрабатываться в рамках протокола с коррекцией ошибок:
#87a;1 ;0,320,200,4,0 ;0,640,200,2,2 ;0,640,350,4,2<CR>

Ввод графического режима GIF

Две последовательности, определенные ниже вызывают для работы интерактивный декодер GIF. Между ними существует только единственное отличие. Оно заключается в выборе различной среды вывода. Эти последовательности:
ESC [ > 1 g Высветить изображение GIF на экране (0x1B 0x5B 0x3E 0x31 0x67)
ESC [ > 2 gВыдать изображение непосредственно на присоединенный графический принтер. Допускается (0x1B 0x5B 0x3E 0x32 0x67)

Заметьте, что символ 'g', заканчивающий каждую последовательность находится в нижнем регистре.

Интерактивная среда

Подразумеваемой средой при пересылке данных об изображении GIF в интерактивных приложения является полностью 8-битный поток данных от "хозяина" к получателю. Об установке 8-битного способа пересылки данных при связи обычно должна заботиться головная прикладная программа. Однако программа-получатель, поддерживающая декодер GIF в линии связи, должна быть способна принимать и передавать декодеру GIF все 256 возможных кодов 8-битных данных.

Приложение C - Упаковка и сжатие изображения

Поток растровых данных, которые описывают действительное выходное изображение может быть представлен в следующем виде:
Биты Описание
7 6 5 4 3 2 1 0
код размера
байт-счетчик блока Повторяется столько раз, сколько необходимо
байт данных
...
0 0 0 0 0 0 0 0 нулевой байт-счетчик (заканчивает поток данных)

Преобразование изображения из серии значений пикселов к передаваемому или запоминаемому потоку символов включает несколько шагов. Вкратце эти шаги состоят в следующем:

  1. Установка кода размера - Определяет число битов, необходимое для представления действительных данных.

  2. Сжатие данных - Сжатие серии пикселов изображения в серию кодов сжатия.

  3. Построение серии байтов - берет серию кодов сжатия и преобразует их в строку 8-битных данных.

  4. Упаковка байтов - Упаковка набора байтов в блоки, которым предшествует символ-счетчик и вывод.

Установка кода размера

Первый байт в потоке растровых данных GIF имеет значение, указывающее минимальное число битов, необходимое для представления для представления действительных значений пикселов. Как правило оно будет таким же, что и число битов цвета. Однако из-за некоторых ограничений алгоритма черно-белые изображения, которые имеют один бит цвета, должны иметь код размера, равный 2. Такое значение кода размера подразумевает также, что коды сжатия должны быть на один бит длиннее.

Сжатие

Алгоритм LZW преобразует серию значений данных в серию кодов, которые могут быть самими значениями или кодами, описывающими серию значений. Если использовать аналогию с текстовыми символами, то выходные коды состоят из символов и кодов, которые описывают цепочки символов.

LZW-алгоритм, использованный в GIF алгоритмически соответствует стандартному алгоритму LZW со следующими отличиями:

  1. Определен специальный код очистки, который сбрасывает все параметры сжатия/раскрытия и таблицы в исходное состояние. Значение этого кода равно 2**<код размера>. Например, если код размера равен 4 (изображение имеет 4 бита на пиксель), код очистки равен 16 (двоичное 10000). Код очистки может появляться в любом месте потока данных и, следовательно, требуется, чтобы LZW-алгоритм обрабатывал последующие коды так, как будто бы начался новый поток данных. Кодировщик должен выводить код очистки в качестве первого кода в каждом потоке данных изображения.

  2. Определен код конца информации, который явно указывает на конец потока данных изображения. Если встретится такой код, LZW-обработка прекращается. Этот код должен быть последним кодом, формируемым кодировщиком для изображения. Значение этого кода равно <Код_очистки> + 1,.

  3. Значение первого доступного кода сжатия равно <Код_очистки> + 2.

  4. Выходные коды имеют переменную длину, начиная от <код_размера> + 1 битов на код, до 12 битов на код. Тем самым максимальное значение кода определяется равным 4095 (шестнадцатеричное FFF). Как только значение LZW-кода может превысить текущую длину кода, длина кода увеличивается на единицу. Паковщик и распаковщик этих кодов должны изменяться, чтобы соответствовать новой длине кода.

Построение 8-битных байтов

Поскольку LZW-сжатие, используемое для GIF, создает серию кодов переменной длины от 3 до 12 символов каждый, эти коды должны быть переформированы в серию 8-битный байтов так, чтобы на самом деле происходило запоминание или передача символов. Это обеспечивает дополнительное сжатие изображения. Коды формируются в поток битов так, как если бы они паковались справа налево, и затем выбираются по 8 битов для вывода. Рассматриваемый массив 8-битных символов при упаковке кодов длиной по 5 битов должен быть похож на следующий пример:
байт n байт 5 байт 4 байт 3 байт 2 байт 1
and so on hhhhhggg ggfffffe eeeedddd dcccccbb bbbaaaaa

Заметьте, что механизм физической упаковки будет изменяться по мере того, как изменяется число битов в коде сжатия, но концептуально он остается тем же самым.

Упаковка байтов

Как только байты созданы, они группируются в блоки для вывода, причем каждому блоку предшествует байт-счетчик со значением от 0 до 255. Блок с нулевым байтом-счетчиком заканчивает поток данных для данного изображения. Эти блоки являются тем, что выводится на самом деле в формате GIF. Такой формат блока обеспечивает дополнительную эффективность за счет того, что позволяет декодировщику считывать данные по мере необходимости, читая сначала байт-счетчик, а затем пропуская сами данные об изображении.

Приложение D - Обработка нескольких изображений

Поскольку поток данных GIF может содержать несколько изображений, необходимо описать обработку и высвечивание таких файлов. Поскольку дескриптор изображения допускает размещение изображения в пределах логического экрана, можно определить последовательность изображений, каждое из которых занимает часть экрана, но их совокупность заполняет экран целиком. В подобных ситуациях линии поведения при обработке изображений состоит в следующем:

  1. Не делать пауз между изображениями. Каждое обрабатывается сразу же, как только будет распознано декодировщиком.

  2. Каждое изображение переписывает любое другое изображение уже находящееся внутри его окна. Экран очищается только в начале и в конце обработки GIF-изображений. См. обсуждение терминатора GIF.