Структура DICOM-файла

Во многих медицинских задачах принципиальное значение имеет формат обрабатываемых изображений. Если планируется использование данных широким кругом получателей и последующая обработка результатов исследования, то следует пользоваться форматом передачи данных, описанным в международном стандарте DICOM [8].

Файл, хранящий одно изображение в стандарте DICOM, является сложной структурой данных, включающей в себя не только непосредственно изображение, но и сопутствующую информацию, такую как: данные об оборудовании, на котором проводилось исследование; описание проведенного исследования; параметры и описание серии исследования; данные о системе координат, связанной с изображением; атрибуты, определяющие само изображение; текстово-графические элементы, графики и комментарии, выполняемые медицинским персоналом, и атрибуты, описывающие преобразования над полученными данными, и т.д. Подробное описание структуры любого DICOM-файла приведено в десятой части стандарта.

Отдельный DICOM-файл содержит как заголовок (который хранит информацию об имени пациента, типе исследования, размере изображения и т.д.), так и все данные об изображении (которые могут содержать информацию в трех измерениях). Это - его отличие от популярного формата Analyze, который хранит данные изображения в одном файле (*.img) и данные заголовка в другом файле (*.hdr). Другое различие между DICOM и Analyze в том, что данные DICOM-изображения могут быть сжаты для уменьшения размера изображения. Файлы могут быть сжаты с помощью алгоритмов сжатия с потерей данных или без потерь в формате JPEG, так же как в формате без потерь Run-Length Encoding (который является идентичным сжатию битов, используемому в изображениях формата TIFF).

Первые 794 байта DICOM-файла используются для заголовка, который описывает размерность изображения и сохраняет другую текстовую информацию об исследовании. Размер заголовка изменяется в зависимости от количества сохраненной в заголовке информации. Данные об изображении следуют за информацией заголовка.

Заметим, что в DICOM-файле первые 128 байт не используются (заполнены нулями), за ними следуют символы 'D', 'I', 'C', 'М'. Далее следует определенным образом сгруппированная информация заголовка, занимающая 794 байта. В заголовке содержатся данные о модальности устройства и его производителе, фотометрическая информация, версия программного обеспечения, условия исследований, параметры сканирования, количество элементов изображения, синтаксис передачи данных, введенная информация о пациенте и др.

Любой DICOM-файл имеет идентификационный номер (File ID), записанный в заголовке. Идентификационный номер содержит до восьми ком

понентов, каждый из которых может заключать в себе до восьми символов. Это позволяет работать с данными в режиме иерархической структуры.

Отсутствие необходимых элементов заголовка изображения является нарушением стандарта DICOM, поскольку это может привести к неверной диагностической интерпретации данных. Большинство просмотровых программ для формата DICOM не проверяют наличие всех этих элементов, извлекая только информацию заголовка, описывающую размер изображения.

Предшественником DICOM был стандарт NEMA, имевший похожую структуру и ряд аналогичных элементов. Главное отличие формата NEMA от DICOM - отсутствие 128-байтового буфера данных или префикса 'DICM'.

В DICOM-файле важен элемент, определяющий синтаксис передачи информации. Он несет сведения о структуре данных изображения, показывая, были ли они предварительно сжаты. Многие просмотровые DICOM-программы могут работать только с несжатыми данными. DICOM изображения могут быть сжаты как обычной JPEG-схемой сжатия с потерями (при использовании которой теряется часть высокочастотной информации), так и JPEG-схемой сжатия без потерь, которая редко применяется вне медицинского отображения (это редкий алгоритм Huffman сжатия без потерь, а не более поздний и эффективный алгоритм JPEG-LS). Эти коды описаны в пятой части стандарта DICOM.

Синтаксис передачи UID также несет информацию о порядке байта в наборе данных. Различные компьютеры хранят целые числа по-разному, поэтому, для некоторых данных, возможно, требуется изменить их порядок в соответствии с используемым компьютером.

Для большинства МРТ- и КТ-изображений используемая фотометрическая интерпретация монохромна (например, обычно яркости пикселов изображения представлены в соответствии с серой шкалой). В DICOM эти монохромные изображения сопоставляют с фотометрической интерпретацией 'MONOCHROME1' (минимальные значения яркие, большие значения темные) или 'MONOCHROME2' (минимальные значения темные, большие значения яркие). В то же время целый ряд медицинских изображений (УЗИ, позитронно-эмиссионные томограммы и др.) содержат данные, соответствующие цветной шкале, поэтому они описываются различными фотометрическими интерпретациями (например, палитрой RGB, CMYK, или YBR). Некоторые цветные изображения (например, RGB) хранят 3 цвета в каждом пикселе (красный, зеленый и синий), в то время как монохромные и палит-ровые изображения обычно хранят только один образец на изображение. Каждое изображение хранит 8 бит (256 уровней) или 16 бит (65 535 уровней) оттенков, хотя некоторые сканеры сохраняют данные в 12- или 32битовом разрешении. Таким образом, RGB-изображение, хранящее 3 образца в пикселе в 8 битах, может потенциально описать 16 миллионов цветов (2563).

Рекомендуем к просомтру

www.kievoncology.com благодарны автору и издательству, которые способствует образованию медицинских работников. При нарушении авторских прав, сообщите нам и мы незамедлительно удалим материалы.