EXIF格式分析及通过XML处理(3)

    技术2022-05-11  105

    EXIF格式分析及通过XML处理

     

    猛禽[Mental Studio](个人专栏)(BLOG)

    http://mental.mentsu.com

     

    下面是一个典型的EXIF JPEG文件格式分析结果(源文件为一张用Nikon CoolPixel 775相机拍摄的照片,所用的EXIF版本是2.1,与2.2版差别不大):

     

    JPEG SOI : FF D8  //  图片起始

    JPEG APP1: FF E1

      APP1 Size : 1C 45  //  注意:前面这三个WORD都是big endian

      EXIF Flag : 'Exif', 0, 0

      TIFF Header:

        Byte Order: 'II'

        Flag      : 2A 00

        IFD0 offset : 08 00 00 00

          Entries Count : 0B 00 // 11

          IFD Entry :

              Tag    : 0E 01  //  Image Description 图像说明

              Type   : 02 00  //  ASCII

              Size  : 0B 00 00 00

              Value : 92 00 00 00  //  from TIFF Header

          IFD Entry:

              Tag    : 0F 01  //  Make 制造

              Type   : 02 00

              Size  : 06 00 00 00

              Value: B2 00 00 00

          IFD Entry:

              Tag    : 10 01  //  Model 型号

              Type   : 02 00

              Size  : 05 00 00 00

              Value: CA 00 00 00

           

          IFD Entry:

              Tag    : 69 87  //  EXIF IFD

              Type   : 04 00  //  LONG

              Size  : 01 00 00 00

              Value: 1C 01 00 00  //  Offset of EXIF IFD

        END of IFD0

        IFD1 Offset : 18 03 00 00

        ...  //  存放IFDValue数据

        EXIF IFD :

          Entries Count : 18 00

          IFD Entry :

              Tag    : 9A 82  //  Exposure time

              ...

        END of EXIF IFD

        Next IFD : 00 00 00 00  //  按标准IFD链表约定,表示没有后继IFD

        ...  //  存放EXIF IFDValue数据

        IFD1 :  //  EXIF中用于存放缩略图

          Entries Count : 06 00

          IFD Entry :

              Tag    : 03 01

              ...

        END of IFD1

        Next IFD : 00 00 00 00  //  EXIF只用到两个TIFF IFD

        ... //  Thumbnail etc.

      //  end of TIFF header

      //  其它JPEG Marker segments

    JPEG EOI : FF D9  //  图片结束

     

    EXIF格式的分析,至此基本上告一个段落了。从分析结果上可以看出,EXIF是一种非常灵活的格式,具有非常好的可扩充性,要想较好地处理其中的相关数据也是比较麻烦的。

    其困难主要在于几个方面:

    1、对于每种不同的IFD Entry Type,需要用不同的方法获取数据,特别是对于数据长度不同时,可能采用不同的数据存储方式,而IFD Entry的数量又可能很多,每个Entry根据Tag不同又有不同的意义

    2、EXIF IFD是作为TIFF IFD的子链表形式存在(因为EXIFIFD里定义了不同于TIFF标准的Tag,要保持与标准的TIFF格式互用,必须这样做),使得原来的链表结构变成了树形结构

    3、Tag的种类和数量非常之大,在EXIF规范里定义了各个Tag的支持级别(见[1]4.6.8),光是JPEG格式下必须支持的Tag就有十几个,TIFF格式更多,再加上可选支持的Tag,有几十上百个,并且还存在未来继续扩充的可能

    4、对于可支持不同语言的软件来说,同一个Tag的意义要用每一种支持的语言表达一次,如果将这部分处理写入代码,对于增加新的语言支持会带来不必要的麻烦

    为了解决这些困难,必须要找到一个同样是非常灵活的处理方法来处理EXIF数据。而XML正是这样一种方法。从前面的分析结果可以看出,EXIF的数据记录方式是层层嵌套的树形结构,是非常适合用XML的,因为XML也是这样的树形结构。

    通过定义一套XML标签,然后将EXIF数据转换成XML文档,可以最大限度地保留EXIF数据的原始内容及结构。并且作为一种通用格式,XML可以很方便地进行再处理,比如:通过XSLT进行转换,使之成为HTML或其它便于显示的格式;或者将此XML传递给其它软件作进一步处理等。

    对于前面说到的困难,XML都很好地解决:

    1、不同类型的问题,通过转换为XML,将所有的Value都转换成字符串,便于统一处理

    2、XML本来就是树形结构,可以在转换的时候方便地通过调整节点位置,使各IFD统一处理

    3、可以将所有的Tag原样导出到XML中,在以后对XML的处理时再根据Tag进行处理,比如通过修改XSL文件实现对新增Tag的支持

    4、同样是对XML处理时才需要面对具体的Tag,比如为不同的语言提供相应的XSL文件即可

    (待续)


    最新回复(0)