什么是二進制文件格式?
二進制文件格式
是主要包含二進制數(shù)據(jù)的任何文件格式。這包括編譯的程序、圖像、媒體和多數(shù)壓縮文件,以及可能包含文本信息但存儲為二進制數(shù)據(jù)的文件。Microsoft Office
產(chǎn)品使用的二進制文件格式就屬于后一種情況。非二進制格式可能包括文本 (.txt), .html, .xml 及其派生形式、已解釋腳本和源代碼文件。
Microsoft Office
二進制文件格式的所有文件數(shù)據(jù)存在于一個或多個流中。每個流均包含用于存儲元數(shù)據(jù)(如用戶和系統(tǒng)信息、文件屬性、格式信息、文本內(nèi)容和媒體內(nèi)容)的數(shù)據(jù)結(jié)構(gòu)。這些數(shù)據(jù)結(jié)構(gòu)表示為主機程序通過其用戶界面解釋和呈現(xiàn)的多組十六進制數(shù)字。
同時,流中的數(shù)據(jù)結(jié)構(gòu)的組織方式各有不同。最常見的數(shù)據(jù)單元是記錄。記錄通常包含一些字段和標記形式的文件元數(shù)據(jù)。這包括一個或多個指示其他相關(guān)記錄或其他數(shù)據(jù)的位置的偏移值。文本存儲為表示
ANSI 或 Unicode 字符的數(shù)值。圖像可存儲為外部文件的指針,或存儲為其自己的二進制文件格式的嵌入圖像,如文件中的 .gif, .jpeg 或
.png。較活躍的內(nèi)容(如 PowerPoint 幻燈片切換)使用闡釋時所需的信息(如切換屬性)進行標記,然后由主機程序呈現(xiàn)。