一個100M的文件,壓縮後剩90M。同樣的數據,少了10M,怎麼實現的?
首先,計算機是基于二進制的,所以所有的數據都可以用0和1來表示。這樣一來,在一大串數據中,同樣的一小段數據重複的幾率就會很高,比如111可能會重複多次出現。這樣一來,我們假如用a來代替111,用b來代替000。那麼例如原本一串111000111111000的數據就可以表示為abaab,這樣就能使得冗長的數據變得精簡,達到壓縮的目的。
二進制
壓縮文件有多種不同的格式,其中以ZIP和RAR的普及率最高。不同的壓縮格式基于不同的算法,就像運用了不同的翻譯密碼,因此,在壓縮效果方面也存在着差異,各有優勢。ZIP格式壓縮速度較快而壓縮率較低,RAR壓縮速度較慢但壓縮率較高。
壓縮又分為有損壓縮和無損壓縮。有損壓縮一般運用于音頻、視頻、圖像等領域,如jpg、mp3等文件格式都屬于有損壓縮。它利用了人類對圖像中的某些信息和聲波中某些頻段不敏感的特性,在壓縮過程中将一些信息忽略,因此經有損壓縮後,原有的信息将無法被完美還原;無損壓縮則在壓縮過程中能将原有信息進行等效壓縮,ZIP和RAR就屬于無損壓縮。
,