在計算機剛剛普及的時代,一個硬盤容量10G就不錯了(硬盤歷史戳在這里)。不像一個3A游戲,現(xiàn)在能破100G,硬盤剛起步1TB,這在十幾年前是不可想象的。
當(dāng)容量不足時,數(shù)據(jù)壓縮尤為重要。壓縮的原理是什么?什么樣的壓縮比較好?問題很多,今天就來看看“壓縮”。
壓縮的好處
要說壓縮的好處顯而易見,最重要的是節(jié)省存儲空。存儲設(shè)備發(fā)展沒那么快,硬件需要花錢,所以利用壓縮技術(shù),可以省錢,省更多的東西。
當(dāng)然,也有一個不可忽視的代價,那就是“時間”。壓縮和解壓縮的過程需要付出時間和成本。幾百G的信息壓縮可能需要半天以上。
壓縮有什么額外的意義?為什么只要多買幾個硬盤就要壓縮?當(dāng)然,通過將許多東西壓縮到一個包中,它可以很容易地傳輸。
比如有一天,你的朋友讓你給他發(fā)幾百張你旅行的照片。如果你用QQ一個個發(fā)給他,你會覺得不提很麻煩,很可能相反的心態(tài)就崩潰了。在這種情況下,你打包一個照片文件夾,然后發(fā)送出去,是不是舒服多了?
另一個重要的是“保密”。很多壓縮軟件都提供了密碼加密功能,添加一個密碼就可以保護公司的文件和隱私。因為有軟件強制破解密碼,建議密碼設(shè)置更復(fù)雜一些。
壓縮的▌缺點
最大的缺點是我們剛才說的壓縮解壓“需要很長時間”,還有一個很大的缺點就是在于傳輸過程中。
往往我們在網(wǎng)上下載一個大文件壓縮包和一個視頻壓縮包,上傳者不僅會給你一個磁性鏈接,還會在下面附上一個“MD5”代碼。這東西是干什么用的?其實是用來驗證的。
因為信息在網(wǎng)絡(luò)傳輸過程中可能會被破壞,很多小文件被破壞了最多會被替換掉,不會耽誤任何努力,但是壓縮文件被破壞了,可能會導(dǎo)致整個壓縮包被解包。所以有幾個朋友可能會在解壓前使用MD5 mcrc的完整性,或者看看文件有沒有被篡改。
▌壓縮格式
說到這里,常見的壓縮格式有哪些?后綴方面,最常見的是ZIP、RAR和7Z,分別來自WinZIP、WinRAR和7-Zip。它們都有不同的字典和規(guī)范,這意味著壓縮效率不同。
ZIP是一種歷史悠久的壓縮格式,也是最常見的標準格式。可以直接在Windows中訪問內(nèi)容。缺點是普遍支持Unicode字符,缺乏修復(fù)功能,安全性一度堪憂。
他的發(fā)明者是菲利普·卡茨(簡稱PK),有一個曲折的故事伴隨著他。DOS時代,ARC壓縮格式大行其道,但菲利普對其效率之慢并不滿意,于是親自開發(fā)了與ARC完全兼容的“PKARC”,但被律師函警告,敗訴。
但他依然不屈不撓,開發(fā)了PKZIP,首創(chuàng)了ZIP格式,沒有注冊專利,使得ZIP成為一種開放格式。不幸的是,菲利普在年僅37歲時就死于酒精中毒。后來隨著Windows的興起,Nico Mak開發(fā)了WinZIP,讓歷史不斷向前發(fā)展。
RAR也用ZIP算法,但是格式不開放,只有解壓組件開放,壓縮率比ZIP高。他在國內(nèi)可能比國外更受歡迎,因為這種格式得到了破解組織的高度贊揚,所以可以說那一年他在國內(nèi)有著獨特的成長土壤。
與ZIP相比,RAR更支持Unicode字符,因此無需擔(dān)心多語言造成的字符亂碼。也是最早支持卷壓縮和CRC修復(fù)的壓縮格式。有很多優(yōu)點,但一開始是收費軟件,后來有了廣告的免費版出來了。
7Z出現(xiàn)得相對較晚。它完全開源,支持LZMA等先進算法,具有更高的壓縮效率、更高的壓縮比和更快的速度。同時,它對AES加密、立體壓縮、超大文件壓縮都有很好的支持,并且兼容其他壓縮格式。
▌其他格式
然而,壓縮不僅是一種壓縮包的形式,也是一種封裝的形式。圖片、視頻等。我們通常接觸到的也算壓縮格式。
例如,JPG是最常見的有損壓縮格式。你可以在很多壓縮的JPG看到馬賽克,但好處是占用空的小空間,適合在線傳輸和交流。以及TIFF、RAW、PNG、BMP、GIF等。都是無損壓縮格式,大多數(shù)都很大。
音頻領(lǐng)域,肯定玩Hifi的朋友都比較熟悉。WAV、FLAC、APE是無損壓縮格式,MP3是有損格式。更有意思的是,網(wǎng)上的APEs大部分可能都是假的,沒有損壞,而且是從盜版光盤上復(fù)制的,所以看到這種格式,在沒有損壞的時候要小心。
▌壓縮原理
從某種程度上來說,莫爾斯電碼也是一種信息壓縮,甚至更早的象形文字也被認為是一種信息壓縮,所以壓縮有著悠久的歷史。
計算機處理的信息以二進制數(shù)(0和1)的形式表示。壓縮軟件用特殊字符標記二進制信息中的相同字符串,并對其進行壓縮,從而減小文件大小。
同樣是壓縮,只是方法不同。比較常見的有哥倫布索引編碼、霍夫曼編碼、字典算法、固定位長算法、算術(shù)編碼、游程編碼等。,這將是復(fù)雜和難以理解的,所以我們將簡單地談?wù)勗瓌t:
壓縮的本質(zhì)是“找規(guī)則,簡化”。比如111110000可以看成五個1和五個0,而AAABBB可以叫做3A3B。
字典算法很好理解,相當(dāng)于用簡單的代碼來指代復(fù)雜的單詞,比如01= starter,02=你字典里長角的紅衣美少女。那么“我開第一臺喇叭機,摟著頭上長著喇叭的紅衣美少女”可以壓縮成“我開01摟著02”,是不是一下子短了很多?(以上為純霧)
壓縮率將根據(jù)文件類型而變化。比如文本類的壓縮比會很大,因為單詞和單詞可能在同一個文件中重復(fù)出現(xiàn);但是,壓縮文件在重新壓縮后不能縮小。
預(yù)言的3D電影《彗星撞地球》甚至可以從幾個g壓縮成64k的圖片,原因是這種DEMO與普通視頻的不同之處在于,它不是用視頻解碼器解析每一幀,而是實時計算,計算出來的地圖有一部分可以重復(fù)使用,所以尺寸大大減小。
*通用軟件
WinZIP、WinRAR、7-ZIP是最常見的??偟膩碚f,免費版的WinRAR就夠了。相信很多人會用火絨攔截廣告,但廣告是作者的經(jīng)濟來源,除非絕對必要,不建議這樣做。7-ZIP的界面雖然有點低,但是簡單易用。
那么有沒有更好更免費的呢?可以試試Bandi,這是一款韓國軟件。完全免費,和WinRAR差不多。支持自動解壓,根據(jù)壓縮后的包內(nèi)容自動選擇解壓方式;您也可以設(shè)置在關(guān)閉軟件后不刪除臨時文件。
如果有什么意見或者屏幕前的好用軟件,不妨在評論區(qū)分享~
▼
1.《壓縮格式 小科普 | 壓縮水平哪家強?》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點,與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《壓縮格式 小科普 | 壓縮水平哪家強?》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/tiyu/706069.html