I datatid er arkivet en enkelt fil, der i sig selv gemmer forskellige filer og mapper. Der er flere arkivformater til rådighed, og hver har sine egne fordele og ulemper. Nogle arkivformater leveres med kompressionstøtte (hvilket gør din filstørrelse mindre), mens andre understøtter kryptering. Ja, og du gættede det, nogle arkivformater understøtter både komprimering og kryptering. Lad os finde ud af mere om de anvendte komprimerings- og krypteringsalgoritmer og de forskellige arkivformater.

Komprimeringsalgoritme

Komprimeringsalgoritme er den metode, som arkivet bruger til at komprimere filerne og gøre den samlede filstørrelse mindre.

1. LZMA / LZMA2

Lempel-Ziv-Markov (LZMA) kædealgoritmen er en tabsfri datakomprimeringsalgoritme. LZMA bruger en ordbogskomprimeringsalgoritme, der gør brug af komplekse datastrukturer til at kode en bit ad gangen.

LZMA2 er en beholder, der indeholder både de ukomprimerede og LZMA-komprimerede data. Den understøtter multi-gevind kompression og dekompression af data. Det kan også komprimere data, som ikke er komprimerbar med andre komprimeringsalgoritmer.

2. Burrows-Wheeler Transform Algorithm (BWT)

BWT virker ved at permutere en streng tekst i rækkefølge og derefter komprimere dem ved at erstatte de gentagne tegn i symboler.

3. PPM

Prediction by partial matching (PPM) er en statistisk datakomprimeringsmetode, der virker ved at bruge sæt af tidligere symboler i den ukomprimerede symbolstrøm for at forudsige det næste symbol i strømmen.

4. Deflate

Deflate er en populær datakomprimeringsalgoritme, der bruger en kombination af LZ77- og Huffman-kodningsalgoritmer til at komprimere data (kombinere LZMA- og PPM-algoritmer til at producere mere komprimering). Da Deflate ikke indeholder implementeringer, der er begrænset af patenter, er det blevet meget populært og anvendes meget, især i Linux.

Krypteringsalgoritme

Lad os nu gennemgå nogle af de populære krypteringsmetoder:

1. DES

Datakryptering Standard bruger private hemmelige nøgler til at kryptere og dekryptere data. Den hemmelige nøgle vælges tilfældigt fra et 56-64-bit adresserum.

2. AES

Advanced Encryption Standard er en krypteringsalgoritme, der anvendes af de amerikanske agenturer for at sikre følsomme data. Du kan kryptere data ved hjælp af 128, 192 og 256 bit kryptering. AES bruger en symmetrisk nøglealgoritme, hvilket betyder at en fælles nøgle bruges til kryptering og derefter dekryptering af dataene.

3. Blowfish

Blowfish-krypteringsalgoritmen krypterer arkiverne med en 64-bit blokstørrelse og en variabelnøglængde på 32 til 448 bit.

Bemærk : Der er flere andre krypteringsalgoritmer, men de ovennævnte tre er de mest anvendte.

Arkivformater

Der findes forskellige arkivformater. Nedenfor vil vi evaluere hvert arkivformat ved hjælp af tre parametre - hvad enten det understøtter komprimering og kryptering, hvilket operativsystem og software der er til rådighed for dets brug.

1. Tar

Tape Arkiv (Tar) er et af de ældste arkivformater. Det blev oprindeligt brugt til at kombinere og skrive data til sekventielle båndstationer, men blev senere standardiseret som et komprimeringsformat. Tar er for det meste brugt i Linux, og det understøtter ikke komprimering eller kryptering. Du kan også bruge den på Windows med installation af ekstra software. De fleste af de moderne arkiveringsværktøjer understøtter dette format. Undtagelserne omfatter Diskarkiver og KGB Arkiver.

2. GZ

GZ eller GZip er et af de mest populære komprimeringsformater, der bruges i både Windows og Linux. GZip anvendte Deflate-komprimeringsalgoritmen til at komprimere de arkiverede filer. GZip understøtter også filoverførsler med flere dele, hvilket betyder at du kan oprette mindre dele af en stor GZip-fil, så du nemt kan dele og overføre dem. Da GZip er meget populær, har de fleste af de moderne arkiveringsværktøjer støtte til komprimering og dekomprimering af filer ved hjælp af GZip-formatet, herunder 7-Zip, BetterZip, PKZip, WinZip og WinRAR.

3. BZ / BZ2

BZ ligner meget GZ, men bruger Burrows-Wheelers Transform Algorithm, hvilket resulterer i lidt mere komprimering og mindre filstørrelse. Selvom komprimeringen er langsom, er dekompression ganske hurtig. Det meste af den software, der understøtter GZ, understøtter også BZ.

4. Zip

Zip er nok det mest kendte og brugte arkiveringsformat. Zip bruger deflate-algoritmen og understøtter lossless kompression. Det understøtter også AES og DES kryptering. De fleste moderne operativsystemer leveres med indbygget understøttelse til Zip-format, så du behøver ikke en separat software til arkivering og arkivering af Zip-filer.

5. 7Z

7Z arkiveringsformat blev introduceret med et gratis og open source-værktøj kaldet 7-Zip. Det er det mest avancerede generelle komprimerings- og arkiveringsformat, der understøtter de fleste af datakomprimerings- og krypteringsalgoritmerne, herunder dem, vi har diskuteret ovenfor. 7Z-format komprimerer filerne mere end noget andet format, men er relativt langsommere i behandlingen. En anden begrænsning er, at 7-Zip-softwaren kun er tilgængelig til Windows. Der er ingen visuel støtte til Mac eller Linux. 7Z understøtter også arkivering af flere dele.

6. RAR

RAR er et proprietært arkiveringsformat. Mens det kan læses og uddrages af andre hjælpeprogrammer som 7-Zip og WinZip, kan det kun oprettes ved hjælp af WinRAR-hjælpeprogrammet. RAR var det mest populære format til arkivering af flere dele, før 7Z blev frigivet. Nu kan 7Z gøre den samme opgave gratis, hvilket RAR gør ved at lade brugerne betale for WinRAR-softwaren. RAR understøtter AES-kryptering.

Andre komprimerings- og arkiveringsformater

Her er nogle af de relativt mindre kendte formater:

XZ er et tabsfri datakomprimeringsformat, der bruger LZMA2 komprimeringsalgoritme. Det kan betragtes som en fjernet version af 7Z.

LHA, tidligere kendt som LHarc, bruges primært til komprimering af installationsfiler og spil (mest anvendt i Japan). Interessant nok kommer den japanske version af Windows 7 med den indbyggede support til LHA-arkiver.

ACE er et proprietært datakomprimeringsarkivformat, som var en konkurrent til RAR-format i de tidlige dage af 2000.

StuffIt blev primært frigivet til Mac, men versioner til Windows, Linux og Solaris blev frigivet bagefter. Dette er et proprietært komprimeringsformat, der bruges af StuffIt-værktøjer.

Konklusion

I Linux er det mest almindeligt anvendte format gz (eller tar.gz), efterfulgt af bz, mens i Windows eller Mac er det mest almindeligt anvendte format Zip. For kompatibilitet på tværs af platforme er Zip-format den ene til at gå til. Hvis du vil have funktioner som sikkerhed, høj komprimering og multi-part arkivering, gå til 7Z format. RAR svarer til 7Z, bortset fra at det kommer med en pris. Undgå det så meget som muligt.

Hvilket filformat og værktøj bruger du til kompression?

Billedkredit: Spring, M-94 Cipher Device Replica