Bare i denne uge begyndte Spotify at teste "lossless" lydfiler. Men hvad er "tabsfri" lyd, præcis, og hvordan fungerer digital lydkomprimering?

Hvordan virker lydkomprimering?

Målet med lydkomprimering er at reducere antallet af bits, der kræves for nøjagtigt at gengive en analog lyd. Den første proces, vi ser på, hedder "lossy". Lossy compression er en envejs teknik, der smider ikke-kritiske data for at spare plads. Disse teknikker er de mest almindelige metoder til at komprimere lydfiler, der vises i MP3, AAC og WMA-filer ens. Der er to steder, som lossy codecs ser ud til at spare bit: bitrate og psykoakustik.

Bit Rate

Bitrate måler mængden af ​​bits, der bruges til at kode et enkelt sekund af lyd. Hvis vi f.eks. Bruger 8 kilobit per sekund (kbps) kodning af lav kvalitet, er vores algoritme begrænset til at bruge kun 8 kilobit data til at beskrive hvert sekund af lyd. Det er som at forsøge at beskrive et fuldfarvet fotografi med kun få hundrede pixels. Du kan få de brede slagtilfælde rigtigt, men generelt ser du på et alvorligt forringet billede. Hvis vi bruger en højere bithastighed som 192 kbps, har vi masser af plads til at dække nuancerede detaljer. For at vende tilbage til vores fotografiske eksempel har vi nu nok pixels til at beskrive de forskellige lys, mørke og farver i et billede. En høj bitrate bestemmer ikke kvaliteten af ​​en optagelse alene, men en lav bitrate kan alvorligt begrænse udgangskvaliteten.

psykoakustik

Psykoakustik er videnskaben om, hvordan hjernen forstår lyder. Ved at manipulere kendte quirks i den måde mennesker opfatter lyd, kan kompressionalgoritmer klogt fjerne detaljer, som de fleste menneskelige ører ikke vil savne. Målet er at "afrunde" informationer, der ikke ændrer den opfattede lydkvalitet af et spor, idet det udelukkende fjerner kun ubetydelige oplysninger.

For eksempel kan du vide, at den typiske rækkevidde af menneskelig hørelse er mellem 20 Hz og 20 kHz. Det er klart, at lyde uden for dette område kan fjernes. Desuden er den mest detaljerede rækkevidde af menneskelig hørelse mellem 100Hz og 4kHz, og fjernelse af rolige lyde uden for disse frekvensområder gør minimal skade på kvaliteten af ​​en optagelse. Vi kan gøre et lignende trick med stærkt kontrasterende lyde. Hvis en meget høj lyd og en meget stille lyd spiller samtidig, er den stille lyd meget sværere at opfatte, end det ville være alene. Encodere udnytter denne "lydmaskering" for at fjerne den rolige lyd og gemme bits i processen.

Frekvens kan også påvirke, hvor godt vi opfatter lyde. For eksempel har en vedvarende lavfrekvent trommeslag tendens til at drukne ud de mere delikate, højere frekvenser af melodiske instrumenter. Og lydmaskeringen er særlig effektiv over 15kHz, hvor menneskelig hørelse typisk er mindre følsom over for at begynde med.

Fælles lydkomprimeringsordninger som MP3 udnytter hele kompressionsmulighederne, mens de forsøger at forblive så tro mod den oprindelige optagelse som muligt. Selvfølgelig har nogle folk lyst til at fjerne disse frekvenser alvorlig skade på optagelsen. Derfor findes tabsfri komprimeringsstandarder.

Hvad er "Lossless" Audio?

Manglende lydkomprimering har til formål at reducere filstørrelsen, samtidig med at den originale lyd uberørt. Disse codecs bruger ikke nogen af ​​de permanente kompressionsteknikker ovenfor, men fokuserer i stedet på fuldt reversible datakomprimeringsmetoder. De bruger tabsfri kompressionsteknikker lånt fra filkomprimeringsalgoritmer som ZIP for at fjerne overflødige data, samtidig med at de underliggende informationers integritet bevares. To populære lossless audio codecs - FLAC og Apple Lossless (ALAC) - begge bruger ordninger baseret på ZIP-kompression.

Fokus på datakomprimering betyder kun at bevare mange af de detaljer, som MP3 og andre tabsstandarder ville udslette. Hvis du har skarpe ører og en høj kvalitet lytte opsætning, kan forskellen være palpable.

Lossless kompression er ikke kun god til at lytte, men det er også et godt opbevaringsværktøj. Ligesom du ikke vil have en 72dpi JPG til at være den eneste digitale kopi af Ansel Adams fotografier, ønsker vi ikke kun 128kbps MP3'er af "Kind of Blue." Uslettede standarder som FLAC tillader os at gemme lyd effektivt uden at kaste væk potentielt værdifulde data. De gør også remastering og omfordeling af lyden lettere, da start med kompromitterede herrer betyder et færdigvare af højere kvalitet.

Konklusion: Kan du fortælle forskellen?

Lossless lydformater giver mulighed for bedre lydoptagelser. Men nogle gange er forskellene mellem en højkvalitets MP3 og en tabsfri fil næsten umærkelig, især til det uoplærede øre. Hvis du vil se, om dine hovedtelefoner (og ører) er opsat nok til at fortælle forskellen, har NPR en sjov test; bare husk på, at billige hovedtelefoner og bærbare højttalere ikke vil kunne gengive de subtile forskelle mellem tabsfri lyd og MP3-filer. For en mere seriøs analyse af codecs, tjek SoundExpert's encoder ratings.