Perceptueel gebaseerde compressie voor audiogegevens maakt gebruik van de beperkingen van het menselijk gehoor om de grootte van audiobestanden te verkleinen zonder de waargenomen kwaliteit aanzienlijk te beïnvloeden. In plaats van eenvoudigweg gegevens op uniforme wijze weg te gooien, wordt op intelligente wijze informatie verwijderd of verminderd die waarschijnlijk niet door de luisteraar zal worden opgemerkt. Dit wordt bereikt door middel van verschillende belangrijke strategieën:
* Maskering: Dit is het kernprincipe. Het berust op het feit dat onze oren minder gevoelig zijn voor zachtere geluiden wanneer er tegelijkertijd luidere geluiden aanwezig zijn. Luidere geluiden ‘maskeren’ stillere geluiden. Op waarneming gebaseerde codecs identificeren frequenties die worden gemaskeerd door luidere en verlagen hun bitsnelheid of elimineren ze volledig. Dit is met name effectief bij het verminderen van de gegevens die nodig zijn voor hoogfrequente componenten, die vaak worden gemaskeerd door lagere frequenties.
* Kwantisering: Dit houdt in dat de nauwkeurigheid van de audiogegevens wordt verminderd. In plaats van elk monster met een zeer groot aantal bits weer te geven, gebruiken op waarneming gebaseerde codecs minder bits, vooral voor minder perceptueel belangrijke delen van het signaal. De geïntroduceerde kwantiseringsruis wordt vaak gemaskeerd door luidere geluiden.
* Psycho-akoestische modellen: Dit zijn wiskundige modellen die het menselijke gehoorsysteem simuleren. Ze voorspellen welke delen van het audiosignaal het meest waarschijnlijk worden gemaskeerd en daardoor agressiever kunnen worden gecomprimeerd. Er bestaan verschillende modellen met verschillende niveaus van complexiteit en nauwkeurigheid.
* Frequentiedomeinverwerking: Veel op waarneming gebaseerde codecs werken in het frequentiedomein (met behulp van transformaties zoals de Discrete Cosine Transform of Modified Discrete Cosine Transform), wat het identificeren en manipuleren van gemaskeerde frequenties veel gemakkelijker maakt.
Voorbeelden van codecs die op waarneming gebaseerde compressie gebruiken:
* MP3: Een veel gebruikt voorbeeld. Het is relatief efficiënt, maar kan merkbare artefacten introduceren bij zeer hoge compressieverhoudingen.
* AAC (geavanceerde audiocodering): Over het algemeen wordt aangenomen dat het een betere kwaliteit biedt dan MP3 bij dezelfde bitsnelheid.
* Opus: Een modernere codec ontworpen voor zowel audio als spraak, die hoge kwaliteit biedt bij lage bitrates.
* Vorbis: Nog een open-source codec die bekend staat om zijn goede kwaliteit en efficiënte compressie.
Beperkingen:
Hoewel zeer effectief, is op waarneming gebaseerde compressie niet perfect. Bij zeer hoge compressieverhoudingen kunnen artefacten merkbaar worden, vooral als sissend, zoemend of troebel geluid in het geluid. De kwaliteit van de compressie hangt ook sterk af van de complexiteit van het gebruikte psycho-akoestische model en de implementatie van de codec.
Samenvattend kan worden gezegd dat perceptueel gebaseerde audiocompressie de bestandsgrootte dramatisch verkleint door gebruik te maken van de beperkingen van het menselijk gehoor, waardoor een goede balans wordt geboden tussen gegevensreductie en waargenomen audiokwaliteit. Het succes ligt in het vermogen om op intelligente wijze informatie weg te gooien of te verminderen waarvan de kans kleiner is dat deze door de luisteraar wordt waargenomen. |