MPEG Layer-3 è uno schema di codifica audio di tipo percettivo che analizza i segnali ed applica dei modelli piscoacustici, tenendo in considerazione come obbiettivo principale la conservazione della qualità del suono. Qui di seguito trovate i vari sistemi utilizzati per realizzare i file MP3.
Soglia minima udibile . La soglia minima udibile per l'orecchio umano non è lineare. Infatti la curva di Fletcher e Munsen, ne esprime le caratteristiche con un picco tra 2Khz e 5Khz. Non è perciò necessario "codificare" suoni al di sotto di questa soglia, perchè non sono percepibili.
La mascheratura . Questo sistema si basa sulle caratteristiche proprie dell'orecchio umano, ovvero un suono forte tra i suoni deboli. facciamo un esempio: Durante un concerto parte un fortissimo assolo di chitarra. Molti dei suoni emessi dagli altri strumenti, saranno coperti dal suono del solista, anche se la band continuerà a suonare normalmente. Quindi non è necessario codificare tutti i suoni. Per fare questo vengono applicati modelli psicoacustici che rispettano il comportamento dell'orecchio umano.
Il buffering dei dati . Spesso la codifica di un brano non può avvenire "rigidamente ad un certo "BITRATE". Quindi alcuni passaggi dei brani vengono codificati ad un livello inferiore, per mettere a disposizione dei "bytes" di riserva, nei momenti in cui servono.
Il "Joint Stereo". Al di sotto di una certa frequenza, l'orecchio umano non percepisce la posizione spaziale dei suoni. E il formato MP3, opzionalmente, utilizza un trucchetto chiamato joint stereo. Alcune frequenze vengno quindi registrate come "mono", senza alterare l'effetto "spaziale" del brano.
La codifica Huffman . Infine, i file MP3 utilizzano l'algoritmo di Huffman. Questa è una operazione di compressione su dati, non sul suono. Il lavoro svolto da questo algoritmo serve soprattutto ad ordinare correttamente i dati che compongono i file, e si attiva in chiusura della compressione MP3. Il lavoro svolto da questo algoritmo è quello di ordinare e codificare le ricorrenze consecutive dei simboli. Naturalmente, più ci sono ricorrenze consecutive e più i dati saranno compressi! Questa tecnica di compressione è il complemento perfetto per la codifica percettiva MP3! Infatti se un brano è ripetitivo, (tipo TRANCE-POP e simili), ci saranno un mucchio di dati perfettamente codificati per l'orecchio umano, ma eccessivi, inutili o ridondanti, perchè la musica è ripetitiva. Ed è in questo contesto che la codifica Huffmann ha le maggiori possibilità di "comprimere i dati".
Che significa bitrate? Con bitrate si vuolela quantità di memoria che serve a "descrivere" un secondo di musica. L'unità di grandezza non è il byte, ma il bit. Quindi 128 KBPS significa "128 Kilobit per secondo"... Naturalmente più questo numero è grande e più saranno grandi le dimensioni del file. Infine, tenete presente che se utilizziamo più bit per secondo, l'informazione audio sarà ancor più dettagliata... |