Minggu, 02 Oktober 2011

4. Teknik Dasar Kompresi Audio

Kompresi audio adalah salah satu bentuk kompresi data yang bertujuan untuk mengecilkan ukuran file audio/video dengan metode
  • Lossy à format : Vorbis, MP3, MPEG-1;
  • Loseless à format : FLAC yang digunakan pada audio engineer
Kompresi dilakukan pada saat pembuatan file audio/video dan pada saat distribusi file audio/video tersebut
Kendala pada kompresi audio:
  • Perkembangan sound recording yang cepat dan beranekaragam
  • Kebutuhan sample audio berubah dengan cepat
Loseless audio codec tidak memperhatikan masalah dalam kualitas suara, penggunaannya dapat difokuskan pada:
  • Kecepatan kompresi dan dekompresi
  • Faktor kompresi
  • Dukungan hardware dan software
Lossy audio codec penggunaannya difokuskan pada:
  • Kualitas audio yang dihasilkan
  • Faktor kompresi
  • Kecepatan kompresi dan dekompresi
  • Inherent latency of algorithm (penting bagi real-time streaming)
  • Dukungan hardware dan software

Metode Kompresi Audio

  1. Metode Transformasi (Transform domain)
  • Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.
2.  Metode Waktu (Time domain)
  • Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar.  Jadi seperti layaknya komputer yang berbicara dengan  bahasa manusia dengan kecepatan 2,4 kbps

MPEG(Moving Picture Expert Group)

MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio.
Nilai 0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja.
Untuk ratio kompresi 6:1 untuk 16 bit stereo dengan frekuensi 48kHz dan bitrate 256 kbps CBR akan menghasilkan ukuran file terkompresi kira-kira 12.763 KB, sedangkan ukuran file tidak terkompresinya adalah 75.576 KB
MPEG-1 audio mendukung frekuensi dari 8kHz, 11kHz, 12kHz, 16kHz, 22kHz, 24 kHz, 32 kHz, 44kHz, dan 48 kHz.  Juga mampu bekerja pada mode mono (single audio channel), dual audio channel, stereo, dan joint-stereo

Algoritma MPEG Audio

Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.
Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi)
Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut
Diberikan bit parity yang digunakan untuk mengecek apakah data tersebut rusak atau tidak (yang mungkin disebabkan oleh gangguan / noise), apabila rusak, maka bit tersebut akan digantikan bit yang jenisnya sama dengan bit terdekatnya.

Kompresi Audio MP3

  • Asal-usul MP3 dimulai dari penelitian IIS-FHG (Institut Integriette Schaltungen-Fraunhofer Gesellschaft), sebuah lembaga penelitian terapan di Munich, Jerman dalam penelitian coding audio perceptual.
  • Penelitian tersebut menghasilkan suatu algoritma yang menjadi standard sebagai ISO-MPEG Audio Layer-3 (MP3)
1. Auditory masking
Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi.
2. Critical band
Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.
3. Joint stereo
Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.

Encoder / Decoder MP3

  • Ukuran file terkompresi harus sekecil mungkin
  • Kualitas suara file yang telah terkompresi haruslah sedekat mungkin dengan file asli yang belum dikompresi
  • Tingkat kesulitan rendah, sehingga dapat direalisasikan dengan aplikasi yang mudah dibuat dan perangkat keras yang ‘sederhana’ dengan konsumsi daya yang rendah

Tidak ada komentar:

Posting Komentar