Voice recognition : ANALISA DAN IDENTIFIKASI BERBAGAI PENYAKIT PARU-PARU DENGAN METODE HIDDEN MARKOV MODEL
Voice recognition merupakan proses pengenalan secara otomatis suatu sinyal suara dengan membandingkan pola karakteristiknya dengan sinyal suara yang menjadi referensi atau acuan.
Proses-proses Dalam Sistem Pengenalan Getaran Suara Paru-Paru
Sistem pengenalan ini digunakan untuk mengenali jenis getaran dari suara paru-paru. Sistem ini dapat mengenali suara paru-paru dengan terlebih dahulu melakukan karakterisasi sinyal akustik yang akan dijadikan sebagai referensi. Karakterisasi getaran ini dilakukan dengan ekstraksi fitur sehingga dihasilkan vektor-vektor data yang akan digunakan pada pembuatan codebook. Gambar 2.7 menunjukkan proses-proses yang digunakan dalam sistem pengenalan getaran suara paru-paru.
Keterangan :
Proses Ekstrasi :
framing, FFT, windowing, Vektor Quantization (VQ), cluster, codebook, state
Gambar 2.6 Diagram pembuatan model referensi dan testing getaran suara paru-paru
Sampling Sinyal Analog
Sampling adalah suatu proses untuk membagi-bagi suatu sinyal kontinyu dalam interval waktu yang telah ditentukan. Sampling ini dilakukan dengan mengubah sinyal analog menjadi sinyal dijital dalam fungsi waktu. Pengubahan bentuk sinyal ini bertujuan untuk mempermudah memproses sinyal masukan yang berupa analog karena sinyal analog memiliki kepekaan terhadap noise yang rendah, sehingga sulit untuk memproses sinyal tersebut.
Proses sampling berbeda-beda untuk setiap suara. Bila sampling terhadap suatu sinyal suara tidak akurat maka dapat terjadi misleading atau hasil yang tidak sesuai dengan aslinya [12].
Aliasing merupakan hasil dari sampling secara diskrit pada suatu sinyal yang terlalu rendah sehingga memberikan resolusi yang rendah pula. Gambar 2.8 menunjukan sampel sinyal 10 Hz yang nampak menjadi sinyal 5 Hz pada Gambar 2.8. Ini menunjukan sebuah contoh terjadinya aliasing.
Gambar 2.7 Sampling diskrit suatu sinyal [13]
Titik-titik yang terlihat adalah sampel point
Gambar 2.8 Sinyal hasil sampel data [13]
Nyquist rate adalah rata-rata sampel minimum yang harus dipakai untuk mencegah timbulnya aliasing informasi frekuensi. Besarnya Nyquist rate harus dua kali frekuensi tertinggi dalam sinyal.
Dalam hal ini frekuensi sampling yang digunakan untuk merubah masukan menjadi sinyal digital adalah 8000 Hz disesuaikan dengan getaran suara paru-paru yang ketika pengambilan data menggunakan frekuensi sampling yang sama. Besarnya frekuensi sampling diatas jauh lebih tinggi dari dua kali frekuensi tertinggi dalam sinyal masukan.
Ekstraksi
Tujuan ekstraksi atau feature extraction ini adalah untuk mengubah bentuk getaran suara menjadi berbagai tipe parameter yang merepresentasikan sinyal suara untuk dianalisa.
Voice Recognition
Gambar 2.9 Feature Ectraction & Vector Quantization (VQ) dengan framing sebanyak 6
Dari gambar 2.9 di atas dapat dijelaskan bahwa sinyal-sinyal kontinyu suara paru-paru di bagi-bagi menjadi beberapa frame dalam interval waktu yang telah di tentukan sehingga diperoleh sampel poin (titik vektor). Setelah itu dilakukan windowing pada setiap frame yang tujuannya untuk membatasi. Dari proses ekstraksi akan menghasilkan titik-titik vektor dengan menggunakan Fast Fourier Transform (FFT) yang berfungsi mengubah masing-masing frame dari domain waktu ke domain frekuensi. Titik-titik itu kemudian dipetakan pada sebuah grafik dengan teknik kuantisasi vektor (VQ) dimana sumbu x merupakan komponen real dari masin-masing titik dan sumbu y merupakan komponen imajiner dari masing-masing titik. VQ merupakan proses pemetaan vektor dari ruang vektor yang besar menjadi daerah yang terbatas (cluster). Setiap cluster ini diwakili oleh sebuah titik centroid. Satu kombinasi dari beberapa centroid ini merupakan perwakilan untuk satu sampel, yang disebut dengan codeword. Kumpulan semua codeword disebut dengan codebook. Titik-titik vektor tersebut dipetakan dan titik yang berdekatan di kuantisasikan kesatu vekttor sehingga diperoleh beberapa ttitik vektor atau kumpulan centroid. Selanjutnya pemenggalan tersebut menjadi state yaitu merupakan salah satu paramater Hidden Markov Model (HMM).
Proses-proses Dalam Sistem Pengenalan Getaran Suara Paru-Paru
Sistem pengenalan ini digunakan untuk mengenali jenis getaran dari suara paru-paru. Sistem ini dapat mengenali suara paru-paru dengan terlebih dahulu melakukan karakterisasi sinyal akustik yang akan dijadikan sebagai referensi. Karakterisasi getaran ini dilakukan dengan ekstraksi fitur sehingga dihasilkan vektor-vektor data yang akan digunakan pada pembuatan codebook. Gambar 2.7 menunjukkan proses-proses yang digunakan dalam sistem pengenalan getaran suara paru-paru.
Keterangan :
Proses Ekstrasi :
framing, FFT, windowing, Vektor Quantization (VQ), cluster, codebook, state
Gambar 2.6 Diagram pembuatan model referensi dan testing getaran suara paru-paru
Sampling Sinyal Analog
Sampling adalah suatu proses untuk membagi-bagi suatu sinyal kontinyu dalam interval waktu yang telah ditentukan. Sampling ini dilakukan dengan mengubah sinyal analog menjadi sinyal dijital dalam fungsi waktu. Pengubahan bentuk sinyal ini bertujuan untuk mempermudah memproses sinyal masukan yang berupa analog karena sinyal analog memiliki kepekaan terhadap noise yang rendah, sehingga sulit untuk memproses sinyal tersebut.
Proses sampling berbeda-beda untuk setiap suara. Bila sampling terhadap suatu sinyal suara tidak akurat maka dapat terjadi misleading atau hasil yang tidak sesuai dengan aslinya [12].
Aliasing merupakan hasil dari sampling secara diskrit pada suatu sinyal yang terlalu rendah sehingga memberikan resolusi yang rendah pula. Gambar 2.8 menunjukan sampel sinyal 10 Hz yang nampak menjadi sinyal 5 Hz pada Gambar 2.8. Ini menunjukan sebuah contoh terjadinya aliasing.
Gambar 2.7 Sampling diskrit suatu sinyal [13]
Titik-titik yang terlihat adalah sampel point
Gambar 2.8 Sinyal hasil sampel data [13]
Nyquist rate adalah rata-rata sampel minimum yang harus dipakai untuk mencegah timbulnya aliasing informasi frekuensi. Besarnya Nyquist rate harus dua kali frekuensi tertinggi dalam sinyal.
Dalam hal ini frekuensi sampling yang digunakan untuk merubah masukan menjadi sinyal digital adalah 8000 Hz disesuaikan dengan getaran suara paru-paru yang ketika pengambilan data menggunakan frekuensi sampling yang sama. Besarnya frekuensi sampling diatas jauh lebih tinggi dari dua kali frekuensi tertinggi dalam sinyal masukan.
Ekstraksi
Tujuan ekstraksi atau feature extraction ini adalah untuk mengubah bentuk getaran suara menjadi berbagai tipe parameter yang merepresentasikan sinyal suara untuk dianalisa.
Voice Recognition
Gambar 2.9 Feature Ectraction & Vector Quantization (VQ) dengan framing sebanyak 6
Dari gambar 2.9 di atas dapat dijelaskan bahwa sinyal-sinyal kontinyu suara paru-paru di bagi-bagi menjadi beberapa frame dalam interval waktu yang telah di tentukan sehingga diperoleh sampel poin (titik vektor). Setelah itu dilakukan windowing pada setiap frame yang tujuannya untuk membatasi. Dari proses ekstraksi akan menghasilkan titik-titik vektor dengan menggunakan Fast Fourier Transform (FFT) yang berfungsi mengubah masing-masing frame dari domain waktu ke domain frekuensi. Titik-titik itu kemudian dipetakan pada sebuah grafik dengan teknik kuantisasi vektor (VQ) dimana sumbu x merupakan komponen real dari masin-masing titik dan sumbu y merupakan komponen imajiner dari masing-masing titik. VQ merupakan proses pemetaan vektor dari ruang vektor yang besar menjadi daerah yang terbatas (cluster). Setiap cluster ini diwakili oleh sebuah titik centroid. Satu kombinasi dari beberapa centroid ini merupakan perwakilan untuk satu sampel, yang disebut dengan codeword. Kumpulan semua codeword disebut dengan codebook. Titik-titik vektor tersebut dipetakan dan titik yang berdekatan di kuantisasikan kesatu vekttor sehingga diperoleh beberapa ttitik vektor atau kumpulan centroid. Selanjutnya pemenggalan tersebut menjadi state yaitu merupakan salah satu paramater Hidden Markov Model (HMM).