Speech Recognition

November 01, 2020

Speech Recognition

PENGERTIAN SPEECH RECOGNITION

Speech Recognition atau yang biasa dikenal dengan automatic speech recognition (ASR) merupakan suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara.

MANFAAT SPEECH RECOGNITION

Secara garis besar, saat speech recognition bertujuan untuk membantu mengerjakan tugas-tugas sederhana manusia seperti mengirim pesan, membacakan email terbaru, mengingigatkan jadwal rapat atau menanyakan sesuatu yang kita tidak tahu. Namun seiring berkembangnya zaman, speech recognition tentu akan membantu banyak sektor seperti kesehatan, militer dan bisnis.

Terintergrasinya speech recognition dalam sektor kesehatan tentunya dapat membantu sebuah rumah sakit meningkatkan pelayanannya. Seorang lanjut usia atau berkebutuhan khusus dapat mendapatkan pelayanan cepat walaupun hanya berhadapan dengan mesin atau aplikasi. Lalu bagaimana dengan sektor bisnis?

Speech recognition dalam dunia bisnis tidak diragukan lagi manfaatnya, jika speech recognition dapat berkembang semakin sempurna lagi, tentu akan berdampak besar terhadap bisnis yang menggunakannya. Kita ambil contoh penggunaan voice-based chatbot dalam suatu website yang menjual produk. Semakin berkembangnya zaman, individu semakin ingin sesuatu yang cepat yang pada akhirnya berdampak pada pengambilan keputusan dari individu orang itu sendiri.

Kinerja dari sebuah ystem speech recognition biasanya dilihat dalam hal ketepatan dan kecepatan. Ketepatan biasanya dinilai dengan tingkat kesalahan kata (Word Error Rate – WER). Sedangkan kecepatan diukur dengan ystem real time. Beberapa hal-hal penting untuk mengukur kinerja lainnya adalah Single Word Error Rate (SWER) dan Command Success Rate (CSR). Namun sayangnya sistem speech recognition adalah sebuah sistem yang sangat kompleks. Speech recognition juga harus dapat melihat pengguna dalam hal pengucapan kata harus juga melihat aksen yang digunakan, pengucapan pengguna, sambungan kata, kekerasan kata, sifat bunyi dari kata, nada yang terdengar, besar volume yang terdengar dan kecepatan dari pengucapan oleh sang pengguna. Sering kali speech recognition terganggu oleh suara latar dan gaung. Terkadang ketepatan dari sistem speech recognition bervariasi antara lain :

Ukuran kosakata dan kosakata yang membingungkan.
Kata-kata yang berurutan, Terputus, atau kata tunggal.
Pembatas kata dan beban kata.
Kata-kata spontan dan kata-kata yang dibaca.
Kata-kata yang berlawanan.

Referensi :

https://galanghakim.wordpress.com/2016/10/11/teknologi-voice-command-recognition/

https://mti.binus.ac.id/2019/05/08/speech-recognition/

https://medium.com/@faisalsugangga/apa-itu-speech-recognition-apa-saja-manfaatnya-65a4da2a09e0

Cari Blog Ini

Electrical Engineering

Speech Recognition

Komentar

Posting Komentar

Postingan Populer