School of Information Systems

NATURAL LANGUAGE PROCESSING

Pemrosesan bahasa alami, disingkat PBA atau NLP (natural language processing), adalah cabang ilmu komputer dan linguistik yang mengkaji interaksi antara komputer dengan bahasa (alami) manusia [1]. NLP sering dianggap sebagai cabang dari kecerdasan buatan dan bidang kajiannya bersinggungan dengan linguistik komputasional. Kajian NLP antara lain mencakup segmentasi tuturan (speech segmentation), segmentasi teks (text segmentation), penandaan kelas kata (part-of-speech tagging), serta pengawataksaan makna (word sense disambiguation). Meskipun kajiannya dapat mencakup teks dan tuturan, pemrosesan tuturan (speech processing) telah berkembang menjadi suatu bidang kajian terpisah.

Sejarah NLP dimulai pada tahun 1950-an, meskipun telah ada penilitian NLP pada tahun-tahun sebelumnya. Pada tahun 1950, Alan Turing (bapak ilmu komputer) mempublikasikan artikel terkenalnya yang berjudul “Computing Machinery and Intelligence” yang di dalamnya Alan Turing mengusulkan tes yang sekarang disebut dengan Turing Test. Tes Turing adalah sebuah tes yang mengukur kemampuan mesin (dalam hal ini program komputer) untuk menunjukan perilaku cerdas. Dalam ilustrasi contoh aslinya, seorang juri manusia akan terlibat dalam percakapan dengan manusia dan mesin yang akan dites. Semua peserta dipisahkan satu sama lain. Jika juri tidak bisa membedakan antara manusia dan mesin, maka mesin tersebut dikatakan lulus tes.

Aplikasi NLP

Secara umum, Jenis aplikasi yang bisa dibuat dalam bidang ilmu NLP terbagi dua, yaitu text-based application dan dialogue-based application.Text-based application adalah segala macam aplikasi yang melakukan proses terhadap teks tertulis seperti misalnya dokumen, e-mail, buku dan sebagainya. Beberapa jenis aplikasi NLP yang berbasis teks :

  • Programs for classifying and retrieving documents by content.

Program yang mampu mengklasifikasi dan mengambil isi dari suatu dokumen berdasarkan kontennya. Seperti spam filtering (pemfilteran pesan sampah), language identification (identifikasi bahasa), dan lain-lain.

nlp1Gambar 1. Spam

  • Machine Translation

Program yang mampu mentranslasi kalimat baik berupa teks maupun suara dari satu bahasa alami ke bahasa lainnya. Contoh : Google Translate.

nlp2Gambar 2. Google Translate

Dialogue-based application idealnya melibatkan bahasa lisan atau pengenalan suara, akan tetapi bisa juga memasukan interaksi dialog dengan mengetikkan teks pertanyaan melalui keyboard. Contoh :

  • Intelligent personal assistant.

Perangkat lunak yang mampu melakukan tugas-tugas dan jasa berdasarkan inputan dari pengguna, lokasi, dan memiliki kemampuan untuk mengakses informasi dari berbagai sumber online (seperti cuaca, keadaan lalu lintas, berita, saham, dll). Contohnya adalah Siri pada produk-produk Apple dan S-Voice pada produk-produk seluler Samsung.

  • Chatbot

Chatbot adalah program komputer yang didesain untuk mensimulasikan sebuah percakapan cerdas dengan satu atau lebih pengguna manusia melalui inputan suara atau teks, utamanya digunakan untuk percakapan kecil. Contoh : Cleverbot, SimSimi, dan begobet.

Tantangan dalam NLP

  • Ambiguitas bahasa alami.
  • Representasi pengetahuan adalah tugas yang sulit.
  • Terdapat berbagai tingkat informasi dalam bahasa kita.
  • Terdapat beragam aplikasi untuk teknologi bahasa.

NLP adalah bidang studi tersulit dalam kecerdasan buatan. Tetapi, jika kita berhasil dalam pengembangan NLP maka dampak positifnya sangatlah besar. Contoh-contoh diatas hanyalah sebagian dari aplikasi di seluruh dunia yang telah mengaplikasikan NLP.

Hendro Nindito