Apa itu natural language processing – Istilah ini mungkin sangat asing di telinga anda, tetapi tahukah Anda bahwa sebenarnya natural language processing cukup sering ditemui dalam aktivitas sehari-hari walau tak disadari. Berikut ini penjelasan selengkapnya tentang natural language processing.
Apa Itu Natural Language Processing
Natural language processing (NLP) merupakan cabang dari kecerdasan buatan yang berhubungan dengan interaksi antara komputer dengan manusia menggunakan bahasa alami. Menurut Textmetrics, Apa Itu Natural Language Processing digunakan untuk mengukur sentimen dan untuk menentukan bagian mana dari bahasa manusia yang penting. Natural language processing ini biasanya digunakan untuk aplikasi berikut.
- Aplikasi Google Translate.
- Aplikasi Microsoft Word dan Grammarly, yang digunakan untuk memeriksa keakuratan tata bahasa teks.
- Aplikasi chatbot ataupun Interactive Voice Response (IVR) yang biasa digunakan untuk menanggapi permintaan pengguna tertentu.
- Aplikasi OK Google, Siri, Cortana, dan juga Alexa.
Berikut ini ada beberapa pendekatan yang digunakan agar komputer dapat memahami bahasa manusia.
-
Pendekatan Simbolik
Pendekatan simbolik ini menggunakan pendekatan yang berdasarkan dengan aturan dan leksikon yang dikembangkan oleh manusia. Yang artinya, sistem menerima aturan bicara dalam bahasa tertentu yang diwujudkan dan kemudian direkam oleh pakar linguistik untuk diikuti.
-
Pendekatan Statistik
Pendekatan statistik ini didasarkan pada contoh fenomena linguistik, yang dapat diamati dengan berulang. Sehingga sistem dapat mengenali tema berulang melalui analisis matematis. Setelah melakukan identifikasi tren dalam sampel teks yang besar, maka sistem komputer dapat mengembangkan aturan linguistiknya sendiri yang kemudian akan digunakan untuk menganalisis input bahasa yang digunakan.
-
Pendekatan Koneksi
Pendekatan koneksi adalah pendekatan yang menggabungkan pendekatan simbolik dengan pendekatan statistik. Yang mana ini dimulai dengan menggunakan aturan bahasa secara umum dan juga menyesuaikannya dengan aplikasi spesifik dari input yang asalnya dari pendekatan statistik.
Teknik Yang Digunakan Dalam Natural Language Processing
Dilansir dari Becoming Human, bahwa natural language processing menggunakan 2 teknik untuk menyelesaikan tugasnya.
-
Syntax
Syntax mengacu pada susunan kata-kata dalam seatu kalimat, sehingga terlihat masuk akal secara tata bahasa. Natural language processing menggunakan analisis syntax, untuk menerapkan aturan tata bahasa pada kumpulan kata yang telah ditemukannya. Berikut ini beberapa teknik syntax yang bisa digunakan.
- Lemmatization, melakukan pengurangan berbagai bentuk kata yang kemudian berubah menjadi 1 bentuk untuk memudahkan analisis.
- Segmentasi morfologis, untuk bisa melibatkan pembagian kata menjadi unit-unit individu atau pun morfem.
- Segmentasi kata, untuk membagi sebagian besar teks berkelanjutan, yang kemudian menjadi unit-unit berbeda.
- Penandaan part-of-speech, dengan mengidentifikasi bagian dari ucapan untuk di setiap katanya.
- Parsing, dengan melakukan analisis tata bahasa untuk kalimat yang telah disediakan.
- Pemutusan kalimat, untuk menempatkan batas kalimat pada sepotong teks besar.
- Stemming, untuk memotong kata-kata yang telah diubah ke bentuk akarnya.
-
Semantics
Semantics mengacu pada makna yang telah disampaikan oleh sebuah teks dan ini merupakan aspek yang paling sulit untuk dianalisis dalam natural language processing dan yang pasti belum sepenuhnya dipelajari. Analisis ini akan melibatkan penerapan algoritma komputer, untuk dapat memahami arti serta interpretasi kata-kata dan bagaimana kalimat itu disusun. Berikut merupakan beberapa teknik semantics yang umum untuk digunakan dalam natural language processing.
- Named entity recognition (NER) ini akan melibatkan penentuan bagian-bagian teks yang dapat diidentifikasi dan juga dikategorikan ke dalam grup tertentu. Contohnya saja seperti nama orang dan nama tempat.
- Disambiguasi arti kata, ini akan melibatkan pemberian makna pada kata yang berdasarkan konteksnya.
- Natural language generation, ini akan melibatkan penggunaan database, untuk mendapatkan maksud semantik dari teks dan kemudian mengubahnya menjadi bahasa manusia..