Analisis part of speech tagging dengan menggunakan Hidden Markov Model pada data Al-Qur'an

Hilal, Muhammad Hafidz Naufal (2021) Analisis part of speech tagging dengan menggunakan Hidden Markov Model pada data Al-Qur'an. Diploma thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (118kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (204kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
3_daftarisi.pdf

Download (165kB) | Preview
[img]
Preview
Text (BAB I)
4_bab1.pdf

Download (337kB) | Preview
[img] Text (BAB II)
5_bab2.pdf
Restricted to Registered users only

Download (554kB) | Request a copy
[img] Text (BAB III)
6_bab3.pdf
Restricted to Registered users only

Download (569kB) | Request a copy
[img] Text (BAB IV)
7_bab4.pdf
Restricted to Registered users only

Download (634kB) | Request a copy
[img] Text (BAB V)
8_bab5.pdf
Restricted to Registered users only

Download (146kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only

Download (150kB) | Request a copy

Abstract

Part of Speech (POS) tagging merupakan bagian dari Natural Language Processing untuk menentukan dengan benar label kata pada suatu kalimat dari input kata yang diberikan secara otomatis. Pengembangan teknik POS tagging untuk bahasa Arab masih sedikit dilakukan. Penelitian ini membahas POS tagging menggunakan metode Hidden Markov Model pada data teks Al-Qur’an. Dalam penelitian ini dataset terdiri dari tiga kategori data yang berasal dari quran corpus terdiri dari 150 kalimat sempurna sederhana, 50 kalimat dengan S/P/O/K lebih dari satu dan 50 ayat Al-Qur’an pilihan. Percobaan data dilakukan dengan menggunakan teknik K-Fold Croos Validation. Dataset dibagi menjadi dua, yaitu data latih dan data uji. Data latih digunakan untuk mencari probabilitas emisi dan transisi, sedangkan pengujian data menggunakan algoritma Viterbi untuk menentukan tag terbaik pada setiap kata. Hasil percobaan didapat akurasi rata-rata sebesar 89,44% untuk kategori pertama yaitu dataset kalimat sederhana, 74,18% untuk kategori kedua yaitu dataset ada anak kalimat, dan 69,04% untuk kategori ketiga yaitu dataset ayat lengkap.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Part of Speech Tagging; Hidden Markov Model; Algoritma Viterbi; K-Fold Cross Validation;
Subjects: Mathematics > Data Processing and Analysis of Mathematics
Applied mathematics > Programming Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: Muhammad Hafidz Naufal Hilal
Date Deposited: 02 Mar 2021 07:42
Last Modified: 02 Mar 2021 07:42
URI: https://etheses.uinsgd.ac.id/id/eprint/37262

Actions (login required)

View Item View Item