Implementasi Algoritma Latent Dirichlet Allocation pada data teks terjemah hadits bahasa Inggris

Huda, Miftakhul (2020) Implementasi Algoritma Latent Dirichlet Allocation pada data teks terjemah hadits bahasa Inggris. Diploma thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (300kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (248kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
3_daftarisi.pdf

Download (449kB) | Preview
[img]
Preview
Text (BAB I)
4_bab1.pdf

Download (478kB) | Preview
[img] Text (BAB II)
5_bab2.pdf
Restricted to Registered users only

Download (958kB) | Request a copy
[img] Text (BAB III)
6_bab3.pdf
Restricted to Registered users only

Download (1MB) | Request a copy
[img] Text (BAB IV)
7_bab4.pdf
Restricted to Registered users only

Download (952kB) | Request a copy
[img] Text (BAB V)
8_bab5.pdf
Restricted to Registered users only

Download (245kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only

Download (478kB) | Request a copy

Abstract

Metode penambangan teks (text mining) dalam bidang ilmu komputer sangat berkembang. Terdapat banyak metode yang sudah diperkenalkan mulai dari TF-IDF (term frequency-index document frequency), LSI (Latent Semantic Indexing), LDA (Latent Dirichlet Allocation) dan masih banyak lagi metode lainnya. Pada penelitian ini penulis akan membahas mengenai LDA. LDA merupakan metode ekstraksi fitur berbasis topik. LDA akan diimplementasikan dengan membuat aplikasi menggunakan perangkat lunak Python. Dokumen yang digunakan merupakan terjemah hadits bahasa inggris sebanyak 903 dokumen. Proses pengolahan melibatkan tokenizing, stemming, filtering dan ekstraksi topik. Hasil ekstraksi berupa nilai probabilitas topik pada kata dan probabilitas topik pada dokumen. Setelah itu, probabilitas topik kata diklasifikasi dan probabilitas topik dokumen diklasifikasikan berdasarkan probabilitas terbesar. Kemudian hasil klasifikasi dievaluasi dari topik aslinya menggunakan precision, recall, accuracy dan f-measure.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: latent dirichlet allocation;ektraksi topik;hadits
Subjects: Data Processing, Computer Science > Computers Mathematical Principles
Mathematics > Data Processing and Analysis of Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: Miftakhul Huda
Date Deposited: 17 Mar 2021 07:01
Last Modified: 17 Mar 2021 07:01
URI: https://etheses.uinsgd.ac.id/id/eprint/37873

Actions (login required)

View Item View Item