Deteksi Pekerjaan Melalui Klasifikasi Naïve Bayes pada Media Sosial Twitter

Stefanus, William (1172143) (2015) Deteksi Pekerjaan Melalui Klasifikasi Naïve Bayes pada Media Sosial Twitter. Undergraduate thesis, Universitas Kristen Maranatha.

[img]
Preview
Text
1172143_Abstract_TOC.pdf - Accepted Version

Download (220Kb) | Preview
[img]
Preview
Text
1172143_Chapter1.pdf - Accepted Version

Download (14Kb) | Preview
[img] Text
1172143_Chapter2.pdf - Accepted Version
Restricted to Repository staff only

Download (176Kb)
[img] Text
1172143_Chapter3.pdf - Accepted Version
Restricted to Repository staff only

Download (431Kb)
[img] Text
1172143_Chapter4.pdf - Accepted Version
Restricted to Repository staff only

Download (987Kb)
[img] Text
1172143_Chapter5.pdf - Accepted Version
Restricted to Repository staff only

Download (1284Kb)
[img]
Preview
Text
1172143_Conclusion.pdf - Accepted Version

Download (70Kb) | Preview
[img] Text
1172143_Cover.pdf - Accepted Version
Restricted to Repository staff only

Download (579Kb)
[img]
Preview
Text
1172143_References.pdf - Accepted Version

Download (9Kb) | Preview

Abstract

Dengan munculnya berbagai media sosial, banyak orang yang menuliskan pendapat terhadap suatu masalah yang sedang terjadi pada media sosial. Setiap orang dalam satu golongan pekerjaan yang sama kemungkinan besar memiliki gaya penulisan bahasa pada media sosial yang hampir mirip. Dengan demikian, dibuatlah penelitian untuk mendeteksi pekerjaan seseorang lewat tweet yang ditulis dengan cara mengidentifikasi gaya bahasa yang digunakan. Analisis dilakukan dengan melakukan klasifikasi tweet. Klasifikasi yang digunakan dalam penelitian ini adalah Naïve Bayes Classifier. Proses yang dilakukan dalam penelitian ini dibagi menjadi tiga bagian utama, yaitu pengambilan dan pengelompokan data, pengolahan data, dan testing. Jenis pekerjaan yang dipakai dalam penelitian ini adalah politisi, artis, pelajar, dan musisi. Proses pengolahan data pada penelitian ini adalah proses pembersihan isi tweet dan pembentukan model yang akan diuji dengan cross-validation dan validasi kesalahan tipe satu. Dalam proses pembentukan model, dipakai juga proses pemecahan kata secara n-gram (unigram, bigram, dan trigram). Pengujian yang dilakukan memakai dua metode, yaitu Naïve Bayes Binomial dan Multinomial. Kesimpulan dari penelitian ini pembentukan model masing-masing pekerjaan secara Naive Bayes Multinomial lebih stabil dibandingkan dengan pembentukan model dengan Naïve Bayes Binomial. Metode pemecahan kata secara n-gram yang paling cocok digunakan adalah unigram.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: naïve bayes classifier, n-gram, tweet, Twitter
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Information Technology > 72 Information Technology Department
Depositing User: Perpustakaan Maranatha
Date Deposited: 18 Nov 2015 07:33
Last Modified: 18 Nov 2015 07:33
URI: http://repository.maranatha.edu/id/eprint/17314

Actions (login required)

View Item View Item