Stefanus, William (1172143) (2015) Deteksi Pekerjaan Melalui Klasifikasi Naïve Bayes pada Media Sosial Twitter. Undergraduate thesis, Universitas Kristen Maranatha.
|
Text
1172143_Abstract_TOC.pdf - Accepted Version Download (220Kb) | Preview |
|
|
Text
1172143_Chapter1.pdf - Accepted Version Download (14Kb) | Preview |
|
Text
1172143_Chapter2.pdf - Accepted Version Restricted to Repository staff only Download (176Kb) |
||
Text
1172143_Chapter3.pdf - Accepted Version Restricted to Repository staff only Download (431Kb) |
||
Text
1172143_Chapter4.pdf - Accepted Version Restricted to Repository staff only Download (987Kb) |
||
Text
1172143_Chapter5.pdf - Accepted Version Restricted to Repository staff only Download (1284Kb) |
||
|
Text
1172143_Conclusion.pdf - Accepted Version Download (70Kb) | Preview |
|
Text
1172143_Cover.pdf - Accepted Version Restricted to Repository staff only Download (579Kb) |
||
|
Text
1172143_References.pdf - Accepted Version Download (9Kb) | Preview |
Abstract
Dengan munculnya berbagai media sosial, banyak orang yang menuliskan pendapat terhadap suatu masalah yang sedang terjadi pada media sosial. Setiap orang dalam satu golongan pekerjaan yang sama kemungkinan besar memiliki gaya penulisan bahasa pada media sosial yang hampir mirip. Dengan demikian, dibuatlah penelitian untuk mendeteksi pekerjaan seseorang lewat tweet yang ditulis dengan cara mengidentifikasi gaya bahasa yang digunakan. Analisis dilakukan dengan melakukan klasifikasi tweet. Klasifikasi yang digunakan dalam penelitian ini adalah Naïve Bayes Classifier. Proses yang dilakukan dalam penelitian ini dibagi menjadi tiga bagian utama, yaitu pengambilan dan pengelompokan data, pengolahan data, dan testing. Jenis pekerjaan yang dipakai dalam penelitian ini adalah politisi, artis, pelajar, dan musisi. Proses pengolahan data pada penelitian ini adalah proses pembersihan isi tweet dan pembentukan model yang akan diuji dengan cross-validation dan validasi kesalahan tipe satu. Dalam proses pembentukan model, dipakai juga proses pemecahan kata secara n-gram (unigram, bigram, dan trigram). Pengujian yang dilakukan memakai dua metode, yaitu Naïve Bayes Binomial dan Multinomial. Kesimpulan dari penelitian ini pembentukan model masing-masing pekerjaan secara Naive Bayes Multinomial lebih stabil dibandingkan dengan pembentukan model dengan Naïve Bayes Binomial. Metode pemecahan kata secara n-gram yang paling cocok digunakan adalah unigram.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | naïve bayes classifier, n-gram, tweet, Twitter |
Subjects: | T Technology > T Technology (General) |
Divisions: | Faculty of Information Technology > 72 Information Technology Department |
Depositing User: | Perpustakaan Maranatha |
Date Deposited: | 18 Nov 2015 07:33 |
Last Modified: | 18 Nov 2015 07:33 |
URI: | http://repository.maranatha.edu/id/eprint/17314 |
Actions (login required)
View Item |