Prediksi Bidang Kerja dan Asal Fakultas untuk Alumni Melalui Klusterisasi dan Klasifikasi Kemunculan Kata

Wijaya, Evelyn Anastasia (1272056) (2016) Prediksi Bidang Kerja dan Asal Fakultas untuk Alumni Melalui Klusterisasi dan Klasifikasi Kemunculan Kata. Undergraduate thesis, Universitas Kristen Maranatha.

[img]
Preview
Text
1272056_Abstract_TOC.pdf - Accepted Version

Download (320Kb) | Preview
[img] Text
1272056_Appendices.pdf - Accepted Version
Restricted to Repository staff only

Download (176Kb)
[img]
Preview
Text
1272056_Chapter1.pdf - Accepted Version

Download (175Kb) | Preview
[img] Text
1272056_Chapter2.pdf - Accepted Version
Restricted to Repository staff only

Download (274Kb)
[img] Text
1272056_Chapter3.pdf - Accepted Version
Restricted to Repository staff only

Download (1513Kb)
[img] Text
1272056_Chapter4.pdf - Accepted Version
Restricted to Repository staff only

Download (633Kb)
[img] Text
1272056_Chapter5.pdf - Accepted Version
Restricted to Repository staff only

Download (501Kb)
[img]
Preview
Text
1272056_Conclusion.pdf - Accepted Version

Download (151Kb) | Preview
[img] Text
1272056_Cover.pdf - Accepted Version
Restricted to Repository staff only

Download (1028Kb)
[img]
Preview
Text
1272056_References.pdf - Accepted Version

Download (43Kb) | Preview

Abstract

Kelengkapan basis data alumni adalah hal yang penting bagi universitas. Hubungan timbal balik alumni dengan instansi adalah salah satu butir penting akreditasi universitas maupun akreditasi program studi. Namun, basis data alumni cenderung tidak relevan atau cacat, karena kemungkinan perubahan nomor telepon, alamat rumah, alamat email, dan lain-lain. Padahal informasi tersebut sangat menunjang komunikasi dengan instansi. Dan lagi, tingkat keberhasilan pengajaran suatu universitas juga ditentukan oleh sejalannya bidang kerja alumni dengan bidang ilmu yang telah ditempuh. Oleh karena itu, perlu ditemukan cara untuk dapat melengkapi basis data alumni dan mengetahui pekerjaan alumni dengan tepat. Pertama-tama mengumpulkan informasi yang tersebar di internet. Hal itu dilakukan dengan scraping, yakni mengekstrak dari mesin temu balik, seperti: Google. Tidak hanya itu, perlu dilakukan data filtering. Namun permasalahan muncul karena perkembangan dunia (hingga saat ini populasi dunia 2015 mencapai 7.3 miliar) dan perkembangan teknologi, mengakibatkan banyak orang yang mengacu pada nama yang sama. Dengan demikian, perlu dipikirkan cara untuk membedakan individu yang dicari dari milyaran individu hasil pencarian. Cara yang dilakukan adalah melalui metode klusterisasi (penerapan algoritma Unsupervised Person Name Disambiguator). Algoritma ini mencoba untuk membedakan individu yang dicari dari individu-individu lainnya. Tidak cukup puas dengan performansi algoritma UPND, maka dikembangkan pula algoritma Reduce-UPND. Tidak hanya itu, berbagai tahap data preprocessing perlu dilakukan demi meningkatkan performansi aplikasi ini. Terlebih untuk melihat seberapa besar pengaruh kelas kata terhadap hasil penebakan bidang kerja, maka hasil kluster diklasifikasikan menjadi 2 kelompok; kata benda dan kata kerja (acuan: KBBI). Tidak hanya data mengenai individu yang diolah, tetapi juga perlu didefinisikan pekerjaan. Setelah itu, dilakukan penebakan profesi. Penebakan yang dilakukan berdasarkan informasi individu non-social media. Eksperimen yang dilakukan dalam penelitian ini adalah cross-validation (5-fold) dan hold training-test (3 kombinasi 80%:20%, 70%:30%, dan 60%:40% antara training dan testing). Akurasi dari penebakan bidang kerja dan asal fakultas sebesar 90.91% (pada komposisi 80%:20%). Tidak cukup puas dengan akurasi tinggi dari prediksi bidang kerja dan asal fakultas, aplikasi ini juga membandingkan hasil dari kluster sosial media. Sosial media yang dipilih adalah LinkedIn, mengingat LinkedIn adalah sosial media untuk para profesional dan informasi dalam LinkedIn diisi sendiri oleh individu yang bersangkutan. Aplikasi ini pada akhirnya mengkombinasikan prediksi bidang kerja dan asal fakultas alumni serta ekstraksi informasi dari kluster sosial media LinkedIn, yaitu: pekerjaan sekarang, informasi pendidikan, dan informasi pekerjaan yang lampau.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: virtual alumni tracer (VILTER), disambiguasi nama, prediksi bidang kerja dan asal fakultas, ekstraksi sosial media, LinkedIn
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Information Technology > 72 Information Technology Department
Depositing User: Perpustakaan Maranatha
Date Deposited: 08 Apr 2016 08:26
Last Modified: 08 Apr 2016 08:26
URI: http://repository.maranatha.edu/id/eprint/19916

Actions (login required)

View Item View Item