Eksplorasi Metode KSMOTE, AdaBoost dan SSO pada Support Vector Machine untuk Mengatasi Imbalanced Data

Suwarso, Suwarso (1072091) (2015) Eksplorasi Metode KSMOTE, AdaBoost dan SSO pada Support Vector Machine untuk Mengatasi Imbalanced Data. Undergraduate thesis, Universitas Kristen Maranatha.

[img]
Preview
Text
1072091_Abstract_TOC.pdf - Accepted Version

Download (163Kb) | Preview
[img] Text
1072091_Appendices.pdf - Accepted Version
Restricted to Repository staff only

Download (368Kb)
[img]
Preview
Text
1072091_Chapter1.pdf - Accepted Version

Download (183Kb) | Preview
[img] Text
1072091_Chapter2.pdf - Accepted Version
Restricted to Repository staff only

Download (1384Kb)
[img] Text
1072091_Chapter3.pdf - Accepted Version
Restricted to Repository staff only

Download (796Kb)
[img] Text
1072091_Chapter4.pdf - Accepted Version
Restricted to Repository staff only

Download (953Kb)
[img] Text
1072091_Chapter5.pdf - Accepted Version
Restricted to Repository staff only

Download (278Kb)
[img]
Preview
Text
1072091_Conclusion.pdf - Accepted Version

Download (101Kb) | Preview
[img] Text
1072091_Cover.pdf - Accepted Version
Restricted to Repository staff only

Download (1129Kb)
[img]
Preview
Text
1072091_References.pdf - Accepted Version

Download (174Kb) | Preview

Abstract

Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi data yang tidak seimbang antara kelas mayoritas dan kelas minoritas (imbalanced data). Kelas minoritas memiliki kemunculan yang sangat kecil dalam sebuah dataset. Metode-metode algoritma yang akan diteliti untuk menyelesaikan permasalahan imbalanced data adalah, kernel-based synthetic minority over-sampling technique (KSMOTE), Boosting, dan sample subset optimization (SSO). Metode-metode ini berfungsi untuk menyeimbangkan kelas mayoritas dan kelas minoritas dalam sebuah dataset, kemudian dataset diklasifikasikan dengan menggunakan support vector machine (SVM). Imbalanced dataset memiliki tiga karakteristik yaitu, low, medium, dan high. Dataset training diambil dari data nyata yang dimiliki oleh repositori KEEL dan UCI dan dataset testing yaitu data mahasiswa Fakultas Teknologi Informasi Universitas Kristen Maranatha. Proses training dataset dilakukan dengan menggunakan setiap metode pada setiap kategori dataset, setelah mendapatkan hasil klasifikasi pada dataset training, dilakukan uji coba terhadap dataset mahasiswa sebagai data testing. Hasil penelitian ini menunjukkan jumlah class dan imbalance ratio mempengaruhi metode yang digunakan. Terdapat metode-metode yang hanya bekerja pada dua class seperti metode KSMOTE dan SSO, sehingga tidak efektif jika digunakan pada multiclass dataset. Jika dataset memiliki imbalance ratio dan class yang missclassified keseluruhan, sebaiknya menggunakan metode oversampling (KSMOTE) atau undersampling (SSO), karena menggunakan metode boosting (AdaBoost) tidak dapat menyelesaikan permasalahan missclassified keseluruhan pada class.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Information Technology > 72 Information Technology Department
Depositing User: Perpustakaan Maranatha
Date Deposited: 18 Nov 2015 06:56
Last Modified: 18 Nov 2015 06:56
URI: http://repository.maranatha.edu/id/eprint/17311

Actions (login required)

View Item View Item