Pembangunan Sistem Analisa Pangsa Pasar Berbasis Data Twitter Berskala Besar

Sarisno, Niko Eleison (1272051) (2016) Pembangunan Sistem Analisa Pangsa Pasar Berbasis Data Twitter Berskala Besar. Undergraduate thesis, Universitas Kristen Maranatha .

[img]
Preview
Text
1272051_Abstract_TOC.pdf - Accepted Version

Download (227Kb) | Preview
[img] Text
1272051_Appendices.pdf - Accepted Version
Restricted to Repository staff only

Download (140Kb)
[img]
Preview
Text
1272051_Chapter1.pdf - Accepted Version

Download (228Kb) | Preview
[img] Text
1272051_Chapter2.pdf - Accepted Version
Restricted to Repository staff only

Download (228Kb)
[img] Text
1272051_Chapter3.pdf - Accepted Version
Restricted to Repository staff only

Download (701Kb)
[img] Text
1272051_Chapter4.pdf - Accepted Version
Restricted to Repository staff only

Download (296Kb)
[img] Text
1272051_Chapter5.pdf - Accepted Version
Restricted to Repository staff only

Download (617Kb)
[img]
Preview
Text
1272051_Conclusion.pdf - Accepted Version

Download (36Kb) | Preview
[img] Text
1272051_Cover.pdf - Accepted Version
Restricted to Repository staff only

Download (985Kb)
[img]
Preview
Text
1272051_References.pdf - Accepted Version

Download (153Kb) | Preview

Abstract

Dokumen teks tergolong dalam data tidak terstruktur. Jika dibandingkan dengan informasi dalam bentuk yang terstruktur seperti dalam tabel pada sebuah database. Maka data tidak terstruktur cukup sulit dalam proses pengelolaan, penyimpanan dan pencarian. Salah satu metode untuk memudahkan dalam proses pencarian teks adalah Inverted Index. Secara intuitif, indexing mirip dengan indeks yang terdapat pada buku. Pada buku yang cukup tebal sering dijumpai halaman “Indeks” yang cara kerjanya sama dengan inverted index. Tujuan menggunakan Inverted Index adalah untuk meningkatkan kecepatan dan efisiensi dalam proses pencarian pada sekumpulan dokumen. Dengan mengindeks dokumen yang akan dicari, maka pencarian dokumen dengan query tertentu tidak perlu dilakukan secara sekuensial atau diperiksa satu persatu. Proses Indexing terdiri dari beberapa tahapan yaitu, cleansing, lower case kalimat, stopword removal, stemming, dan pembentukan index. Proses dilakukan pada data Twitter yang diambil setiap detik oleh sistem pada regional Indonesia. Indeks yang dihasilkan digunakan dalam proses pencarian dokumen teks. Baik hasil pencarian maupun waktu yang dibutuhkan semua di uji dan dicatat untuk mengukur performa sistem. Hasil menunjukan bahwa setelah di indexing proses pencarian menjadi lebih cepat dan efisien. Untuk menampung data yang besar diperlukan sebuah sistem yang mumpuni. Pada umumnya, Perusahaan besar seperti Twitter tidak menggunakan Relational DataBase Management System (RDBMS) dalam pengolahan datanya, melainkan menggunakan NoSQL. Kelebihan utama dari NoSQL adalah untuk menangani Big Data dimana data terus-menerus berkembang, dimana data tersebut sangat kompleks sehingga sebuah database relational tidak lagi bisa mengakomodir. Harus ada cara lain untuk menanggulangi masalah ini, dan NoSQL lah solusinya. NoSQL menyederhanakan proses yang terjadi dalam sistem basis data relasional. Dimana hal-hal yang menyebabkan redudansi, dihilangkan sehingga trafik server akan seimbang. Salah satu produk NoSQL yang mumpuni adalah MongoDB. dilakukan juga pengujian dan dicatat mengenai perbedaan performa dalam penggunaan MySQL untuk RDBMS dan MongoDB untuk NoSQL. Hasil menunjukan penggunaan NoSQL lebih cepat dibandingkan RDBMS.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Inverted Index, MongoDB, MySQL, NoSQL, RDBMS
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Information Technology > 72 Information Technology Department
Depositing User: Perpustakaan Maranatha
Date Deposited: 03 Aug 2016 08:18
Last Modified: 03 Aug 2016 08:18
URI: http://repository.maranatha.edu/id/eprint/20717

Actions (login required)

View Item View Item