Sarisno, Niko Eleison (1272051) (2016) Pembangunan Sistem Analisa Pangsa Pasar Berbasis Data Twitter Berskala Besar. Undergraduate thesis, Universitas Kristen Maranatha .
|
Text
1272051_Abstract_TOC.pdf - Accepted Version Download (227Kb) | Preview |
|
Text
1272051_Appendices.pdf - Accepted Version Restricted to Repository staff only Download (140Kb) |
||
|
Text
1272051_Chapter1.pdf - Accepted Version Download (228Kb) | Preview |
|
Text
1272051_Chapter2.pdf - Accepted Version Restricted to Repository staff only Download (228Kb) |
||
Text
1272051_Chapter3.pdf - Accepted Version Restricted to Repository staff only Download (701Kb) |
||
Text
1272051_Chapter4.pdf - Accepted Version Restricted to Repository staff only Download (296Kb) |
||
Text
1272051_Chapter5.pdf - Accepted Version Restricted to Repository staff only Download (617Kb) |
||
|
Text
1272051_Conclusion.pdf - Accepted Version Download (36Kb) | Preview |
|
Text
1272051_Cover.pdf - Accepted Version Restricted to Repository staff only Download (985Kb) |
||
|
Text
1272051_References.pdf - Accepted Version Download (153Kb) | Preview |
Abstract
Dokumen teks tergolong dalam data tidak terstruktur. Jika dibandingkan dengan informasi dalam bentuk yang terstruktur seperti dalam tabel pada sebuah database. Maka data tidak terstruktur cukup sulit dalam proses pengelolaan, penyimpanan dan pencarian. Salah satu metode untuk memudahkan dalam proses pencarian teks adalah Inverted Index. Secara intuitif, indexing mirip dengan indeks yang terdapat pada buku. Pada buku yang cukup tebal sering dijumpai halaman “Indeks” yang cara kerjanya sama dengan inverted index. Tujuan menggunakan Inverted Index adalah untuk meningkatkan kecepatan dan efisiensi dalam proses pencarian pada sekumpulan dokumen. Dengan mengindeks dokumen yang akan dicari, maka pencarian dokumen dengan query tertentu tidak perlu dilakukan secara sekuensial atau diperiksa satu persatu. Proses Indexing terdiri dari beberapa tahapan yaitu, cleansing, lower case kalimat, stopword removal, stemming, dan pembentukan index. Proses dilakukan pada data Twitter yang diambil setiap detik oleh sistem pada regional Indonesia. Indeks yang dihasilkan digunakan dalam proses pencarian dokumen teks. Baik hasil pencarian maupun waktu yang dibutuhkan semua di uji dan dicatat untuk mengukur performa sistem. Hasil menunjukan bahwa setelah di indexing proses pencarian menjadi lebih cepat dan efisien. Untuk menampung data yang besar diperlukan sebuah sistem yang mumpuni. Pada umumnya, Perusahaan besar seperti Twitter tidak menggunakan Relational DataBase Management System (RDBMS) dalam pengolahan datanya, melainkan menggunakan NoSQL. Kelebihan utama dari NoSQL adalah untuk menangani Big Data dimana data terus-menerus berkembang, dimana data tersebut sangat kompleks sehingga sebuah database relational tidak lagi bisa mengakomodir. Harus ada cara lain untuk menanggulangi masalah ini, dan NoSQL lah solusinya. NoSQL menyederhanakan proses yang terjadi dalam sistem basis data relasional. Dimana hal-hal yang menyebabkan redudansi, dihilangkan sehingga trafik server akan seimbang. Salah satu produk NoSQL yang mumpuni adalah MongoDB. dilakukan juga pengujian dan dicatat mengenai perbedaan performa dalam penggunaan MySQL untuk RDBMS dan MongoDB untuk NoSQL. Hasil menunjukan penggunaan NoSQL lebih cepat dibandingkan RDBMS.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | Inverted Index, MongoDB, MySQL, NoSQL, RDBMS |
Subjects: | T Technology > T Technology (General) |
Divisions: | Faculty of Information Technology > 72 Information Technology Department |
Depositing User: | Perpustakaan Maranatha |
Date Deposited: | 03 Aug 2016 08:18 |
Last Modified: | 03 Aug 2016 08:18 |
URI: | http://repository.maranatha.edu/id/eprint/20717 |
Actions (login required)
View Item |