1. Data Warehouse.
Data Warehouse
(yang secara harafiah berarti gudang data) adalah kumpulan seluruh data
yang dimiliki oleh perusahaan yang didesain untuk melakukan analisis dan pelaporan, dan bukan untuk pemrosesan transaksi. Jadi, dalam istilah yang lebih sederhana, data warehouse adalah basis data yang ditujukan untuk analisis, pelaporan, dan terkadang juga untuk penambangan pengetahuan (knowledge mining).
Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.
Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse
memisahkan beban kerja analisis dari beban kerja transaksi dan
memungkinkan organisasi menggabung/konsolidasi data dari berbagai macam
sumber.
Dari definisi-definisi yang dijelaskan tadi, dapat disimpulkan data warehouse adalah database yang saling bereaksi yang dapat digunakan untuk query
dan analisisis, bersifat orientasi subjek, terintegrasi,
time-variant,tidak berubah yang digunakan untuk membantu para pengambil
keputusan.
keuntungan data warehouse adalah sebagai berikut :
- Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
- Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
- Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
- Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
2. Data Mart
Data
mart adalah repositori dari data dikumpulkan dari Database yang
selanjutnya dapat melayani tujuan dari suatu kepentingan tertentu atau
kelompok tertentu. Dalam pengembangan perangkat lunak produk, Data mart
membantu dalam memenuhi tuntutan spesifik dari kelompok pengguna dalam
hal konten, akses analisis, dan presentasi secara keseluruhan.
Data Mart memiliki berbagai keuntungan. Ini adalah terutama sebagai berikut:
- Akses mudah ke data yang sering digunakan
- Penciptaan pandang kolektif untuk sekelompok pengguna
- Peningkatan respon-time dari pengguna akhir
- Fleksibel dan mudah cara pembuatan
- Lebih hemat biaya daripada Data warehouse
- Definisi pengguna lebih jelas dari sebuah gudang data.
Data
mart memiliki kelemahan tertentu juga, yaitu tidak bisa sepenuhnya
menilai kinerja LAN berbasis sistem manajemen database sementara port
dari satu lingkungan yang lain.
3. Data Mining
Istilah
data mining sudah berkembang jauh dalam mengadaptasi setiap bentuk
analisa data. Pada dasarnya data mining berhubungan dengan analisa data
dan penggunaan teknik-teknik perangkat lunak untuk mencari pola dan
keteraturan dalam himpunan data yang sifatnya tersembunyi.
Data
mining diartikan sebagai suatu proses ekstraksi informasi berguna dan
potensial dari sekumpulan data yang terdapat secara implisit dalam suatu
basis data. Banyak istilah lain dari data mining yang dikenal luas
seperti knowledge mining from databases, knowledge extraction, data
archeology, data dredging, data analysis dan lain sebagainya.
KEGUNAAN, KEPASTIAN DAN KEAKURATAN HASIL
- Bentuk Standar
Perbedaan MOLAP dan ROLAP
Informasi
yang diperoleh harus secara akurat menggambarkan isi basis data dan
berguna untuk aplikasi terkait. Kekurangsempurnaan yang ada haruslah
dapat diekspresikan dengan suatu ukuran yang pasti dalam bentuk
aturan-aturan kuantitif dan perkiraan-perkiraan yang masuk akal. Noise
dan data-data yang tidak diperlukan harus ditangani dengan rapi dalam
sistem data mining. Hal ini juga akan memotivasi suatu studi sistematik
untuk mengukur kualitas dari informasi yang dihasilkan, termasuk
seberapa menariknya dan tingkat kepercayaannya yang dapat diukur secara
statistik, analitis dan menggunakan model simulasi.
TAHAPAN DALAM DATA MINING
- Basis Data Relasional
- Ekstraksi Data
- Transformasi Data - Pembersihan Data
- Bentuk Standar
- Reduksi Data dan Feature
- Menjalankan Algoritma
4. Data OLAP (On-Line Analytical Processing)
Dengan
adanya data warehouse,semua informasi baik detail maupun hasil summary
yang dibutuhkan dalam proses analisa mudah didapat. OLAP
Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan
dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis,
query dari data yang berukuran besar.
OLAP
mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai
menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah
SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data
yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang
berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas
rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail
dari suatu informasi dan roll-up adalah kebalikannya.
Online
Analytical Processing (OLAP) menawarkan metode analisis data secara
kompleks dan terkustomisasi yang disesuaikan dengan kebutuhan akan
informasi oleh para analis maupun eksekutif. Data yang dikelola oleh
OLAP berasal dari data warehouse. Pengguna OLAP umumnya memanfaatkan
OLAP dengan pola analisis seperti berikut ini :
- Meringkas dan mengumpulkan sejumlah besar data
- Melakukan filtering, pengurutan, dan memberikan peringkat (rangking)
- Membandingkan beberapa set dari data
- Membuat sketsa/bagan/diagram
- Menganalisis dan menemukan pola dari data
- Menganalisis kecenderungan data
5. Data Molap Server
MOLAP adalah
tipe OLAP yang memiliki storage sendiri, yang isinya merupakan
precomputed agregasi data - sum, count, min, max, dan sebagainya - yang
terlibat pada berbagai level detil. Storage ini berupa format yang hanya
dikenali oleh MOLAP server tersebut dan telah khusus dioptimalkan untuk
penggunaan oleh aplikasi tersebut.
Cara kerja MOLAP secara umum dibagi ke dalam dua tahap sebagai berikut :
- Tahap
konstruksi dan populasi data, pada tahap ini sumber data akan dibaca,
dilakukan perhitungan agegrasi (summary group) pada berbagai level
dimensi, dan hasilnya akan disimpan di storage MOLAP. Jika objek data
diperumpamakan dengan table, maka untuk satu cube akan banyak fragmen
table yang isinya adalah detil agregasi dari level tertentu.
- Tahap query atau layanan permintaan data analisis, pada tahap ini OLAP Server akan melayani permintaan query dari client dan membaca data dari storage MOLAP. Table yang akan dibaca adalah suatu fragmen yang akan disesuaikan dengan permintaan dari client. Pada fase query ini, jika OLAP Server terputus dengan data source tidak apa-apa karena sudah tidak ada kaitannya.
6. Data ROLAP (Relational OLAP)
ROLAP adalah
tipe OLAP yang bergantung kepada database relasional atau RDBMS
(Relational Database Management System) sebagai media penyimpanan
(storage) data yang akan diolah.
Dengan strategi
tersebut maka OLAP Server terhindar dari masalah pengelolaan data
storage dan hanya menerjemahkan proses query analysis (MDX) ke
relational query (SQL).
Otomatis proses
optimasi ROLAP akan sangat ditentukan di sisi produk RDBMS yang
digunakan misalkan dari sisi penanganan jumlah data dan strategi
indexing.
Cara kerja ROLAP secara umum adalah sebagai berikut :
- OLAP client mengirimkan query analisis ke OLAP Server.
- OLAP server akan melakukan pemeriksaan di cache apakah sudah bisa melayani permintaan query dari client tersebut, jika sudah akan dikirimkan.
- Jika pada cache belum terdapat data diminta, akan dilakukan query SQL ke data mart dan hasil eksekusinya disimpan di cache dan dikirimkan kepada client. Demikian seterusnya.
- Cache akan disimpan selama periode waktu tertentu dan akan dibersihkan total jika server dimatikan.
Perbedaan
keduanya sangat jelas pada aspek penyimpanan datanya. Jika melihat pada
gambar di atas, maka bagian tersebut adalah "Temporary Or Permanent
Cache", dimana :
ROLAP menggunakan Temporary Cache (SQL Result Cache)
MOLAP menggunakan Permanent Cache (Precomputed Storage)
Sangat jelas
dan sederhana bukan ? Tetapi untuk memperjelas statement di atas maka
kami coba memberikan gambaran mengenai mekanisme kerja keduanya di bawah
ini.
7. HOLAP (Hybrid OLAP)
HOLAP hadir untuk mengatasi kelemahan dari ROLAP dan MOLAP, kelemahan tersebut adalah :
Yang disimpan pada storage HOLAP adalah data untuk beberapa level teratas atau high level view. Sedangkan untuk level yang lebih rendah atau lebih rinci akan disimpan di database relasional. Ilustrasi dari penjelasan tersebut bisa dilihat pada gambar di bawah ini .
8. Business Intellegence
- Performa ROLAP tidak begitu baik karena agregasi selalu dilakukan ulang apabila cache sudah expired.
- Keterbatasan storage dari MOLAP jika digunakan untuk menyimpan kombinasi agregasi pada semua level.
Yang disimpan pada storage HOLAP adalah data untuk beberapa level teratas atau high level view. Sedangkan untuk level yang lebih rendah atau lebih rinci akan disimpan di database relasional. Ilustrasi dari penjelasan tersebut bisa dilihat pada gambar di bawah ini .
Ilustrasi Pivot di HOLAP dan Media Penyimpanannya |
Istilah
Business Intelligence pertama kali didengungkan pada tahun 1989 oleh
Howard Dresner. Dia menggambarkan istilah tersebut sebagai seperangkat
konsep dan metode yang berguna untuk meningkatkan pembuatan keputusan
dengan bantuan sistem yang berbasiskan fakta atau realita yang terjadi.
Menurut tim studi Busines Intelligence pada Departemen Keuangan
Indonesia menyatakan, Business Intelligence (BI) merupakan sistem dan
aplikasi yang berfungsi untuk mengubah data-data dalam suatu perusahaan
atau organisasi (data operasional, data transaksional, atau data
lainnya) ke dalam bentuk pengetahuan. Aplikasi ini melakukan analisis
data-data di masa lampau, menganalisisnya dan kemudian menggunakan
pengetahuan tersebut untuk mendukung keputusan dan perencanaan
organisasi(Indonesia, 2007).
Menurut Nadia
Branon, Business Intelligence merupakan kategori yang umum digunakan
untuk aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisa,
dan menyediakan akses pada data agar dapat membantu pengguna dari
kalangan perusahaan agar dapat mengambil keputusan dengan lebih baik dan
tepat.
Dari definisi
itu, dapat dikatakan bahwa Business Intelligence merupakan suatu sistem
pendukung keputusan yang berdasarkan pada data-data fakta kinerja
perusahaan. Business Intelligence berguna untuk mengefisienkan
finansial, manusia, material serta beberapa sumber daya lainya.
Kegunaan BI
Perusahaan
menggunakan BI untuk memperoleh lebih dalam lagi mengenai segala
informasi yang berhubungan dengan kinerja bisnis. Hal ini digunakan
untuk memahami, meningkatkan kinerja, penganggaran biaya yang lebih
efisien dan mengidentifikasi peluang bisnis baru. Beberapa hal kegunaan
BI, antara lain:
- Analisa dalam perilaku konsumen, pola pembelian dan trend penjualan
- Mengukur, melacak dan memprediksi penjualan dan kinerja keuangan
- Penganggaran, perencanaan keuangan dan peramalan
- Mengetahui kinerja kegiatan pemasaran
- Optimalisasi proses dan kinerja operasional
- Meningkatkan efektifitaspengiriman dan pasokan
- Analisa CRM (Customer Relationship Management)
- Analisa Resiko
- Analisa nilai strategis
- Analisa social media.