Friday, May 17, 2013

Alternatif Arsitektur Data Warehouse

Data Warehouse, atau biasa disingkat dengan DW, atau DWH, secara harfiah diartikan sebagai “gudang data”, namun secara makna didefinisikan oleh Inmon sebagai “Kumpulan data dengan karakteristik subject-orientedintegrated, time variant dan non-volatile yang digunakan untuk kebutuhan pengambilan keputusan strategis organisasi ” .
Definisi di atas adalah yang umum dijadikan referensi di berbagai literatur.
Di samping data warehouse, di dunia data warehouse juga dikenal istilah Data Mart, yaitu kumpulan data yang digunakan sebagai bahan analisis suatu departemen tertentu, atau subject area tertentu. Perbedaan utamanya yaitu pada cakupan data yang dimiliki oleh Data Mart, yang terbatas pada subject area atau departemen tertentu, sedangkan Data Warehouse mencakup semua bagian di perusahaan.
Pada suatu training, saya menjelaskan mengenai 4 alternatif arsitektur data warehouse berdasarkan gambar berikut


Mari kita bahas sekilas mengenai keempat arsitektur data warehouse di atas:
  1. Enterprise Data Warehouse. Pada arsitektur ini, Data Warehouse merupakan satu-satunya penyimpanan data dari berbagai sumber di suatu organisasi. DWH ini juga yang dijadikan acuan utama dalam melakukan analisis, membuat laporan, dashboard, data mining, dan Business Intelligence. Kelebihan dari pendekatan ini adalah sumber data untuk analisis adalah hanya DWH ini, selain itu, kelebihannya yaitu semua data terintegrasi dengan baik (dengan syarat proses analisis dan perancangan DWH dilakukan dengan matang). Kekurangan pendekatan ini adalah ketika data yang dimiliki sudah sangat banyak, DWH dengan arsitektur Enterprise Data Warehouse bisa mengalami masalah kinerja, apalagi jika ditambah semakin banyaknya pengguna yang menembak DWH ini secara bersama-sama.
  2. Dependent Data Mart. Saya melihat arsitektur ini sebagai kelanjutan dari Enterprise Data Warehouse. Ketika DWH pada EDW sudah dianggap berat, ditambah effort untuk mengupgrade infrastruktur yang kadang tidak ekonomis, maka dibuatlah data mart-data mart di satu atau lebih departemen untuk mengakomodasi kebutuhan laporan di departemen yang bersangkutan . Kelebihan dari arsitektur ini adalah  kinerja DWH menjadi lebih ringan. Jika sebelumnya sehari ada 10,000 hit yang ditujukan ke data warehouse, dengan adanya data mart baru, sebagian porsi hit tersebut akan mengarah ke data mart, misalkan porsi data warehouse tinggal 8,000 hit dan yang 2,000 ditujukan ke data mart. Jika satu data mart masih dianggap kurang, maka bisa dibuat data mart berikutnya untuk departemen lain, misalkan penjualan. Pembuatan data mart baru tersebut mungkin bisa mengurangi hit data warehouse menjadi 6,000. Begitu seterusnya hingga dicapai nilai yang optimal. Disamping manfaat dari sisi kinerja, dependent data mart juga memungkinkan setiap departemen melakukan tuning lebih jauh terhadap struktur tabel dimensional. Tuning  dimaksudkan  untuk meningkatkan kinerja sistem secara keseluruhan dalam mengakomodasi kebutuhan analisis departemen yang mungkin belum diakomodasi oleh data warehouse. Dibandingkan arsitektur dengan data mart yang lainnya, alternatif ini memiliki karakteristik Enterprise Data, yaitu data yang terdapat di DWH dan DM memiliki cakupan validitas di tingkat enterprise/organisasi/perusahaan karena tingkat tersebut sudah didapatkan ketika memasuki DWH.
  3. Independent Data Mart. Meskipun sama-sama memiliki DM seperti pada arsitektur Dependent Data Mart, alternatif  ini tidak memiliki Data Warehouse di dalamnya. Setiap DM harus memiliki strategi integrasi yang tidak terkait. Hal itu dikarenakan nature dari pembangunan DM adalah karena tingginya kebutuhan data untuk analisis pada suatu departemen dan tidak optimal jika harus menunggu dibuatnya DWH di level organisasi/perusahaan.  Karena itulah satu departemen memutuskan membuat DM versi departemen itu. Jika ada departemen lain yang memiliki kebutuhan analisis yang tinggi juga, maka dimungkinkan dorongan untuk membuat DM di departemen tersebut juga tinggi, ditambah adanya contoh departemen lain yang sudah membangun DM versi departemennya. Hal pokok yang biasanya menjadi kekurangan di pendekatan ini adalah data yang dihasilkan cenderung belum menjadi  level enterprise, namun masih di tingkat departemen. Hal tersebut dikarenakan  pembangunan DM mungkin hanya melibatkan departemen pembuat, dengan sedikit sekali-atau tanpa-keterlibatan departemen lain, sehingga aspek integrasi format data dan formula tidak terpenuhi.
  4. Enterprise Data Mart. Ini merupakan alternatif solusi antara Dependent Data Mart dan Independent Data Mart. Adanya staging yang berada di level Enterprise adalah sebagai area integrasi data dari berbagai sistem. Dengan demikian, data lebih dekat ke level enterprise. Namun demikian, kendala integrasi kadang juga menjadi masalah di sini, yaitu jika ketika mengembangkan DM untuk departemen A, departemen-departemen lain yang ada di organisasi tidak banyak dilibatkan, atau bahkan tidak dilibatkan sama sekali.


No comments:

Post a Comment

Kebahagiaan sejati bukanlah pada saat kita berhasil meraih apa yg kita perjuangkan, melainkan bagaimana kesuksesan kita itu memberi arti atau membahagiakan orang lain.