1. Mengapa
perusahaan perlu mengembangkan datawarehouse ?
Jawab :
Ø Persaingan
antar perusahaan
membuat perusahaan berkembang. IT adalah aspek yang penting untuk menunjang
perkembangan perusahaan.
Ø Diperlukan
informasi untuk menentukan perkembangan perusahaan, agar perusahaan
berkembang kearah yang benar dan dapat bersaing dengan kompetitor.
Ø Informasi
diperoleh dari unit kerja perusahaan yang luas. Perusahaan besar memiliki
banyak unit kerja yang kemungkinan memiliki karakteristik beragam.
Ø Informasi
yang didapat digunakan untuk mengambil keputusan. Informasi yang diperoleh
diolah menjadi sederhana sehingga mempermudah analisa dalam menunjang
pengambilan keputusan.
Datawarehouse :
Ø
Bersifat tetap
Ø
Beorientasi Subjek
Ø
Input dari berbagai sumber data
Operasional :
Ø
Dinamis, transaksi setiap saat
Ø
Beorientasi Objek
Ø
Operasional
3.Saat
mengembangkan datawarehouse, kita perlu menentukan requirement perusahaan.
Jelaskan hal yang perlu dipahami saat menentukan requirement perusahaan ?
Yang perlu diperhatikan diantaranya:
§ Kondisi bisnis
§ Kondisi data
Memahami Kondisi Data: data
merupakan pilar data warehouse, sehingga perlu diperhatikan “kesehatan” melalui
beberapa indikator berikut:
Ø
Sering
ditemui duplikasi data
Ø
Sulit
menarik data dari sistem yang berbeda secara bersaman
Ø
Sering
terjadi miskomunikasi antara laporan yang diminta dan dihasilkan
Ø
Sering
ditemukan data yang salah / perlu dikoreksi
Ø
Waktu
untuk mendapatkan data lama
Ø
Akurasi sering dipertanyakan
Ø
Tidak ada dokumentasi bagaimana data disimpan
dan apa arti data tersebut
Memahami Kondisi Laporan:
Ø
Mengetahui lingkungan dan pengguna laporan
Ø
Mengetahui informasi apa yang disampaikan
Ø
Mengetahui kapan laporan disampaikan
Ø
Mengidentifikasi teknologi apa yang digunakan
Ø
Menentukan business requirement dan scope -
Output: BRD
Ø
Menentukan teknikal design – Output FSD
Ø
Development (desain, ETL) – Output : Sistem
Ø
SIT (System
Integration Setting) – Output: SIT Dock
& evidence
Ø
UAT (User
Acceptance Test) – Output: UAT document
Ø
Migration
– Output: Migration Rundown
Ø
Support
Granularity adalah
tingkat kedetailan atau rangkuman setiap unit data di dalam datawarehouse.
Direksi
hanya ingin mengetahui
informasi penjualan naik atau turun
Ø
Pemimpin
perusahaan perlu
informasi produk yang terjual di setiap daerah dalam satu tahun
Ø
Manager
penjualan perlu melihat
penjualan dari bulan ke bulan
Ø
Denormalisasi menggabungkan beberapa table
menjadi satu table
Ø
Dengan truktur data yang telah denormalisasi
proses read data menjadli lebih efisien
§
Pada gambar berikut , adalah hasil
denormalisasinya
Apakah ada struktur selain star join ?
Skema Star
Join Adalah
sebuah rancangan tabel dalam database multidemensional yang dimana tabel
dimensi yang terhubung langsung pada fact (tabel fakta) datawarehouse
menyerupai bentuk bintang.
Ø
Pada star join seluruh dimension terhubung
langsung pada tabel fakta
Ø
Tabel dimension tidak bertinigkat (hanya satu
level)
Ø
Tabel fakta memiliki seluruh key join dengan
tabel dimensi
Ø
Akses lebih cepat
Ø
Media penyimpanan lebih hemat
Ada, Skema Snowflake, Fact constellations
Ø Sebuah
data mart adalah access layer dari environtment data warehouse yang digunakan
untuk mengeluarkan bagi pengguna.
Ø Data
mart adalah subset dari data warehouse yang biasanya berorientasi pada lini
bisnis tertentu.
Ø Data mart adalah irisan kecil dari data
warehouse. Sedangkan data warehouse memiliki kedalaman yang lebar
Ø Informasi dalam data mart berkaitan dengan
departemen tunggal.
Ø Biasanya,
masing-masing departemen, unit bisnis atau subjek dianggap sebagai pemilik data
mart.
Ø Hal
ini memungkinkan setiap departemen / subjek untuk menggunakan, memanipulasi dan
mengembangkan data mereka dengan cara apapun yang diinginkan tanpa mengubah
informasi dalam data mart atau data warehouse.
Ø Datamart
memnungkinkan untuk menjawab pertanyaan rumit tentang bisnis perusahaan dengan
lebih cepat dari data base relational.
Alasan membuat data mart :
Ø Mudah
dalam mengakses data yang sering digunakan
Ø Mempermudah
menyajikan informasi berdasarkan sudut pandang suatu subjek
Ø Mudah
dibuat
Ø Mempermudah
bisnis user untuk mengakses data yang mereka inginkan
Ø Menyimpan
data yang potensian dan akurat
Populasi
data pada data warehouse menggunakan ETL
Keunggulan ETL :
Ø Dapat
mengatur waktu populasi data
Ø Melakukan
populate data dari berbagai jenis DBMS
Ø Mudah
melakukan pemantauan saat melakukan populasi data
ETL adalah Proses ETL (Extraction, Transformation, Loading)
merupakan proses yang harus dilalui dalam pembentukan data warehouse
Ekstrak
Ø Menarik
data dari berbagai sumberdata
Ø Tempat
dilakukan cleansing
Ø Penyeragaman
format
Ø Dilakukan
di staging
Ø Tidak disimpan dalam waktu yang lama
Transform
Ø Mengubah
natural key menjadi surrogate key
Ø Pengecekan
duplikasi data
Ø Aggregasi antara data staging dengan dimensi
Loading
Ø Populate
data yang sudah di aggregasi kedalam tabel Fact
Ø Format
data sudah seragam
Ø Teknik:
langsung, buffer, cache
Ø Didalam tabel fact tidak terdapat natural key
Comments
Post a Comment