Datawarehouse – KA - JANURI DWI PRASETYO – 1311501363 (Tugas Pertemuan 7)

    1. Mengapa perusahaan perlu mengembangkan datawarehouse ?
Jawab :
Ø  Persaingan antar perusahaan membuat perusahaan berkembang. IT adalah aspek yang penting untuk menunjang perkembangan perusahaan.
Ø  Diperlukan informasi untuk menentukan perkembangan perusahaan, agar perusahaan berkembang kearah yang benar dan dapat bersaing dengan kompetitor.
Ø  Informasi diperoleh dari unit kerja perusahaan yang luas. Perusahaan besar memiliki banyak unit kerja yang kemungkinan memiliki karakteristik beragam.
Ø  Informasi yang didapat digunakan untuk mengambil keputusan. Informasi yang diperoleh diolah menjadi sederhana sehingga mempermudah analisa dalam menunjang pengambilan keputusan.

2. Jelaskan perbedaan datawarehouse dengan data operasional dari berbagai aspek ?
Datawarehouse :
Ø  Bersifat tetap
Ø  Beorientasi Subjek
Ø  Input dari berbagai sumber data
Operasional :
Ø  Dinamis, transaksi setiap saat
Ø  Beorientasi Objek
Ø  Operasional


3.Saat mengembangkan datawarehouse, kita perlu menentukan requirement perusahaan. Jelaskan hal yang perlu dipahami saat menentukan requirement perusahaan ?
Yang perlu diperhatikan diantaranya:
§   Kondisi bisnis
§   Kondisi data

Memahami Kondisi Data: data merupakan pilar data warehouse, sehingga perlu diperhatikan “kesehatan” melalui beberapa indikator berikut:
Ø  Sering ditemui duplikasi data
Ø  Sulit menarik data dari sistem yang berbeda secara bersaman
Ø  Sering terjadi miskomunikasi antara laporan yang diminta dan dihasilkan
Ø  Sering ditemukan data yang salah / perlu dikoreksi
Ø  Waktu untuk mendapatkan data lama
Ø Akurasi sering dipertanyakan
Ø Tidak ada dokumentasi bagaimana data disimpan dan apa arti data tersebut

Memahami Kondisi Laporan:
Ø   Mengetahui lingkungan dan pengguna laporan
Ø   Mengetahui informasi apa yang disampaikan
Ø   Mengetahui kapan laporan disampaikan
Ø   Mengidentifikasi teknologi apa yang digunakan


 4.Sebutkan dan kelaskan urutan proses pada proyek pengembangan datawarehouse ?

Ø  Menentukan business requirement dan scope - Output: BRD
Ø  Menentukan teknikal design – Output FSD
Ø  Development (desain, ETL) – Output : Sistem
Ø  SIT (System Integration Setting) – Output: SIT Dock & evidence
Ø  UAT (User Acceptance Test) – Output: UAT document
Ø  Migration – Output: Migration Rundown
Ø  Support

5.Jelaskan mengenai granularity pada datawarehouse ?
Granularity adalah tingkat kedetailan atau rangkuman setiap unit data di dalam datawarehouse.
 Direksi hanya ingin mengetahui informasi penjualan naik atau turun
Ø Pemimpin perusahaan perlu informasi produk yang terjual di setiap daerah dalam satu tahun
Ø Manager penjualan perlu melihat penjualan dari bulan ke bulan

6.Mengapa dilakukan dernomalisasi pada datawarehouse ?
Ø Denormalisasi menggabungkan beberapa table menjadi satu table






Ø Dengan truktur data yang telah denormalisasi proses read data menjadli lebih efisien

§  Pada gambar berikut , adalah hasil denormalisasinya



7. Apa yang dimaksud dengan starjoin, bagaimana karakteristiknya ?
Apakah ada struktur selain star join ?
Skema Star Join Adalah sebuah rancangan tabel dalam database multidemensional yang dimana tabel dimensi yang terhubung langsung pada fact (tabel fakta) datawarehouse menyerupai bentuk bintang. 
Ø Pada star join seluruh dimension terhubung langsung pada tabel fakta
Ø Tabel dimension tidak bertinigkat (hanya satu level)
Ø Tabel fakta memiliki seluruh key join dengan tabel dimensi
Ø Akses lebih cepat
Ø Media penyimpanan lebih hemat

Ada, Skema Snowflake, Fact constellations

8.Jelaskan mengenai Data mart pada datawarehouse ?

Ø  Sebuah data mart adalah access layer dari environtment data warehouse yang digunakan untuk mengeluarkan bagi pengguna.
Ø  Data mart adalah subset dari data warehouse yang biasanya berorientasi pada lini bisnis tertentu.
Ø  Data mart adalah irisan kecil dari data warehouse. Sedangkan data warehouse memiliki kedalaman yang lebar
Ø  Informasi dalam data mart berkaitan dengan departemen tunggal.
Ø  Biasanya, masing-masing departemen, unit bisnis atau subjek dianggap sebagai pemilik data mart.
Ø  Hal ini memungkinkan setiap departemen / subjek untuk menggunakan, memanipulasi dan mengembangkan data mereka dengan cara apapun yang diinginkan tanpa mengubah informasi dalam data mart atau data warehouse.
Ø  Datamart memnungkinkan untuk menjawab pertanyaan rumit tentang bisnis perusahaan dengan lebih cepat dari data base relational.

Alasan membuat data mart :
Ø  Mudah dalam mengakses data yang sering digunakan
Ø  Mempermudah menyajikan informasi berdasarkan sudut pandang suatu subjek
Ø  Mudah dibuat
Ø  Mempermudah bisnis user untuk mengakses data yang mereka inginkan
Ø  Menyimpan data yang potensian dan akurat

9.  Jelaskan teknik populasi data pada Data Warehouse! Apa yang dimaksud dengan EPL?

Populasi data pada data warehouse menggunakan ETL

Keunggulan ETL :
Ø  Dapat mengatur waktu populasi data
Ø  Melakukan populate data dari berbagai jenis DBMS
Ø  Mudah melakukan pemantauan saat melakukan populasi data

ETL adalah Proses ETL (Extraction, Transformation, Loading) merupakan proses yang harus dilalui dalam pembentukan data warehouse
Ekstrak
Ø  Menarik data dari berbagai sumberdata
Ø  Tempat dilakukan cleansing
Ø  Penyeragaman format
Ø  Dilakukan di staging
Ø  Tidak disimpan dalam waktu yang lama

Transform
Ø  Mengubah natural key menjadi surrogate key
Ø  Pengecekan duplikasi data
Ø  Aggregasi antara data staging dengan dimensi

Loading
Ø  Populate data yang sudah di aggregasi kedalam tabel Fact
Ø  Format data sudah seragam
Ø  Teknik: langsung, buffer, cache

Ø  Didalam tabel fact tidak terdapat natural key

Comments