DATA WAREHOUSE
PENGERTIAN DATAWAREHOUSE
Nama :
1. Fairuz Rahman (1501153721)
2. Arvin Tobias (1501150625)
3. Kevin Samantha (1501155802)
4. Charles (1501149232)
datawarehouse adalah suatu sistem komputer untuk mengarsipkan dan menganalisis data historis suatu organisasi seperti data penjualan, gaji, dan informasi lain
dari operasi harian. Pada umumnya suatu organisasi menyalin informasi
dari sistem operasionalnya (seperti penjualan dan SDM) ke gudang data
menurut jadwal teratur, misalnya setiap malam atau setiap akhir minggu. Setelah itu, manajemen dapat melakukan
kueri kompleks dan analisis (contohnya penambangan data, data mining
) terhadap informasi tersebut tanpa membebani sistem yang operasional.
Datawarehose sering di integrasikan dengan berbagai system apliskasi untuk mendukung laporan dan analisa data
dengan menyediakan history data yang menyediakan infrastruktur bagi DSS dan EIS
Data warehouse
bukan merupakan basis data operasional, melainkan basis data yang
berisi data dalam dimensi waktu tertentu yang sangat berguna untuk
keperluan evaluasi, analisis dan perencanaan yang dilakukan oleh pihak
manajemen dalam sebuah perusahaan. Meskipun demikian, belum banyak
perusahaan yang mengembangkan dan menerapkan data warehouse serta
memanfaatkannya guna menunjang berbagai hal penting didalam organisasi atau institusi.
Perencanaan arsitektur pada pengembangan data warehouse ini meliputi arsitektur logical dan arsitektur fisik.
Arsitektur logical berupa rancangan tahapan alur data dari sumber data sampai menjadi data pada data warehouse, sedangkan arsitektur fisik berupa gambaran konfigurasi teknis dari data warehouse tersebut.
KOMPONEN DATAWAREHOUSE
Data Source
Untuk membangun suatu
datawarehouse yang baik data yang didapatkan harus teralokasi dengan
baik. Ini melibatkan OLTP saat ini dimana informasi ‘dari hari ke hari’
tentang bisnis yang berjalan, tentunya dengan data historis periode
sebelumnya, yang mungkin telah dikumpulkan dalam beberapa bentuk sistem
lain. Sering kali data yang terbentuk bukan terbentuk database
relasional, sehingga membutuhkan banyak upaya untuk mengambil data yang diinginkan.
Design Datawarehouse
Proses perancangan datawarehouse
sangat berhati-hati untuk memilih jenis query yang digunakan dalam
datawarehouse. Tahapan ini sangat memerlukan pemahaman yang baik tentang
skema database yang ingin dibuat, dan haruslah selalu aktif untuk
berkomunikasi dengan pengguna. Desain adalah proses yang tidak dilakukan
satu kali, melainkan berulang-ulang agar model yang dimiliki stabil.
Tahap ini harus dilakukan secara berhati-hati karena model akan diisi
dengan data yang jumlahnya sangat banyak, yang salah satunya dari
beberapa model adalah model yang tak dapat diubah.
Akuisi data
Proses perpindahan data dari
sumbernya (source) ke datawarehouse. Proses ini proses yang menggunakan
banyak waktu dalam proyek datawarehouse, dan dilakukan dengan software
yang
dikenal dengan ETL (extract,transform,load) Tools. Sekarang sudah
hamper lebih kurang 60 tool yang tersebar diranah maya. Waktu yang
dibutuhkan untuk akuisisi data bisa mencapai berbulan-bulan bahkan
bertahun-tahun.
Perubahan data tangkapan
Pembaharuan data periodik
datawarehouse dari sistem transaksi menjadi rumit karena harus
diidentifikasi dari sumber data yang selalu up to date. Ini disebut
dengan ‘perubahan data capture
’.
Ini merupakan tahapan khusus, dan sudah cukup banyak software yang
beredar untuk mengatasinya. Seperti Replication Server,
Publish/Subscribe, Triggers and Stored Procedures, dan Database log Analysis
.
Pembersihan Data
Ini biasanya dilakukan dengan
akuisisi data, kalau dalam ETL ini terdapat pada bagian ‘T’.
Datawarehouse yang berisi data tidak benar tidak hanya tak berguna, tapi
juga menyesatkan. Ide dibalik pembuatan datawarehouse adalah untuk
memudahkan pengambilan keputusan, jika keputusan yang besar yang
ditunjang oleh data yang tidak valid maka perusahaan mengalami resiko
yang amat besar pula.
Pembersihan data suatu proses
rumit yang memvalidasi dan bila perlu mengoreksi data sebelum masuk
kedalam datawarehouse. Pembersihan data dapat juga disebut sebagai “data scrubbing” atau“penjamin kualitas data”,
proses ini harus dilakukan secara berhati-hati dan dilakukan
keseluruhan terutama datawarehouse yang diambil dari perangkat yang
sudah tua.
Data Aggregation
Termasuk proses tansformasi, datawarehouse dirancang untuk menyimpanan yang amat detil dari tiap transaksi, untuk beberapa tingkat aggregate(ringkasan).
Keuntungan jika data diringkas yaitu query khusus dalam datawarehouse
berjalan lebih cepat. Kekurangannya adalah informasi yang didapat
kurang, karena ringkasnya data yang ada pada datawarehouse. Ini harus
berhati-hati karena keputusan tidak dapat dibatalkan tanpa membangun
kembali datawarehouse dan mencocokan dengan datawarehouse lain (atau
sumber data lain). Paling aman digunakan oleh perusahaan yang amat
besar, yang mampu membangun datawarehouse tingkat detail yang tinggi
dengan biaya yang besar pula.
3 Model Datawarehouse
Enterprise Datawarehouse
Semua informasi yang dikumpulkan berupa subjek, yang mencakup seluruh organisasi perusahaan.
Data
Mart
Sebagian data dari bagian
perusahaan yang mempunyai nilai bagi pengguna. Ruang lingkupnya lebih
spesifik, seperti data Penjualan atau marketing
saja.
Virtual Warehouse
Memantau melalui data operasional pada database
.
Suatu ringkasan dari data yang fleksibel, mengurangi biaya untuk
pengguna yang membutuhkan. Karena tersedianya data yang siap disajikan
tidak hanya untuk beberapa pengguna didalam perusahaan, akan tetapi
perusahaan lain yang membutuhkan data tersebut dapat mudah untuk
memperolehnya.
Keuntungan Datawarehouse
Datawarehouse menyediakan model
data yang bervariasi, dan tidak bergantung pada satu sumber data saja.
Hal ini memudahkan pimpinan perusahaan/manager membuat laporan dan
menganalisa.
Saat me-load data ke dalam
datawarehouse, data yang tidak konsisten akan diketahui dan secepatnya
dirubah. Mendukung proses pembuatan laporan, agar keputusan yang diambil
adalah keputusan yang benar sesuai data.
Keamanan informasi didalam
datawarehouse terjamin, karena datawarehouse selalu digunakan dan
dimonitor oleh pengguna datawarehouse tersebut.
Dalam membuat laporan tidak
membuat proses transaksi yang ada menjadi lambat, karena datawarehouse
terpisah dengan database operasional.
Datawarehouse menyediakan berbagai macam bentuk laporan yang terbaru.
Kerugian Datawarehouse
Datawarehouse tidak cocok untuk data
yang tidak struktur.
Data perlu di extract, diubah, dan di load ke datawarehouse, sehingga membutuhkan waktu (delay) kerja untuk datawarehouse yang belum terbentuk.
Semakin lama masa hidup bisnis
yang menggunakan datawarehouse, maka semakin banyak biaya yang
dikeluarkan oleh perusahaan untuk memodifikasi teknologi datawarehouse
atau perawatan berjalan datawarehouse.
Jika data yang diambil lambat, maka data yang dimiliki di datawarehouse tidak berkulitas/ sehingga laporan tidak optimal