Berkenalan dengan Data Warehouse
Mata Kuliah: Data Warehouse
Dosen: I Putu Agus Eka Pratama, S.T., M.T.
Universitas: Universitas Udayana
Sebelum berkenalan dengan gudang data (Data Warehouse), mari kita mundur sedikit untuk memahami apa itu basis data (Database).
Database merupakan suatu kumpulan data yang disimpan dalam penyimpanan komputer dengan terstruktur dan sistematis. Database sendiri berbentuk tabel (table) yang berisikan baris (row) dan kolom (column).
Dalam database, terdapat Structure Query Language (SQL) untuk manajemen pada tabel. Selain itu, SQL juga mengenal dengan select, insert, update, dan delete untuk melakukan perubahan data dalam tabel. Nah ini, disebut sebagai data transaksional. Nah dalam Data Warehouse, konsep ini “bergeser” sedikit sehingga disebut sebagai data historis.
Lalu, apa perbedaan data transaksional dan data historis?
Sebagai contoh untuk membandingkan, penulis menggunakan kasus sederhana yaitu melakukan perubahan pada data.
Pada data transaksional, merubah data dilakukan dengan cara menimpa data tersebut, sedangkan pada data historis proses tersebut dilakukan dengan cara menambahkan data baru sehingga data yang lama dan data baru masih ada.
Setelah itu, muncul kembali pertanyaan. Apa guna dari data historis?
Sederhananya, digunakan dalam keperluan analisa untuk mendapatkan suatu informasi dari data-data tersebut.
Nah sekarang, kembali kepada Data Warehouse itu sendiri. Menurut Bill Immon, menyatakan bahwa Data Warehouse didefinisikan sebagai sekumpulan data yang memiliki enam buah sifat atau karakteristik berupa berorientasi subjek (Subject Oriented), terintegrasi (Integrated), berorientasi kepada proses (Process Oriented), Time Variant, dapat diakses dengan mudah (Accesible), dan bersifat Non Volatile. Kemudian, menurut Ralp Kimball bahwa Data Warehouse merupakan sebuah sistem untuk pengumpulan data transaksional dari berbagai sumber data, ang mengutamakan adanya 2 hal : query dan analisa data.
Jadi, untuk mudahnya kita analogikan Data Warehouse itu sebagai sebuah gudang yang menyimpan banyak hal. Jika seseorang ingin mengambil sesuatu, maka tidak serta merta mengambil begitu saja. Perlu adanya pengurutan, pemilahan sesuai dengan kebutuhan yang diinginkan. Begitu juga dengan Data Warehouse, sumber data yang dimilikinya dari berbagai sumber, dan berbagai format. Ketika ingin digunakan untuk tujuan tertentu, perlu adanya “penyeragaman” kemudian barulah bisa “diolah”. Setelah “jadi”, barulah bisa digunakan untuk keperluan seperti analisa, penentuan strategi, pengambilan keputusan, dan yang lainnya.
Sumber data dari Data Warehouse ini bisa berasal dari sistem informasi, sosial media, inputan pengguna, wordprocessor, dokumen fisik hasil scan, dan lain sebagainya. Dari yang telah disebutkan, data tersebut terdiri dari banyak format. Nah untuk melakukan penyelasaran, maka perlu dilakukannya Extraction, Translate, dan Loading (ETL).
Seperti yang dilihat pada Gambar 1, yang mana merupakan proses dari Business Intelligence. Proses Business Intelligence merupakan salah satu dari tujuan adanya Data Warehouse. Sumber data dari database, ERP, CRM, dan berkas-berkas diseragamkan melalui proses ETL untuk dapat masuk ke dalam Data Warehouse.
Manfaat dari Data Warehouse secara umum, untuk membantu dalam 3 hal, yaitu analisa data, pengambilan keputusan, dan penentuan strategi. Bidang-bidang yang membutuhkan peran dari Data Warehouse yaitu.
- Bidang Perbankan
Transaksi, analisa nasabah, report, business intelligence (namun mulai tergantikan/ditambahkan dengan Big Data dan cloud untuk kehandalan sistem). - Bidang Industri
Berkaitan dengan ERP (bahan mentah sampai dengan produk jadi, pegawai, distribusi, dan lain-lain) - Bidang Pemerintahan
E-Government, Smart City
Dalam bidang apapun itu, Data Warehouse tetap berperan penting untuk hal-hal berikut ini, yaitu.
- Laporan (report)
- Analisa data
- Pengambilan keputusan
- Penentuan strategi
Inilah pembedanya data warehouse dengan sebuah database biasa/konvensional.
Demikian materi yang penulis bisa rangkum dalam perkuliahan Data Warehouse di Universitas Udayana. Semoga penjelasan yang diberikan dapat dimengerti oleh pembaca. Saya ucapkan terima kasih.
Referensi
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017