Apa itu Pergudangan Data?
Pergudangan data adalah penyimpanan elektronik dari sejumlah besar informasi oleh bisnis atau organisasi. Pergudangan data merupakan komponen penting dari intelijen bisnis yang menggunakan teknik analitik pada data bisnis.
Konsep pergudangan data diperkenalkan pada tahun 1988 oleh peneliti IBM Barry Devlin dan Paul Murphy. Kebutuhan untuk menyimpan data berevolusi ketika sistem komputer menjadi lebih kompleks dan menangani peningkatan jumlah data. Sebuah buku kunci tentang pergudangan data adalah WH Inmon's "Building the Data Warehouse, " yang pertama kali diterbitkan pada tahun 1990 dan telah dicetak ulang beberapa kali sejak itu.
Bagaimana Data Warehousing Bekerja
Pergudangan data digunakan untuk memberikan wawasan yang lebih besar tentang kinerja suatu perusahaan dengan membandingkan data yang dikonsolidasikan dari berbagai sumber heterogen. Gudang data dirancang untuk menjalankan kueri dan analisis data historis yang berasal dari sumber transaksional.
Setelah data dimasukkan ke dalam gudang, itu tidak berubah dan tidak dapat diubah karena data warehouse menjalankan analitik pada peristiwa yang telah terjadi dengan memfokuskan pada perubahan data dari waktu ke waktu. Data yang disimpan harus disimpan dengan cara yang aman, andal, mudah diambil, dan mudah dikelola.
Ada langkah-langkah tertentu yang diambil untuk membuat data warehouse. Langkah pertama adalah ekstraksi data, yang melibatkan pengumpulan sejumlah besar data dari berbagai titik sumber. Setelah data dikompilasi, ia akan melalui pembersihan data, proses menyisir data untuk kesalahan dan memperbaiki atau mengecualikan kesalahan yang ditemukan.
Data yang dibersihkan kemudian dikonversi dari format database ke format gudang. Setelah disimpan di gudang, data akan disortir, dikonsolidasikan, diringkas, dll. Sehingga lebih terkoordinasi dan lebih mudah digunakan. Seiring waktu, lebih banyak data ditambahkan ke gudang karena banyak sumber data diperbarui.
Pengambilan Kunci
- Pergudangan data adalah penyimpanan elektronik dari sejumlah besar informasi oleh bisnis atau organisasi. Gudang data dirancang untuk menjalankan kueri dan analisis data historis yang berasal dari sumber transaksional untuk intelijen bisnis dan keperluan penambangan data. Data pergudangan digunakan untuk menyediakan wawasan kinerja perusahaan dengan membandingkan data yang dikonsolidasikan dari berbagai sumber heterogen.
Pertimbangan Khusus: Penambangan Data
Bisnis mungkin menyimpan data untuk digunakan dalam eksplorasi dan penambangan data, mencari pola informasi yang akan membantu mereka meningkatkan proses bisnis mereka. Sistem pergudangan data yang baik juga dapat memudahkan berbagai departemen dalam perusahaan untuk mengakses data satu sama lain.
Misalnya, gudang data mungkin memungkinkan perusahaan untuk dengan mudah menilai data tim penjualan dan membantu membuat keputusan tentang bagaimana meningkatkan penjualan atau merampingkan departemen. Bisnis mungkin memilih untuk fokus pada kebiasaan belanja pelanggan untuk memposisikan produknya dengan lebih baik dan meningkatkan penjualan.
Dengan pergudangan data, perusahaan dapat mengumpulkan data historis pengeluaran pelanggan selama masa lalu — katakanlah, 20 tahun — dan menjalankan analisis pada data ini. Informasi yang dihasilkan dapat memberikan wawasan tentang preferensi konsumennya; waktu hari, bulan, atau tahun dengan penjualan yang lebih besar; atau pelanggan pengeluaran tertinggi untuk tahun ini.
Penyimpanan dan manajemen data yang efektif juga yang memungkinkan proses, seperti memulai pemesanan perjalanan dan menggunakan mesin teller otomatis.
Proses penambangan data dipecah menjadi lima langkah:
- Organisasi mengumpulkan data dan memuatnya ke gudang data mereka. Mereka kemudian menyimpan dan mengelola data, baik di server in-house atau cloud. Analis bisnis, tim manajemen, dan profesional teknologi informasi mengakses data dan menentukan bagaimana mereka ingin mengaturnya. Perangkat lunak aplikasi kemudian mengurutkan data berdasarkan hasil pengguna. Pengguna akhir akhirnya menyajikan data dalam format yang mudah dibagi, seperti grafik atau tabel.
Pergudangan Data vs. Basis Data
Gudang data belum tentu konsep yang sama dengan database standar. Basis data adalah sistem transaksional yang diatur untuk memantau dan memperbarui data waktu-nyata agar hanya tersedia data terbaru. Gudang data diprogram untuk mengumpulkan data terstruktur selama periode waktu tertentu. Misalnya, basis data mungkin hanya memiliki alamat pelanggan yang terbaru, sedangkan gudang data mungkin memiliki semua alamat tempat tinggal pelanggan selama 10 tahun terakhir.