Matakuliah Tahun : Decision Support System : 2009 DATAWAREHOUSING & BUSINESS INTELLIGENT Pertemuan 11 -12 Sasaran Pembelajaran • Mahasiswa menjelaskan sumberdaya data DSS dan pengelolaannya melalui datawrehouse dan intelijen bisnis, dengan : – Menjelaskan isue-isue sumberdaya data dan manajemen data DSS. – Menguasai konsep2 dan penggunaan DBMS. – Memahami teknologi data warehousing dan data marts. – Memahami interaksi antara Web dan teknologi database. Bina Nusantara University 3 Pokok Bahasan - DSS Data Sources - Data Warehouse - Data aquisition - Data Mart Bina Nusantara University 4 Kasus : Information Sharing satu Principle Component dari National Strategy for Homeland Security • Jejaring dari systems yang menyediakan integrasi dan distribusi Pengetahuan/knowledge • Horizontal dan vertical information sharing • Improved communications • Mining data tersimpan dalam Web-enabled warehouse Bina Nusantara University 5 Data, Information, Knowledge • Data – Items adalah penjelasan paling elementer dari sesuatu, events, activities, dan transaksi2 – Bisa internal ataupun external • Informasi – Organized data yang memiliki arti/meaning dan nilai/value • Knowledge – Processed data atau informasi yang menyampaikan pemahaman / understanding atau pembelajaran/learning yang dapat diaplikasikan pada suatu problem atau activitas Bina Nusantara University 6 Sumber data DSS • Data Internal – Bersumber dari Legasi sistem – Semua data perusahaan yang diolah oleh TPS yang ada – Semua data mentah ataupun yang telah diproses untuk menghasilkan laporan • Data Eksternal • Data Pengetahuan Personal Bina Nusantara University 7 Sumber data External • Web – Intelligent agents – Document management systems – Content management systems • Commercial databases – Sell access to specialized databases Bina Nusantara University 8 Data dan Pengetahuan Personal • Para pengguna atau user memiliki Pengetahuan, keahlian yang dapat disimpan untuk digunakan masa yang akan datang. • Informasi subyektif, misalnya tentang : – – – – Penjualan Opini pasar Lingkungan persaingan Sosial dan budaya Bina Nusantara University 9 Pengumpulan Data • Data dikumpulkan dengan cara manual maupun menggunakan alat sensor • Metoda Pengumpulan data mentah – – – – – – Survei Observasi Wawancara Sumber ahli Sensor-scanner Dokumen resmi dll Bina Nusantara University 10 Masalah dan Kualitas Data • Masalah Data Bina Nusantara University 11 Bina Nusantara University 12 Kualitas Data • Raw data dikumpulkan secara manual atau dengan instruments • Kualitas menjadi kritis ? Kualitas menentukan kegunaan • Kategori : • Contextual data quality : relevansi, nilai tambah, batasan waktu, kelengkapan,jumlah data. • Intrinsic data quality : akurasi, obyektivitas, kehandalan, reputasi • Accessibility data quality : aksesabilitas, keamanan akses • Representation data quality : interpretable, kemudahan dipahami, representasi tepat, konsisten – Kadang diabaikan atau ditangani secara gampang – Masalah terkuak ketika data disummarize Bina Nusantara University 13 Sumber Masalah Kualitas Sumber Masalah Kualitas % Entri data oleh karyawan 76 Perubahan pada sumber 53 Migrasi data atau proyek2 konversi 48 Berbagai Harapan para pengguna 46 Data Eksternal 34 Kesalahan sistem 26 Entri data oleh pelanggan 25 Lainnya 12 Sumber : Wayne Eckerson Bina Nusantara University 14 Masalah dan Kualitas Data • Isue terkait Integritas Data, – – – – – Keseragaman data yang ditangkap Versi, jaminan keaslian data Kelengkapan dan kebenaran data Kesesuaian data Drill down, pelacakan kembali ke sumber data Bina Nusantara University 15 Web dan Layanan Database Komersial • Sumberdata Eksternal – Mitra bisnis, – Web/internet – Bank data komersial Bina Nusantara University 16 Database Management Systems • Software program • Supplements operating system • Manages data ; menambahkan, memperbaharui, menghapus, memanipulasi, menyimpan, dan mendapatkan kembali informasi • Queries data dan generates reports • Data security • Kombinasi dengan bahasa pemodelan untuk konstruksi DSS Bina Nusantara University 17 Database Models • Hierarchical – Top down, like inverted tree – Fields have only one “parent”, each “parent” can have multiple “children” – Fast • Network – Relationships created through linked lists, using pointers – “Children” can have multiple “parents” – Greater flexibility, substantial overhead • Relational – Flat, two-dimensional tables with multiple access queries – Examines relations between multiple tables – Flexible, quick, and extendable with data independence • Object oriented – Data analyzed at conceptual level – Inheritance, abstraction, encapsulation Bina Nusantara University 18 Database Models, continued • Multimedia Based – Multiple data formats • JPEG, GIF, bitmap, PNG, sound, video, virtual reality – Requires specific hardware for full feature availability • Document Based – Document storage dan management • Intelligent – Intelligent agents dan ANN • Inference engines Bina Nusantara University 19 Bina Nusantara University 20 Karakteristik Data Warehouse • • • • • • • • Subject oriented Terintegrasi sehingga data dari sumber heterogen distandarisasi Time series; tidak ada current status Nonvolatile – Read only Summarized Not normalized; boleh jadi redundan Data berasal baik dari sumber internal maupun external tersedia Metadata included – Data tentang t data • Business metadata • Semantic metadata Bina Nusantara University 21 Architecture • Dapat berupa satu tiers, atau lebih – Determined by warehouse, s/w data acquisition (back end), dan s/w client (front end) • One tier, semua dijalankan pada platform yang sama, ini jarang terjadi • Two tier biasanya mengkombinasikan DSS engine (client) dengan warehouse – More economical • Three tier memisahkan bagian-bagian functional ( client appl_server – database_server) Bina Nusantara University 22 Bina Nusantara University 23 Bina Nusantara University 24 Migrating Data • Business rules – Stored in metadata repository – Applied to data warehouse centrally • Data extracted from all relevant sources – Loaded through data-transformation tools or programs – Separate operation and decision support environments • Correct problems in quality before data stored – Cleanse and organize in consistent manner Bina Nusantara University 25 Data Warehouse Design • Dimensional modeling – Retrieval based – Implemented by star schema • Central fact table • Dimension tables • Grain – Highest level of detail – Drill-down analysis Bina Nusantara University 26 Data Warehouse Development • Data warehouse implementation techniques – – – – • • Top down Bottom up Hybrid Federated Projects may be data centric or application centric Implementation factors – Organizational issues – Project issues – Technical issues • • Scalable Flexible Bina Nusantara University 27 Data Marts • Subkumpulan /subset data warehouse umumnya dari sumber subject tunggal • Data Mart Dibedakan : – Dependent • Created from warehouse • Replicated – Functional subset of warehouse – Independent • Scaled down, lebih murah, hemat waktu • Dirancang untuk sebuah department atau SBU, informasi terbatas dan memungkinkan unit dapat membangaun DSS sendiri • Organization dapat memiliki multiple data marts – Sulit untuk diintegrasikan Bina Nusantara University 28