Selasa, 09 November 2010

pert 6

DATAWAREHOUSE

Keterkaitan data warehouse dengan online analytical processing (OLAP) dengan
cepat berkembang dalam beberapa kurun waktu. Pada sisi lain, sensitivitas keamanan
informasi dan privacy juga sangat dibutuhkan.
Tidak banyak pendekatan yang telah dibuat untuk mengintegrasikan dua bidang
ini. Data warehouse dengan alami menciptakan security. Di lain pihak, kebutuhan agar
semua data penting dapat diakses semudah mungkin. Sementara data ini pada umumnya
sangat berharga dan sensitive.
Konsep keamanan pada dasarnya sangat luas (mencakup isu sosial dan etis, isu
moral, privacy dan undang-undang yang sah). Pada paper ini, di fokuskan pada sebagian
besar tentang teknis otoritas dan akses kontrol.
Penelitian security pada makalah ini dalam konteks mengarahkan untuk
mempelajari pengintegrasian geographical information systems (GIS) dan teknologi data
warehouse. Dimana kita bertanggung jawab pada integritas data dan keamanan. Konsep
yang dikembangkan harus bisa diterapkan untuk semua aplikasi OLAP.
Metoda penulisan makalah ini adalah :
1. Topik utama diarahkan kepada keamanan general data warehouse dan identifikasi
akses kontrol OLAP.
2. Persyaratan akses kontrol digolongkan oleh kompleksitasnya pada bagian 2.
3. Bagian 3 tentang sukses mekanisme keamanan OLAP dan permasalahan mereka
pada konsep penjualan.
4. Pada bagian 4 merupakan perbandingan dengan implementasi sis tem yang berbeda.
5. Akhirnya, bagian 5 merupakan kesimpulan dan sketsa alur riset masa depan..

1.1 Kebutuhan General Security
Sangat banyak komunikasi terjadi pada sistem data warehouse, menciptakan
kebutuhan keamanan komunikasi yang sesuai dengan kebutuhan. Proses pengambilan
data (transfer source data dari operasional database kepada data warehouse)
membutuhkan satu persyaratan untuk suatu infrastruktur jaringan. Independent atau
mungkin sharing source database harus diperkuat. Ketika data mungkin sangat sensitip
maka penting untuk melindunginya dari eavesdropping dan ancaman yang lain. Untuk
komunikasi antara aplikasi awal dan akhir serta OLAP server (atau data warehouse
dalam 2 lingkungan) biasanya koneksi client/server akan digunakan, termasuk pada
lokasi remote. Walaupun informasi pada chanel ini adalah hampir pasti bisa
dikumpulkan dan sedikit komplet, mungkin saja keamanan sangat kritis. Penggunaan
Internet atau jaringan lain mungkin diperlukan security. Hanya beberapa tools support
encrypted komunikasi pada level aplikasi seperti teknologi virtual private network
(VPN) yang mungkin sesuai.
Authentication dan ketelitian adalah ukuran keamanan lain yang harus dilakukan
di lingkungan data wrehouse. Bukti suatu identitas pemakai yang bersih diperlukan
dalam rangka menjaga keamanan dan untuk menghindari akses oleh para pemakai yang
tidak syah. Proses aplikasi data ware house dapat dilihat pada gambar 1 berikut.




 Hubungan identifikasi pemakai dan mekanisme authentication memeriksa
keaslian identitas yang mengaku pemilik identitas, dalam frontend perkakas, atau
dengan menggunakan mekanisme authentication yang disediakan oleh tools atau sistem
operasi modern disebut dengan strategi "single sign-on" Keputusan yang penting untuk
pemerikasan dalam data warehouse adalah untuk menempatkan sasaran yang tepat pada
arsitektur. Penggunaan kemampuan auditing dasar DBMS membuat data warehouse
tidak mencukupi kebutuhan, seperti ketika memasukkan akses pada tabel bagan
star/snowflake (atau object yang serupa) tidak akan menyingkapkan multidimensional
query yang telah dibuat (terutama dalam sistem berbasis MOLAP). Kesimpulannya
adalah bahwa auditing perlu juga dilakukan pada multidimensional level satu engine
OLAP yaitu. pada level yang sama di mana otoritas ilmu semantik digunakan).


1.2 Access Control

Akses kontrol pada sisi back-end melibatkan pengendalian akses pada data ware
hose dan source database pada saat proses transform/load dan akses pada prosedur ini
(permohonan seperti halnya administrasi). Pada otoritas berbasis role model untuk
proses administratif dalam data warehouse terdapat dua katagori identifikasi.
Pengembang tulis penyaringan, integrasi dan transformasi scrif. Mereka membutuhkan
akses terutama pada metadata, bukan datanya sendiri. Personil operasi meminta proses
coresponden tersebut. Mereka tidak memerlukan ijin untuk mengakses data secara
langsung, hanya untuk menjalankan program. Bagaimanapun, ketika permasalahan
timbul, pengembang dan personil operasi mungkin memerlukan akses tambahan
beberapa data seperti untuk strategi membersihkan data atau untuk menentukan
kesalahan. Satu kekuatan mengijinkan, jika meyakinkan bahwa pengguna ijin seperti itu
secara ekstensif dimonitor oleh auditing.
Pada sisi front-end banyak akses kontrol muncul. Biasanya data warehouse
disangsikan oleh para pemakai eksekutif (manajemen eksekutif, analis bisnis), dengan
meminta OLAP vendor untuk tidak menyediakan peralatan pendukung untuk akses yang
berjaringan halus akses kontrol. Hal tidak lagi sesuai. Cakupan pemakai potensialtentang analisis tools queryng satu data warehouse terus berkembang, sampai pada
pelanggan dan mitranya. Proteksi sensitive data dari akses yang tidak syah terus
diperdebatkan, menuju ke arah kebutuhan kebijakan akses kontrol untuk akses enduser
pada data warehuose . Tidak tiap pemakai bisa mengakses semua data.
Aplikasi Front-End termasuk laporan statis (berjalan dan menciptakan/
memodifikasi laporan), OLAP, dan data mining/KDD. Dalam aplikasi laporan statis, di
mana pemakai hanya menggunakan query statis sudah dikenal, akses kontrol dapat
digambarkan sebagai suatu basis per laporan . Pada sisi lain sangat sulit untuk
mengapliasikan keamanan pada data mining. Data mining diarahkan pada penemuan
data baru; hasilnya (dan kepekaan nya) tidaklah dikenal sebelumnya. Bagaimanapun,
beberapa kebijakan (seperti partisi data warehose) dapat diterapkan pada satu teknologi
mart-like data. Tools utama Fron-tend untuk data warehose adalah aplikasi OLAP,
menyediakan ad-hoc analisis interactive dari struktur multidimensi data. Suatu data
warehouse dibangun dengan sistem terbuka.
Pada akhirnya adalah untuk membuat semua data yang penting dapat diakses
semudah mungkin. Terutama penelitian analisis OLAP memerlukan sifat terbuka;
kontrol keamanan bisa saja menghalangi proses penemuan analitis. Kita sudah mengenal
keamanan komunikasi, mengidentifikasi pemakai dan authentication, auditing, dan
keamanan akses kontrol merupakan hal yang penting. Ketika kita memfokuskan pada
akses kontrol dalam ad-hoc aplikasi OLAP kita akan menggunakan istilah keamanan
OLAP pada bahasan makalah ini.


1.3 Rancangan OLAP Security
Menurunkan kebijakan akses kontrol dari operasional data source sangat sulit
walaupun beberapa riset telah dilakukan. Data dari sistem yang berbeda dengan
kebijakan yang berbeda akan di konsolidasikan. Para pemakai sistem operasional tidak
sama dengan pemakai data warehouse. Masalah utama adalah, bahwa relational model
mendominasi dalam sistem operasional ketika sistem OLAP menggunakan
nontraditional multidimensional model. Rencana akses kontrol tidak mudah dipetakan.

Proteksi tidak digambarkan dalam kaitan dengan tabel, tetapi dimensi, alur hirarkis,
granularas level. Sehingga dibutuhkan desain keamanan OLAP.
Telah dijelaskan bahwa perancangan akses OLAP harus dilakukan dengan teliti,
ketika analisis ditolak atau hasil adalah salah. Apalagi kemampuan keamanan tool
sangat propietary dan sintak sekurity tidak mungkin untuk didesain dan didokumentasi
dari pembatasan akses.

Dalam rangka mendekati topik dari sisi aplikasi, metodelogi desain klasikal
database (persyaratan analisis, konseptual, logis, dan desainphisik) harus diplikasikan
pada kemanan OLAP. Gambar 2 diadopsi dari yang menyarankan model keamanan
database reguler. Perbedaan yang penting, adalah konseptual multidimensional data
model dan mekanisme keamanan OLAP yang jelas berbeda dengan kemampuan
relational manajemen sistem database. Tahap pertama pada makalah ini adalah proses
menandai [Bold] pada diagram, tahap kedua adalah desain.
Suatu pendekatan metodologis multiphase mengijinkan kebijakan keamanan
untuk terpisah dari mekanisme keamanan. Separasi ini menghasilkan keuntungan antara
lain :
  • Kemampuan menggambarkan aturan akses kontrol dan pemikiran tentangimplementasinya (dengan tidak ada beban tentang detil implementasi).
  • Memungkinkan untuk dibandingkan dengan kebijakan akses kontrol yang berbeda,atau mekanisme yang berbeda pada kebijakan yang sama. Terutama bergunan untukbanyaknya tools OLAP yang heterogen.
  • Kemampuan mekanisme perancangan pada kebijakan yang berbeda. Keuntungan ini
    menjadi suatu hal yang penting ketika kebijakan berubah seperti konsekwensi dari
    berubah organisasi.
Data warehouse adalah kumpulan data dari berbagai sumber yang ditempatkan menjadi satu dalam tempat penyimpanan berukuran besar lalu diproses menjadi bentuk penyimpanan multidimensional dan didesain untuk querying dan reporting. Menurut Bill Inmon, data yang disimpan didalam data warehouse ini memiliki empat karakteristik, yaitu :
1. Subject oriented, data yang disimpan disesuaikan dengan proses bisnisnya
2. Integrated, semua data diintegrasikan kedalam satu media penyimpanan, dalam hal ini adalah database yang sangat besar, dimana formatnya diseragamkan,
3. Time variant, data yang disimpan bersifat historical, dan
4. Non-volatile, data cenderung tidak berubah.


Komponen Utama Data Warehouse
Tiga komponen utama Data Warehouse yaitu :
1. Data staging area Dalam tahap ini, data diolah dari sumbernya untuk siap menjawab query. Prosesnya terdiri dari extract,transform,load (ETL).
2. Data presentation area Dalam tahap ini, data diorganisasikan, disimpan dan dapat menjamin ketersediaannya akan segala kebutuhan query. Selain itu disini dilakukan juga penulisan laporan dan kebutuhan aplikasi untuk analisis selanjutnya.
3. Data access tools Penyediaan interface untuk penggunaan aplikasi untuk query data
Komponen utama Data Warehouse.JPG

Distributed Data Warehouse
Distributed data warehouse merupakan kumpulan data store yang dibangun secara terpisah yang digabungkan secara fisik melalui jaringan. Tujuannya adalah agar komponen-komponen yang terpisah ini terlihat sebagai satu kesatuan utuh sebuah sistem data warehouse . Suatu enterprise data warehouse dapat dibentuk dari kumpulan data mart yang terpisah, jadi tidak selalu membentuk sistem yang terpusat tetapi juga bisa terdistribusi. Dengan kecenderungan data-oriented, data pada suatu perusahaan atau organisasi seharusnya merupakan data yang widely-shareable. Tipe-tipe distributed data warehouse :
1. Dengan local dan global data warehouse
Local Data Warehouse merepresentasikan data dan proses-proses pada remote site. Sedangkan global Data Warehouse merepresentasikan bagian dari bisnis yang diintegrasikan.
2. Technologically Distributed Data Warehouse
Menunjukkan bahwa secara logic, ini merupakan single dw tapi pada kenyataannya secara fisik terdapat beberapa dw yang diintegrasikan yang berasal dari beberapa prosesor/site yang berbeda.
3. Independently evolving Distributed Data Warehouse
Setiap bagian dari distributed data warehouse, memiliki otonomi untuk mengatur dan mengembangkan bisnisnya tanpa harus memperhatikan bagian yang lain. 

Arsitektur Distributed Data Warehouse
Distributed data warehouse terbentuk dari beberapa data mart yang diintegrasikan. Setiap data mart ini memiliki skema ETL yang terpisah, bisa jadi satu data mart dengan data mart lainnya berbeda, tetapi tidak menutup kemungkinkan dimana skema ETLnya sama, tergantung proses bisnis yang terjadi didalamnya. Disini kita mengenal local data warehouse dan global data warehouse. Dalam beberapa kasus, bagian data warehouse bisa berada di lingkungan terpusat (global) sekaligus terdistribusi (local). Contohnya, suatu perusahaan yang besar yang memiliki cabang yang tersebar di beberapa kota. Mereka membutuhkan global data warehouse sebagai tempat informasi yang dikumpulkan. Sedangkan local data warehouse diperlukan untuk menangani masalah bisnis yang terjadi ditiap cabangnya. Sehingga dapat dikatakan bahwa distributed data warehouse ini memberikan otonomi kepada tiap local areanya untuk menjawab persoalan bisnisnya sendiri. Setiap local data warehouse, dalam hal ini data mart, dapat melakukan pekerjaannya dengan implementasi sendiri tanpa mengetahui apa yang sedang dilakukan data meart lainnya. Dalam distributed data warehouse ini, share informasi hanya dilakukan oleh local data warehouse dengan global data warehouse. Jadi tidak terjadi pertukaran informasi antar local data warehouse. Akan tetapi, disini semua data mart harus didesain untuk bekerja secara bersamaan menjadi satu warehouse yang utuh. 


MANAGEMENT DATA

1. Pendahuluan

Riset Kesehatan Dasar (Riskesdas) merupakan upaya Departemen Kesehatan
untuk menyediakan data dasar berbasis masyarakat yang akan diselenggarakan dengan
sampel yang jauh lebih besar dari survei-survei kesehatan yang pernah dilaksanakan oleh
Badan Litbang Kesehatan.
Pelaksanaan Riskesdas 2007 yang dilaksanakan Badan Litbangkes terintegrasi
dengan Survei Sosial dan Ekonomi Nasional (Susenas) 2007 yang dilaksanakan Badan
Pusat Statistik, dalam hal penggunaan sampel dan bentuk instrumen yang sama. Sampel
Riskesdas sebanyak 280.000 RT yang meliputi seluruh wilayah provinsi di Indonesia
akan dikunjungi oleh tim pengumpul data kesehatan masyarakat. Dalam sampel tersebut,
apabila ada RT dengan kasus kematian dalam 1 tahun terakhir akan ditindak lanjuti
dengan studi mortalitas serta kurang lebih 10 persen RT dari sampel Riskesdas akan
diambil darah untuk berbagai pemeriksaan biomedis. Selain itu 30 kabupaten terpilih
diambil sampel urin pada anak usia 6-12 tahun dan dua rumah tangga diantaranya diambil
sampel garam.

Komponen manajemen data
Pada dasarnya program atau kegiatan manajemen data melibatkan tiga komponen utama
yakni:
- Sumber Daya Manusia (SDM)
- Proses atau prosedur
- Teknologi manajemen data
  Tahapan Kegiatan Manajemen Data
Kegiatan manajemen data dilakukan di dalam gedung dan di luar gedung.
Beberapa kegiatan manajemen data di dalam gedung dibagi menjadi tiga tahap, tahap
pertama dapat dilakukan setelah kuesioner dinyatakan siap sebagai instrumen
pengumpulan data dan daftar sampel wilayah telah ditentukan secara rinci. Kegiatan yang
dapat dilakukan pada tahap ini adalah: (1) Persiapan ruangan beserta instalasi listrik,
pembuatan jaringan, dan instalasi komputer yang akan digunakan untuk entry data.
Pembuatan program entry dan check alur program termasuk uji coba program entry
sistem jaringan serta penyusunan panduan entry data. (2) Pembuatan buku kontrol untuk
receiving-batching yang sesuai dengan daftar sampel yang digunakan. Dalam buku
kontrol tersebut tercantum nama Provinsi, Kabupaten, Kecamatan, Kelurahan, nomor
kode sampel dan nomor urut rumah tangga sampel (Lihat Lampiran 1). Dalam daftar
sampel ini berfungsi untuk mencatat kuesioner hasil pengumpulan data, jumlah kuesioner
individu per RT dan jumlah RT yang berhasil diwawancarai pada setiap blok sensus.
Bagian JIIPP
3
Catatan ini bermanfaat untuk kontrol keluar masuknya kuesioner dari Tim Manajemen
Data, baik dari kabupaten, editor, maupun pengentri sehingga memudahkan untuk
memonitor status kuesioner. (3) Penyusunan Pedoman Editing dan Koding, yang akan
digunakan untuk para editor dalam memeriksa isian kuesioner apakah sudah sesuai
dengan alur dan memberikan kode-kode missing yang sudah disesuaikan dengan program
entry.
Manajemen data dalam gedung tahap kedua yang dapat dilakukan bersamaan
dengan pelaksanaan pengumpulan data di lapangan adalah (1) penerimaan kuesioner dari
Kabupaten. Penanggung Jawab Operasional (PJO) Kabupaten mengirimkan kuesioner
beserta dokumen lain seperti berkas pertanggungjawaban keuangan, form rekapitulasi,
dan lain-lain dalam satu paket. Tim Manajemen Data bagian receiving dan batching akan
memilah isi paket tersebut. (2) Proses editing, penomoran, entry, dan cleaning sementara
juga dapat dilakukan secara bertahap. Tahap ketiga manajemen data dalam gedung adalah
cleaning, imputasi data atau amputasi data jika diperlukan.
Manajemen data di luar gedung dilakukan pada saat pengumpulan data. Kegiatan
tersebut adalah editing awal oleh ketua tim atau supervisor dan melengkapi form-form
pendukung kuesioner.
Dalam Riskesdas 2007, tahapan manajemen data tersebut dilaksanakan pada tiga
tingkatan yaitu tingkat kabupaten, tingkat korwil, dan tingkat pusat. Secara lebih rinci
dapat dilihat sebagai berikut.



  

Hal-hal yang dilakukan sebelum pengumpulan data ke lapangan
  • Kuesioner digandakan oleh masing-masing kabupaten, jika tidak memungkinkan maka
          penggandaan dilakukan oleh provinsi.
  • Kuesioner dibagikan di TC kepada masing-masing Penanggung Jawab Teknis (PJT)Kabupaten sesuai dengan jumlah sampel yang akan dikumpulkan
  • PJT Kabupaten membagikan kuesioner yang telah siap kepada ketua tim
          pengumpulan data sesuai dengan jumlah yang dibutuhkan
  • Ketua tim pengumpul data membagikan kepada anggotanya.
         



Tidak ada komentar:

Posting Komentar