Apa yang dimaksud dengan Kualitas sebuah data?

Seperti yang kita ketahui bahwa data memiliki berbagai macam bentuknya. Dan pastinya kualitas dari sebuah data sangat diperlukan dan diperhatikan. Maka, Apa yang dimaksud dengan Kualitas Data?

Ketika kita bicara tentang Data, yang terpikirkan saya pertama kali adalah hasil capture/tangkapan berupa fakta - fakta lapangan atau arsip - arsip yang biasanya berserakan dimana - mana, atau data dapat didefinisikan sesuatu yang belum memiliki makna (cikal bakal informasi).

Menurut Turban et al, data adalah deskripsi dasar tentang sesuatu, kejadian, kegiatan, dan transaksi yang ditangkap, direkam, disimpan, dan diklasifikasikan namun tidak terorganisir untuk menyampaikan suatu arti khusus.

Menurut McLeod dan Schell, data terdiri dai fakta dan gambaran yang secara umum tidak dapat digunakan oleh user (perlu diolah).

Dari kedua definisi diatas, dapat diambil kesimpulan bahwa data adalah fakta yang masih mentah dan belum memiliki arti bagi pengguna karena belum diolah.

Nah, berikut ini akan diberikan penjelasan data yang berkualitas itu seperti apa, sehingga sebuah organisasi dapat memanfaatkan data tersebut untuk kepentingan lain dan akan mengurangi sapce/tempat penyimpanan dan efisien.

**Beberapa indikator data yang berkualitas antara lain sebagai berikut : **

  1. ACCURACY : Data yang tersimpan nilainya benar.
  2. DOMAIN INTEGRITY : Nilai attributnya sesuai batasan yang diperkenankan.
  3. DATA TYPE : Nilai data disimpan dalam tipe data yang sesuai.
  4. CONSISTENCY : Nilai sebuah field data akan sama semua dalam berbagai berkas.
  5. REDUDANCY : Tidak boleh ada data yang sama disimpan di tempat yang berbeda dalam satu sistem.
  6. COMPLETENESS : Tidak ada nilai atttribut salah yang diberikan dalam sistem.
  7. DATA ANOMALY : Sebuah field hanya digunakan sesuai kegunaannya.
  8. CLARITY : Kejelasan arti kegunaan dan cara penulisan sebuah data.
  9. TIMELY : Merepresentasikan waktu dari data yang dimasukkan.
  10. USEFULNESS : Setiap data harus benar digunakan oleh user.
  11. ADHERENCE TO DATA INTEGRITY RULES : Taat pada aturan keterhubungan data.

Sumber :
http://gifaralfaqih.blogspot.co.id/2016/11/kualitas-data-dan-informasi.html

Apakah itu Kualitas Data? Kualitas data memiliki berbagai macam definisi yang dikemukakan oleh beberapa tokoh.

Menurut Turban et al. (2005, p38), data adalah deskripsi dasar tentang sesuatu, kejadian, kegiatan, dan transaksi yang ditangkap, direkam, disimpan, dan diklasifikasikan namun tidak terorganisir untuk menyampaikan suatu arti khusus.

Menurut McLeod dan Schell (2007, p12), data terdiri dai fakta dan gambaran yang secara umum tidak dapat digunakan oleh user (perlu diolah).

Dari kedua definisi diatas, dapat diambil kesimpulan bahwa data adalah fakta yang masih mentah dan belum memiliki arti bagi pengguna karena belum diolah.

Menurut Mark Mosley (2008), dalam bukunya “Dictionary of Data Management”, pengertian kualitas data adalah level data yang menyatakan data tersebut akurat (accurate), lengkap (complete), timely (update), konsisten (consistent) sesuai dengan semua kebutuhan peraturan bisnis dan relevan.

Menilai kualitas data memerlukan pemeriksaan karakteristiknya dan kemudian menimbang karakteristik tersebut sesuai dengan apa yang paling penting bagi organisasi dan aplikasi yang digunakan.

Terdapat tujuh karakteristik yang menentukan kualitas data adalah:

  1. Accuracy and Precision
    Karakteristik ini mengacu pada ketepatan data. Tidak ada unsur yang keliru dan harus menyampaikan pesan yang benar tanpa menyesatkan. Keakuratan dan ketepatan ini memiliki komponen yang berhubungan dengan penggunaannya. Tanpa memahami bagaimana data akan dikonsumsi, memastikan akurasi dan presisi bisa di luar target atau lebih mahal dari yang dibutuhkan. Misalnya, ketepatan dalam perawatan kesehatan mungkin lebih penting daripada di industri lain (misalnya, data perawatan kesehatan yang tidak akurat dapat menimbulkan konsekuensi yang lebih serius), dan oleh karena itu, layak untuk investasi tingkat tinggi.

  2. Legitimacy and Validity
    Persyaratan yang mengatur data menetapkan batasan karakteristik ini. Misalnya, pada survei, item seperti jenis kelamin, etnisitas, dan kewarganegaraan biasanya terbatas pada serangkaian pilihan dan jawaban terbuka tidak diizinkan. Setiap jawaban selain ini tidak akan dianggap sah atau sah berdasarkan persyaratan survei. Ini adalah kasus untuk sebagian besar data dan harus dipertimbangkan dengan cermat saat menentukan kualitasnya. Orang-orang di setiap departemen dalam sebuah organisasi memahami data apa yang valid atau tidak, sehingga persyaratan harus diadopsi saat mengevaluasi kualitas data.

  3. Reliability and Consistency
    Banyak sistem di lingkungan saat ini menggunakan dan atau mengumpulkan data sumber yang sama. Terlepas dari sumber apa yang mengumpulkan data atau tempat tinggalnya, tidak ada yang bertentangan dengan nilai yang berada pada sumber yang berbeda atau dikumpulkan oleh sistem yang berbeda. Harus ada mekanisme tepat dan stabil yang mengumpulkan dan menyimpan data tanpa kontradiksi atau varian yang tidak beralasan.

  4. Timeliness and Relevance
    Harus ada alasan yang sah untuk mengumpulkan data untuk membenarkan usaha yang dibutuhkan, yang juga berarti harus dikumpulkan pada saat yang tepat waktu. Data yang dikumpulkan terlalu cepat atau terlambat bisa menggambarkan situasi dan mendorong keputusan yang tidak akurat.

  5. Completeness and Comprehensiveness
    Data tidak lengkap sama berbahayanya dengan data yang tidak akurat. Kesenjangan dalam pengumpulan data menyebabkan sebagian tampilan keseluruhan gambar ditampilkan. Tanpa gambaran lengkap tentang bagaimana operasi berjalan, tindakan yang tidak diinformasikan akan terjadi. Penting untuk memahami persyaratan lengkap yang merupakan kumpulan data yang komprehensif untuk menentukan apakah persyaratan dipenuhi atau tidak.

  6. Availability and Accessibility
    Karakteristik ini terkadang rumit karena kendala hukum dan peraturan. Terlepas dari tantangannya, individu membutuhkan tingkat akses yang tepat terhadap data untuk melakukan pekerjaan mereka. Ini menduga bahwa data ada dan tersedia untuk akses yang akan diberikan.

  7. Granularity and Uniqueness
    Tingkat detail pengumpulan data penting, karena kebingungan dan keputusan yang tidak akurat dapat terjadi. Kumpulan data gabungan, dirangkum dan dimanipulasi dapat menawarkan arti yang berbeda dari pada data yang tersirat pada tingkat yang lebih rendah. Tingkat granularitas yang tepat harus didefinisikan untuk memberikan keunikan dan sifat khas yang cukup untuk terlihat. Ini adalah persyaratan agar operasi berfungsi secara efektif.

Source :
http://www.blazent.com/seven-characteristics-define-quality-data/
Data Quality (Kualitas Data)

Kualitas data mengacu pada kondisi satu set nilai variabel kualitatif atau kuantitatif. Ada banyak definisi kualitas data namun data umumnya dianggap berkualitas tinggi jika “sesuai untuk penggunaan yang dimaksudkan dalam operasi, pengambilan keputusan dan perencanaan.”

Definisi - Apa arti Kualitas Data?

Kualitas data adalah suatu hal yang rumit untuk mengukur sifat data dari perspektif yang berbeda. Ini adalah suatu pemeriksaan menyeluruh terhadap efisiensi aplikasi, kehandalan dan kebugaran data, terutama data yang berada di data warehouse.

Di dalam sebuah organisasi, kualitas data yang memadai sangat penting untuk proses transaksional dan operasional, serta lamanya pelaporan business intelligence (BI) dan business analytics (BA). Kualitas data dapat dipengaruhi oleh cara data dimasukkan, ditangani dan dipelihara.

Jaminan kualitas data (DQA) adalah prosedur yang dimaksudkan untuk memverifikasi efisiensi dan keandalan data.

Pemeliharaan kualitas data yang efektif memerlukan pemantauan dan pembersihan data secara berkala. Secara umum, pemeliharaan kualitas data melibatkan updating / standardisasi data dan deduplicating record untuk membuat satu tampilan data.

Komponen kualitas data utama adalah sebagai berikut:

  • Kelengkapan: Tingkat di mana atribut data yang diinginkan dipasok. Data tidak perlu 100 persen lengkap.

  • Akurasi: Merupakan status dunia nyata. Dapat dihitung dengan menggunakan metode otomatis dengan bantuan berbagai daftar dan pemetaan.

  • Kredibilitas: Luasnya data yang dianggap kredibel dan benar. Mungkin berbeda dari sumbernya.

  • Ketepatan waktu (umur data): Luas data mana yang cukup diperbarui untuk usaha saat ini.

  • Konsistensi: Menilai apakah berbagai fakta dataset sesuai.

  • Integritas: Menilai keabsahan referensi dan penggabungan berbagai dataset yang akurat.

Kualitas data sangat penting karena alasan berikut:

  • Memberikan informasi tepat waktu dan tepat waktu untuk menangani akuntabilitas dan layanan.

  • Menawarkan informasi yang cepat untuk menangani efektivitas layanan.

  • Membantu memprioritaskan dan menjamin pemanfaatan sumber daya yang efektif.

source: