Apakah Statistik Nonparametrik itu?
Statistik nonparametrik merujuk pada metode statistik di mana data tidak diperlukan agar sesuai dengan distribusi normal. Statistik nonparametrik menggunakan data yang sering ordinal, artinya tidak bergantung pada angka, tetapi lebih pada peringkat atau urutan macam. Misalnya, survei yang menyampaikan preferensi konsumen mulai dari yang suka tidak suka akan dianggap sebagai data ordinal.
Statistik nonparametrik meliputi statistik deskriptif nonparametrik, model statistik, inferensi, dan uji statistik. Struktur model model nonparametrik tidak ditentukan secara apriori melainkan ditentukan dari data. Istilah nonparametrik tidak dimaksudkan untuk menyiratkan bahwa model seperti itu benar-benar kekurangan parameter, tetapi lebih pada jumlah dan sifat parameter yang fleksibel dan tidak diperbaiki terlebih dahulu. Histogram adalah contoh estimasi nonparametrik dari distribusi probabilitas.
Memahami Statistik Nonparametrik
Dalam statistik, statistik parametrik mencakup parameter seperti mean, median, standar deviasi, varians, dll. Bentuk statistik ini menggunakan data yang diamati untuk memperkirakan parameter distribusi. Di bawah statistik parametrik, data diasumsikan sesuai dengan distribusi normal dengan parameter yang tidak diketahui μ (mean populasi) dan σ 2 (varians populasi), yang kemudian diperkirakan menggunakan mean sampel dan varians sampel.
Statistik nonparametrik tidak membuat asumsi tentang ukuran sampel atau apakah data yang diamati adalah kuantitatif.
Statistik nonparametrik tidak mengasumsikan bahwa data diambil dari distribusi normal. Sebaliknya, bentuk distribusi diperkirakan berdasarkan bentuk pengukuran statistik ini. Meskipun ada banyak situasi di mana distribusi normal dapat diasumsikan, ada juga beberapa skenario di mana tidak akan mungkin untuk menentukan apakah data akan didistribusikan secara normal.
Contoh Statistik Nonparametrik
Dalam contoh pertama, pertimbangkan seorang peneliti yang menginginkan perkiraan jumlah bayi di Amerika Utara yang lahir dengan mata cokelat dapat memutuskan untuk mengambil sampel sebanyak 150.000 bayi dan menjalankan analisis pada kumpulan data. Pengukuran yang mereka peroleh akan digunakan sebagai perkiraan seluruh populasi bayi dengan mata cokelat yang lahir pada tahun berikutnya.
Sebagai contoh kedua, pertimbangkan peneliti lain yang ingin tahu apakah tidur lebih awal atau lebih lambat terkait dengan seberapa sering seseorang jatuh sakit. Dengan asumsi sampel dipilih secara acak dari populasi, distribusi ukuran sampel dari frekuensi penyakit dapat dianggap normal. Namun, percobaan yang mengukur daya tahan tubuh manusia terhadap strain bakteri tidak dapat diasumsikan memiliki distribusi normal.
Ini karena data sampel yang dipilih secara acak mungkin resisten terhadap strain. Di sisi lain, jika peneliti mempertimbangkan faktor-faktor seperti susunan genetik dan etnis, ia mungkin menemukan bahwa ukuran sampel yang dipilih menggunakan karakteristik ini mungkin tidak tahan terhadap strain. Oleh karena itu, seseorang tidak dapat mengasumsikan distribusi normal.
Metode ini berguna ketika data tidak memiliki interpretasi numerik yang jelas dan terbaik untuk digunakan dengan data yang memiliki peringkat macam. Sebagai contoh, tes penilaian kepribadian mungkin memiliki peringkat metrik yang ditetapkan sangat tidak setuju, tidak setuju, acuh tak acuh, setuju, dan sangat setuju. Dalam hal ini, metode nonparametrik harus digunakan.
Pertimbangan Khusus
Statistik nonparametrik telah mendapatkan apresiasi karena kemudahan penggunaannya. Ketika kebutuhan akan parameter dikurangi, data menjadi lebih dapat diterapkan untuk berbagai macam pengujian. Jenis statistik ini dapat digunakan tanpa rata-rata, ukuran sampel, standar deviasi, atau estimasi parameter terkait lainnya ketika tidak ada informasi yang tersedia.
Karena statistik nonparametrik membuat lebih sedikit asumsi tentang data sampel, penerapannya lebih luas dalam cakupan daripada statistik parametrik. Dalam kasus di mana pengujian parametrik lebih tepat, metode nonparametrik akan kurang efisien. Ini karena hasil yang diperoleh dari statistik nonparametrik memiliki tingkat kepercayaan yang lebih rendah daripada jika hasil tersebut diperoleh dengan menggunakan statistik parametrik.
Pengambilan Kunci
- Statistik nonparametrik mudah digunakan tetapi tidak menawarkan akurasi dari model statistik lainnya. Jenis analisis ini paling cocok ketika mempertimbangkan urutan sesuatu, di mana bahkan jika data numerik berubah, hasilnya kemungkinan akan tetap sama.