Apa itu Distribusi Sampling?
Distribusi sampling adalah distribusi probabilitas dari suatu statistik yang diperoleh melalui sejumlah besar sampel yang diambil dari populasi tertentu. Distribusi sampling dari populasi tertentu adalah distribusi frekuensi dari berbagai hasil yang berbeda yang mungkin dapat terjadi untuk statistik populasi.
Memahami Distribusi Sampling
Banyak data yang diambil dan digunakan oleh akademisi, ahli statistik, peneliti, pemasar, analis, dll sebenarnya sampel, bukan populasi. Sampel adalah bagian dari suatu populasi. Sebagai contoh, seorang peneliti medis yang ingin membandingkan berat rata-rata semua bayi yang lahir di Amerika Utara dari 1995 hingga 2005 dengan mereka yang lahir di Amerika Selatan dalam periode waktu yang sama tidak dapat dalam jumlah waktu yang wajar untuk menggambar data untuk seluruh populasi lebih dari satu juta kelahiran yang terjadi selama jangka waktu sepuluh tahun. Sebaliknya, ia hanya akan menggunakan berat, misalnya, 100 bayi, di setiap benua untuk membuat kesimpulan. Berat 200 bayi yang digunakan adalah sampel dan berat rata-rata yang dihitung adalah rata-rata sampel.
Sekarang anggaplah bahwa alih-alih mengambil hanya satu sampel dari 100 bobot bayi baru lahir dari setiap benua, peneliti medis mengambil sampel acak berulang dari populasi umum, dan menghitung rata-rata sampel untuk setiap kelompok sampel. Jadi, untuk Amerika Utara, ia mengambil data untuk 100 bobot bayi baru lahir yang dicatat di AS, Kanada, dan Meksiko sebagai berikut: empat 100 sampel dari rumah sakit terpilih di AS, lima 70 sampel dari Kanada dan tiga 150 catatan dari Meksiko, dengan total dari 1.200 bobot bayi baru lahir dikelompokkan dalam 12 set. Dia juga mengumpulkan data sampel 100 bobot lahir dari masing-masing 12 negara di Amerika Selatan.
Setiap sampel memiliki mean sampel sendiri dan distribusi mean sampel dikenal sebagai distribusi sampel.
Berat rata-rata yang dihitung untuk setiap set sampel adalah distribusi sampling rata-rata. Bukan hanya mean yang bisa dihitung dari sampel. Statistik lain, seperti standar deviasi, varian, proporsi, dan rentang dapat dihitung dari data sampel. Standar deviasi dan varians mengukur variabilitas distribusi sampling.
Jumlah pengamatan dalam suatu populasi, jumlah pengamatan dalam sampel dan prosedur yang digunakan untuk menggambar set sampel menentukan variabilitas distribusi sampling. Deviasi standar dari distribusi sampel disebut kesalahan standar. Sementara rata-rata distribusi sampel sama dengan rata-rata populasi, kesalahan standar tergantung pada standar deviasi populasi, ukuran populasi dan ukuran sampel.
Mengetahui bagaimana menyebar rata-rata dari masing-masing set sampel dari satu sama lain dan dari rata-rata populasi akan memberikan indikasi seberapa dekat rata-rata sampel terhadap rata-rata populasi. Kesalahan standar distribusi sampling menurun seiring dengan meningkatnya ukuran sampel.
Pertimbangan Khusus
Populasi atau satu set sampel angka akan memiliki distribusi normal. Namun, karena distribusi sampling mencakup beberapa set pengamatan, itu tidak harus memiliki bentuk lonceng.
Mengikuti contoh kami, berat rata-rata populasi bayi di Amerika Utara dan di Amerika Selatan memiliki distribusi normal karena beberapa bayi akan memiliki berat badan kurang (di bawah rata-rata) atau kelebihan berat badan (di atas rata-rata), dengan sebagian besar bayi jatuh di antara (di sekitar rata-rata). Jika berat rata-rata bayi yang baru lahir di Amerika Utara adalah tujuh pon, berat rata-rata sampel dalam masing-masing dari 12 set pengamatan sampel yang dicatat untuk Amerika Utara juga akan mendekati tujuh pon.
Namun, jika Anda membuat grafik setiap rata-rata yang dihitung dalam masing-masing 1.200 kelompok sampel, bentuk yang dihasilkan dapat menghasilkan distribusi yang seragam, tetapi sulit untuk memprediksi dengan pasti bentuk apa yang sebenarnya akan berubah. Semakin banyak sampel yang peneliti gunakan dari populasi lebih dari satu juta angka berat, semakin banyak grafik akan mulai membentuk distribusi normal.
- Distribusi sampling adalah distribusi probabilitas dari suatu statistik yang diperoleh melalui sejumlah besar sampel yang diambil dari populasi tertentu. Distribusi sampel dari populasi tertentu adalah distribusi frekuensi dari berbagai hasil yang berbeda yang mungkin dapat terjadi untuk statistik suatu populasi. Banyak data yang diambil dan digunakan oleh akademisi, ahli statistik, peneliti, pemasar, dan analis sebenarnya sampel, bukan populasi.