Apa itu Statistik Chi-Square?
Chi-square ( χ 2) statistik adalah tes yang mengukur bagaimana ekspektasi dibandingkan dengan data aktual yang diamati (atau hasil model). Data yang digunakan dalam menghitung statistik chi-square harus acak, mentah, saling eksklusif, diambil dari variabel independen, dan diambil dari sampel yang cukup besar. Misalnya, hasil melempar koin 100 kali memenuhi kriteria ini.
Tes chi-square sering digunakan dalam pengujian hipotesis.
Formula untuk Chi-Square Is
χc2 = ∑ (Oi − Ei) 2Di mana saja: c = derajat kebebasanO = nilai yang diamati E = nilai yang diharapkan \ mulai {aligned} & \ chi ^ 2_c = \ jumlah \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {di mana:} \ & c = \ teks {derajat kebebasan} \ & O = \ teks {nilai yang diamati} \ & E = \ teks {nilai yang diharapkan } \ \ end {aligned} χc2 = ∑Ei (Oi −Ei) 2 di mana: c = derajat kebebasanO = nilai yang diamati E = nilai yang diharapkan E = nilai yang diharapkan
Apa yang Diceritakan Statistik Chi-Square?
Ada dua jenis utama uji chi-square: tes independensi, yang menanyakan pertanyaan tentang hubungan, seperti, "Apakah ada hubungan antara gender dan skor SAT?"; dan uji good-of-fit, yang menanyakan sesuatu seperti "Jika sebuah koin dilemparkan 100 kali, akankah itu muncul kepala 50 kali dan ekor 50 kali?"
Untuk tes ini, derajat kebebasan digunakan untuk menentukan apakah hipotesis nol tertentu dapat ditolak berdasarkan jumlah variabel dan sampel dalam percobaan.
Sebagai contoh, ketika mempertimbangkan siswa dan pilihan kursus, ukuran sampel 30 atau 40 siswa kemungkinan tidak cukup besar untuk menghasilkan data yang signifikan. Mendapatkan hasil yang sama atau serupa dari studi menggunakan ukuran sampel 400 atau 500 siswa lebih valid.
Dalam contoh lain, pertimbangkan untuk melempar koin 100 kali. Hasil yang diharapkan dari melempar koin yang adil 100 kali adalah bahwa kepala akan muncul 50 kali dan ekor akan muncul 50 kali. Hasil aktualnya adalah kepala muncul 45 kali dan ekor muncul 55 kali. Statistik chi-square menunjukkan perbedaan antara hasil yang diharapkan dan hasil yang sebenarnya.
Contoh Tes Chi-Squared
Bayangkan sebuah jajak pendapat acak diambil di 2.000 pemilih yang berbeda, baik pria dan wanita Orang-orang yang merespons diklasifikasikan berdasarkan jenis kelamin mereka dan apakah mereka republiken, demokrat, atau independen. Bayangkan sebuah kotak dengan kolom berlabel republik, demokrat, dan independen, dan dua baris berlabel pria dan wanita. Asumsikan data dari 2.000 responden adalah sebagai berikut:
Langkah pertama untuk menghitung statistik chi kuadrat adalah untuk menemukan frekuensi yang diharapkan. Ini dihitung untuk setiap "sel" di kisi. Karena ada dua kategori gender dan tiga kategori pandangan politik, ada enam frekuensi total yang diharapkan. Rumus untuk frekuensi yang diharapkan adalah:
E (r, c) = n (r) × c (r) nwhere: r = baris dalam questionc = kolom dalam kuesioner = total yang sesuai \ begin {aligned} & E (r, c) = \ frac {n (r) kali c (r)} {n} \ & \ textbf {di mana:} \ & r = \ teks {baris yang dipertanyakan} \ & c = \ teks {kolom yang dipertanyakan} \ & n = \ teks {total yang sesuai} \ \ end {aligned} E (r, c) = nn (r) × c (r) di mana: r = baris dalam questionc = kolom dalam kuesioner = total yang sesuai
Dalam contoh ini, frekuensi yang diharapkan adalah:
- E (1, 1) = (900 x 800) / 2.000 = 360E (1, 2) = (900 x 800) / 2.000 = 360E (1, 3) = (200 x 800) / 2.000 = 80E (2, 1)) = (900 x 1.200) / 2.000 = 540E (2, 2) = (900 x 1.200) / 2.000 = 540E (2, 3) = (200 x 1.200) / 2.000 = 120
Berikutnya, ini adalah nilai yang digunakan untuk menghitung statistik kuadrat menggunakan rumus berikut:
Chi-squared = β2E (r, c) di mana: O (r, c) = data yang diamati untuk baris dan kolom yang diberikan \ begin {aligned} & \ text {Chi-squared} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {di mana:} \ & O (r, c) = \ text {data yang diamati untuk baris dan kolom yang diberikan} \ \ end {aligned} Chi-squared = ∑E (r, c) 2 di mana: O (r, c) = data yang diamati untuk baris dan kolom yang diberikan
Dalam contoh ini, ekspresi untuk setiap nilai yang diamati adalah:
- O (1, 1) = (400 - 360) 2/360 = 4, 44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2.96O (2, 2) = (600 - 540) 2/540 = 6.67O (2, 3) = (100 - 120) 2/120 = 3.33
Statistik chi-squared kemudian sama dengan jumlah dari nilai ini, atau 32, 41. Kita kemudian dapat melihat tabel statistik chi-squared untuk melihat, mengingat derajat kebebasan dalam pengaturan kami, apakah hasilnya signifikan secara statistik atau tidak.