Daftar Isi
- Apa itu Uji-T?
- Menjelaskan Uji-T
- Hasil Uji Ambigu
- Asumsi T-Test
- Menghitung Uji-T
- Uji-T Korelasi (atau Dipasangkan)
- E-Variance (Pooled) T-Test
- T-Test Varians yang Tidak Sama
- Menentukan T-Test mana yang akan digunakan
- Contoh T-Test Varians Tidak Sama
Apa itu Uji-T?
T-test adalah jenis statistik inferensial yang digunakan untuk menentukan apakah ada perbedaan yang signifikan antara rata-rata dua kelompok, yang mungkin terkait dalam fitur tertentu. Sebagian besar digunakan ketika set data, seperti set data yang direkam sebagai hasil dari membalik koin 100 kali, akan mengikuti distribusi normal dan mungkin memiliki varian yang tidak diketahui. Uji-t digunakan sebagai alat pengujian hipotesis, yang memungkinkan pengujian asumsi yang berlaku untuk suatu populasi.
Uji-t melihat pada statistik-t, nilai-nilai distribusi-t, dan derajat kebebasan untuk menentukan probabilitas perbedaan antara dua set data. Untuk melakukan tes dengan tiga variabel atau lebih, seseorang harus menggunakan analisis varian.
Uji-T
Menjelaskan Uji-T
Pada dasarnya, uji-t memungkinkan kita untuk membandingkan nilai rata-rata dari dua set data dan menentukan apakah mereka berasal dari populasi yang sama. Dalam contoh di atas, jika kita mengambil sampel siswa dari kelas A dan sampel siswa lain dari kelas B, kita tidak akan mengharapkan mereka memiliki mean dan standar deviasi yang persis sama. Demikian pula, sampel yang diambil dari kelompok kontrol yang diberi makan plasebo dan yang diambil dari kelompok yang diresepkan obat harus memiliki rata-rata dan standar deviasi yang sedikit berbeda.
Secara matematis, uji-t mengambil sampel dari masing-masing dari dua set dan menetapkan pernyataan masalah dengan mengasumsikan hipotesis nol bahwa kedua rata-rata sama. Berdasarkan formula yang berlaku, nilai-nilai tertentu dihitung dan dibandingkan dengan nilai standar, dan hipotesis nol yang diasumsikan diterima atau ditolak.
Jika hipotesis nol memenuhi syarat untuk ditolak, ini menunjukkan bahwa pembacaan data kuat dan tidak secara kebetulan. Uji-t hanyalah salah satu dari banyak tes yang digunakan untuk tujuan ini. Ahli statistik juga harus menggunakan tes selain dari uji-t untuk memeriksa lebih banyak variabel dan tes dengan ukuran sampel yang lebih besar. Untuk ukuran sampel yang besar, ahli statistik menggunakan uji-z. Opsi pengujian lain termasuk uji chi-square dan uji-f.
Ada tiga jenis uji-t, dan mereka dikategorikan sebagai uji-independen dan tergantung.
Pengambilan Kunci
- Uji-t adalah jenis statistik inferensial yang digunakan untuk menentukan apakah ada perbedaan yang signifikan antara rata-rata dua kelompok, yang mungkin terkait dalam fitur tertentu. Uji-t adalah salah satu dari banyak tes yang digunakan untuk tujuan pengujian hipotesis dalam statistik. Menghitung uji-t membutuhkan tiga nilai data utama. Mereka termasuk perbedaan antara nilai rata-rata dari setiap kumpulan data (disebut perbedaan rata-rata), standar deviasi setiap kelompok, dan jumlah nilai data dari setiap kelompok. Ada beberapa jenis uji-t yang dapat dilakukan tergantung pada data dan jenis analisis yang dibutuhkan.
Hasil Uji Ambigu
Pertimbangkan bahwa produsen obat ingin menguji obat yang baru ditemukan. Ini mengikuti prosedur standar mencoba obat pada satu kelompok pasien dan memberikan plasebo ke kelompok lain, yang disebut kelompok kontrol. Plasebo yang diberikan kepada kelompok kontrol adalah zat yang tidak memiliki nilai terapi yang dimaksudkan dan berfungsi sebagai tolok ukur untuk mengukur bagaimana kelompok lain, yang diberi obat yang sebenarnya, merespons.
Setelah uji coba obat, anggota kelompok kontrol yang diberi makan plasebo melaporkan peningkatan harapan hidup rata-rata tiga tahun, sementara anggota kelompok yang diresepkan obat melaporkan peningkatan harapan hidup rata-rata empat tahun. Pengamatan instan dapat mengindikasikan bahwa obat tersebut memang berfungsi karena hasilnya lebih baik untuk kelompok yang menggunakan obat tersebut. Namun, juga dimungkinkan bahwa pengamatan mungkin karena kebetulan, terutama keberuntungan yang mengejutkan. Uji-t berguna untuk menyimpulkan apakah hasilnya benar dan berlaku untuk seluruh populasi.
Di sebuah sekolah, 100 siswa di kelas A mencetak rata-rata 85% dengan standar deviasi 3%. 100 siswa lainnya yang termasuk kelas B mencetak rata-rata 87% dengan standar deviasi 4%. Sementara rata-rata kelas B lebih baik daripada kelas A, mungkin tidak benar untuk menyimpulkan bahwa kinerja keseluruhan siswa di kelas B lebih baik daripada siswa di kelas A. Ini karena, bersama dengan berarti, standar deviasi kelas B juga lebih tinggi daripada kelas A. Ini menunjukkan bahwa persentase ekstrim mereka, di sisi yang lebih rendah dan lebih tinggi, jauh lebih tersebar dibandingkan dengan kelas A. Uji-t dapat membantu menentukan kelas mana yang bernasib lebih baik.
Asumsi T-Test
- Asumsi pertama yang dibuat mengenai uji-t berkaitan dengan skala pengukuran. Asumsi untuk uji-t adalah bahwa skala pengukuran yang diterapkan pada data yang dikumpulkan mengikuti skala kontinu atau ordinal, seperti skor untuk tes IQ. Asumsi kedua yang dibuat adalah bahwa dari sampel acak sederhana, bahwa data tersebut adalah dikumpulkan dari perwakilan, dipilih secara acak dari total populasi. Asumsi ketiga adalah data, ketika diplot, menghasilkan distribusi normal, kurva distribusi berbentuk lonceng. Asumsi keempat adalah ukuran sampel yang cukup besar digunakan. Ukuran sampel yang lebih besar berarti distribusi hasil harus mendekati kurva berbentuk lonceng normal. Asumsi terakhir adalah homogenitas varians. Varians homogen, atau sama, ada ketika standar deviasi sampel kira-kira sama.
Menghitung Uji-T
Menghitung uji-t membutuhkan tiga nilai data utama. Mereka termasuk perbedaan antara nilai rata-rata dari setiap kumpulan data (disebut perbedaan rata-rata), standar deviasi setiap kelompok, dan jumlah nilai data dari masing-masing kelompok.
Hasil dari uji-t menghasilkan nilai-t. Nilai-t yang dihitung ini kemudian dibandingkan dengan nilai yang diperoleh dari tabel nilai kritis (disebut Tabel Distribusi-T). Perbandingan ini membantu menentukan seberapa besar kemungkinan perbedaan antara rata-rata terjadi secara kebetulan atau apakah set data benar-benar memiliki perbedaan intrinsik. Uji-t mempertanyakan apakah perbedaan antara kelompok mewakili perbedaan nyata dalam penelitian atau apakah itu kemungkinan perbedaan statistik yang tidak berarti.
Tabel T-Distribusi
T-Distribution Table tersedia dalam format satu-ekor dan dua-ekor. Yang pertama digunakan untuk menilai kasus yang memiliki nilai tetap atau kisaran dengan arah yang jelas (positif atau negatif). Misalnya, berapa probabilitas nilai output yang tersisa di bawah -3, atau mendapatkan lebih dari tujuh saat menggulirkan sepasang dadu? Yang terakhir digunakan untuk analisis rentang terikat, seperti menanyakan apakah koordinat jatuh antara -2 dan +2.
Perhitungan dapat dilakukan dengan program perangkat lunak standar yang mendukung fungsi statistik yang diperlukan, seperti yang ditemukan di MS Excel.
Nilai-T dan Tingkat Kebebasan
Uji-t menghasilkan dua nilai sebagai hasilnya: nilai-t dan derajat kebebasan. Nilai-t adalah rasio perbedaan antara rata-rata dari dua set sampel dan perbedaan yang ada dalam set sampel. Sementara nilai pembilang (perbedaan antara rata-rata dari dua set sampel) mudah untuk dihitung, penyebut (perbedaan yang ada dalam set sampel) dapat menjadi sedikit rumit tergantung pada jenis nilai data yang terlibat. Penyebut dari rasio adalah pengukuran dispersi atau variabilitas. Nilai yang lebih tinggi dari nilai-t, juga disebut skor-t, menunjukkan bahwa ada perbedaan besar antara dua set sampel. Semakin kecil nilai-t, semakin banyak kesamaan yang ada antara dua set sampel.
- Nilai-t yang besar menunjukkan bahwa kelompok-kelompok tersebut berbeda. Nilai-t yang kecil menunjukkan bahwa kelompok-kelompok tersebut serupa.
Derajat kebebasan mengacu pada nilai-nilai dalam sebuah penelitian yang memiliki kebebasan untuk bervariasi dan sangat penting untuk menilai pentingnya dan validitas hipotesis nol. Perhitungan nilai-nilai ini biasanya tergantung pada jumlah catatan data yang tersedia dalam set sampel.
Uji-T Korelasi (atau Dipasangkan)
Uji-t berkorelasi dilakukan ketika sampel biasanya terdiri dari pasangan yang cocok dari unit yang sama, atau ketika ada kasus tindakan berulang. Misalnya, mungkin ada contoh pasien yang sama diuji berulang kali — sebelum dan sesudah menerima perawatan tertentu. Dalam kasus seperti itu, setiap pasien digunakan sebagai sampel kontrol terhadap diri mereka sendiri.
Metode ini juga berlaku untuk kasus di mana sampel terkait dalam beberapa cara atau memiliki karakteristik yang cocok, seperti analisis komparatif yang melibatkan anak-anak, orang tua atau saudara kandung. Uji-t yang berkorelasi atau berpasangan adalah tipe dependen, karena ini melibatkan kasus-kasus di mana dua set sampel terkait.
Rumus untuk menghitung nilai-t dan derajat kebebasan untuk uji-t berpasangan adalah:
- Mean1 dan mean2 adalah nilai rata-rata dari masing-masing set sampel, sementara var1 dan var2 mewakili varians dari masing-masing set sampel.
Dua tipe yang tersisa adalah milik independent t-test. Sampel dari tipe-tipe ini dipilih secara independen satu sama lain — yaitu, kumpulan data dalam dua kelompok tidak mengacu pada nilai yang sama. Mereka termasuk kasus-kasus seperti sekelompok 100 pasien yang dibagi menjadi dua set masing-masing 50 pasien. Salah satu kelompok menjadi kelompok kontrol dan diberi plasebo, sedangkan kelompok lain menerima pengobatan yang ditentukan. Ini merupakan dua kelompok sampel independen yang tidak berpasangan satu sama lain.
V-Equal Variance (atau Pooled)
Varians t-test yang sama digunakan ketika jumlah sampel dalam setiap kelompok adalah sama, atau varians dari dua set data adalah serupa. Rumus berikut digunakan untuk menghitung nilai-t dan derajat kebebasan untuk uji varian yang sama:
Nilai T = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 mean1 − mean2 di mana2: mean1 dan mean2 = Nilai rata-rata dari masing-masing sampel setvar1 dan var2 = Varians dari masing-masing set sampel n dan n2 = Jumlah rekaman dalam setiap set sampel
dan, Derajat Kebebasan = n1 + n2−2 Di mana: n1 dan n2 = Jumlah catatan di setiap set sampel
T-Test Varians Tidak Sama
Uji t varians tidak sama digunakan ketika jumlah sampel dalam setiap kelompok berbeda, dan varians dari dua set data juga berbeda. Tes ini juga disebut uji-Welch. Rumus berikut digunakan untuk menghitung nilai-t dan derajat kebebasan untuk uji-t varians yang tidak sama:
Nilai-T = n1var12 + n2var22 mean1 − mean2 di mana: mean1 dan mean2 = Nilai rata-rata dari masing-masing set sampel1 dan var2 = Variasi dari masing-masing set sampeln1 dan n2 = Jumlah catatan dalam setiap set sampel
dan, Derajat Kebebasan = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 di mana: var1 dan var2 = Varians dari masing-masing setn1 dan n2 = angka catatan di setiap set sampel
Menentukan Uji-T yang Benar untuk Digunakan
Diagram alir berikut dapat digunakan untuk menentukan uji-t mana yang harus digunakan berdasarkan karakteristik dari set sampel. Butir-butir utama yang harus dipertimbangkan termasuk apakah catatan sampel serupa, jumlah catatan data di setiap kelompok sampel, dan varians dari setiap kelompok sampel.
Gambar oleh Julie Bang © Investopedia 2019
Contoh T-Test Varians Tidak Sama
Anggaplah kita mengambil pengukuran diagonal dari lukisan yang diterima di galeri seni. Satu kelompok sampel mencakup 10 lukisan, sedangkan yang lain mencakup 20 lukisan. Set data, dengan nilai mean dan varians yang sesuai, adalah sebagai berikut:
Set 1 | Set 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21, 95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Berarti | 19.4 | 21.6 |
Perbedaan | 1.4 | 17.1 |
Meskipun rata-rata Set 2 lebih tinggi dari Set 1, kami tidak dapat menyimpulkan bahwa semua lukisan memiliki panjang rata-rata sekitar 21, 6 unit karena varians dari Set 2 secara signifikan lebih tinggi dari Set 1. Apakah ini kebetulan, atau apakah perbedaan benar-benar ada dalam populasi keseluruhan dari semua lukisan yang diterima di galeri seni? Kami membangun masalah dengan mengasumsikan hipotesis nol bahwa rata-rata adalah sama antara dua set sampel dan melakukan uji-t untuk mengkonfirmasi apakah hipotesis itu benar.
Karena jumlah rekaman data berbeda (n1 = 10 dan n2 = 20) dan variansnya juga berbeda, nilai-t dan derajat kebebasan dihitung untuk kumpulan data di atas menggunakan rumus yang disebutkan dalam Un-equal Variance T-Test bagian.
Nilai-t adalah -2.24787. Karena tanda minus dapat diabaikan ketika membandingkan dua nilai-t, nilai yang dihitung adalah 2.24787.
Derajat nilai kebebasan adalah 24, 38 dan dikurangi menjadi 24, karena definisi rumus memerlukan pembulatan nilai ke nilai integer yang paling tidak mungkin.
Setiap kali distribusi normal diasumsikan, seseorang dapat menentukan tingkat probabilitas (tingkat alfa, tingkat signifikansi, p ) sebagai kriteria untuk penerimaan. Dalam kebanyakan kasus, nilai 5% dapat diasumsikan.
Menggunakan derajat nilai kebebasan sebagai 24 dan tingkat signifikansi 5%, melihat tabel distribusi nilai-t memberikan nilai 2, 064. Membandingkan nilai ini dengan nilai yang dihitung 2.247 menunjukkan bahwa nilai-t yang dihitung lebih besar dari nilai tabel pada tingkat signifikansi 5%. Oleh karena itu, aman untuk menolak hipotesis nol bahwa tidak ada perbedaan antara rata-rata. Set populasi memiliki perbedaan intrinsik, dan mereka tidak secara kebetulan.
Bandingkan Akun Investasi × Penawaran yang muncul dalam tabel ini berasal dari kemitraan di mana Investopedia menerima kompensasi. Deskripsi Nama PenyediaKetentuan Terkait
Bagaimana Analisis Varians (ANOVA) Bekerja Analisis varians (ANOVA) adalah alat analisis statistik yang memisahkan total variabilitas yang ditemukan dalam kumpulan data menjadi dua komponen: faktor acak dan sistematis. lebih lanjut Z-Test Definition Z-test adalah tes statistik yang digunakan untuk menentukan apakah dua mean populasi berbeda ketika varians diketahui dan ukuran sampel besar. lebih lanjut Derajat Kebebasan Definisi Derajat Kebebasan mengacu pada jumlah maksimum dari nilai-nilai independen yang logis, yang merupakan nilai-nilai yang memiliki kebebasan untuk bervariasi, dalam sampel data. selengkapnya Memahami Distribusi T Distribusi AT adalah jenis fungsi probabilitas yang sesuai untuk memperkirakan parameter populasi untuk ukuran sampel kecil atau varian yang tidak diketahui. lebih lanjut Apa Tindakan Semi-Deviasi Semi-deviasi adalah metode untuk mengevaluasi fluktuasi di bawah rata-rata dalam pengembalian investasi. Ini digunakan sebagai alternatif deviasi standar. lebih lanjut Tes Bonferroni Tes Bonferroni adalah jenis uji perbandingan berganda yang digunakan dalam analisis statistik. lebih banyak Tautan MitraArtikel terkait
Ekonomi
Asumsi apa yang dibuat ketika melakukan uji-t?
Manajemen risiko
Menggunakan Volatilitas Historis Untuk Mengukur Risiko Masa Depan
Strategi Perdagangan & Pendidikan
Cara Menggunakan Excel untuk Mensimulasikan Harga Saham
Rasio keuangan
Bagaimana Anda menghitung IRR di Excel?
Matematika & Statistik
Apa itu Kesalahan Standar Relatif
Rasio keuangan