Berapa jumlah kotak?
Jumlah kuadrat adalah teknik statistik yang digunakan dalam analisis regresi untuk menentukan dispersi poin data. Dalam analisis regresi, tujuannya adalah untuk menentukan seberapa baik seri data dapat dipasang ke fungsi yang mungkin membantu menjelaskan bagaimana seri data dihasilkan. Jumlah kuadrat digunakan sebagai cara matematika untuk menemukan fungsi yang paling cocok (paling tidak bervariasi) dari data.
Formula untuk Jumlah Kuadrat Adalah
Untuk himpunan X dari n item: Jumlah kuadrat = i = 0Ân (Xi −X) 2di mana: Xi = Item ke-i di setX = Rata-rata semua item dalam set (Xi −X) = Penyimpangan setiap item dari rata-rata
Jumlah kuadrat juga dikenal sebagai variasi.
Apa yang Dikatakan Jumlah Dari Kotak?
Jumlah kuadrat adalah ukuran penyimpangan dari nilai tengah. Dalam statistik, rata-rata adalah rata-rata dari sekumpulan angka dan merupakan ukuran kecenderungan sentral yang paling umum digunakan. Rata-rata aritmatika hanya dihitung dengan merangkum nilai-nilai dalam kumpulan data dan membaginya dengan jumlah nilai.
Katakanlah harga penutupan Microsoft (MSFT) dalam lima hari terakhir adalah 74, 01, 74, 77, 73, 94, 73, 61, dan 73, 40 dalam dolar AS. Jumlah dari total harga adalah $ 369, 73 dan harga rata-rata atau rata-rata dari buku teks adalah $ 369, 73 / 5 = $ 73, 95.
Tetapi mengetahui rata-rata dari set pengukuran tidak selalu cukup. Terkadang, sangat membantu untuk mengetahui berapa banyak variasi yang ada dalam satu set pengukuran. Seberapa jauh nilai-nilai individual dari mean dapat memberikan beberapa wawasan tentang seberapa cocok pengamatan atau nilai-nilai dengan model regresi yang dibuat.
Sebagai contoh, jika seorang analis ingin mengetahui apakah harga saham MSFT bergerak seiring dengan harga Apple (AAPL), ia dapat membuat daftar pengamatan untuk proses kedua saham untuk periode tertentu, katakanlah 1, 2, atau 10 tahun dan buat model linier dengan masing-masing pengamatan atau pengukuran dicatat. Jika hubungan antara kedua variabel (yaitu, harga AAPL dan harga MSFT) bukan garis lurus, maka ada variasi dalam kumpulan data yang perlu diteliti.
Dalam statistik berbicara, jika garis dalam model linier yang dibuat tidak melewati semua pengukuran nilai, maka beberapa variabilitas yang telah diamati dalam harga saham tidak dapat dijelaskan. Jumlah kuadrat digunakan untuk menghitung apakah ada hubungan linear antara dua variabel, dan variabilitas yang tidak dapat dijelaskan disebut sebagai jumlah residu kuadrat.
Jumlah kuadrat adalah jumlah kuadrat variasi, di mana variasi didefinisikan sebagai penyebaran antara setiap nilai individu dan rata-rata. Untuk menentukan jumlah kuadrat, jarak antara setiap titik data dan garis paling cocok dikuadratkan dan kemudian disimpulkan. Garis paling cocok akan meminimalkan nilai ini.
Cara Menghitung Jumlah Kuadrat
Sekarang Anda dapat melihat mengapa pengukuran ini disebut jumlah deviasi kuadrat, atau jumlah kuadrat. Menggunakan contoh MSFT kami di atas, jumlah kuadrat dapat dihitung sebagai:
- SS = (74.01 - 73.95) 2 + (74.77 - 73.95) 2 + (73.94 - 73.95) 2 + (73.61 - 73.95) 2 + (73.40 - 73.95) 2 SS = (0.06) 2 + (0.82) 2 + (- 0, 01) 2 + (-0, 34) 2 + (-0, 55) 2 SS = 1, 0942
Menambahkan jumlah penyimpangan saja tanpa kuadrat akan menghasilkan angka yang sama dengan atau mendekati nol karena penyimpangan negatif akan hampir secara sempurna mengimbangi penyimpangan positif. Untuk mendapatkan angka yang lebih realistis, jumlah penyimpangan harus dikuadratkan. Jumlah kuadrat akan selalu menjadi angka positif karena kuadrat dari angka apa pun, apakah positif atau negatif, selalu positif.
Contoh Cara Menggunakan Jumlah Kotak
Berdasarkan hasil perhitungan MSFT, jumlah kuadrat yang tinggi menunjukkan bahwa sebagian besar nilai lebih jauh dari rata-rata, dan karenanya, ada variabilitas besar dalam data. Jumlah kuadrat yang rendah mengacu pada variabilitas yang rendah dalam rangkaian pengamatan.
Dalam contoh di atas, 1, 0942 menunjukkan bahwa variabilitas harga saham MSFT dalam lima hari terakhir sangat rendah dan investor yang ingin berinvestasi dalam saham yang ditandai dengan stabilitas harga dan volatilitas yang rendah dapat memilih MSFT.
Pengambilan Kunci
- Jumlah kuadrat mengukur deviasi poin data dari nilai rata-rata. Hasil sum-of-kuadrat yang lebih tinggi menunjukkan tingkat variabilitas yang besar dalam kumpulan data, sementara hasil yang lebih rendah menunjukkan bahwa data tersebut sangat bervariasi dari nilai rata-rata.
Keterbatasan dalam Menggunakan Jumlah Kuadrat
Membuat keputusan investasi tentang stok yang akan dibeli membutuhkan lebih banyak pengamatan daripada yang terdaftar di sini. Seorang analis mungkin harus bekerja dengan data bertahun-tahun untuk mengetahui dengan kepastian yang lebih tinggi seberapa tinggi atau rendah variabilitas suatu aset. Karena lebih banyak titik data ditambahkan ke set, jumlah kuadrat menjadi lebih besar karena nilainya akan lebih tersebar.
Pengukuran variasi yang paling banyak digunakan adalah standar deviasi dan varians. Namun, untuk menghitung salah satu dari dua metrik, jumlah kuadrat harus terlebih dahulu dihitung. Varians adalah rata-rata jumlah kuadrat (yaitu, jumlah kuadrat dibagi dengan jumlah pengamatan). Simpangan baku adalah akar kuadrat dari varians.
Ada dua metode analisis regresi yang menggunakan jumlah kuadrat: metode kuadrat terkecil linier dan metode kuadrat terkecil non-linear. Metode kuadrat terkecil mengacu pada fakta bahwa fungsi regresi meminimalkan jumlah kuadrat varians dari titik data aktual. Dengan cara ini, dimungkinkan untuk menggambar fungsi yang secara statistik memberikan paling cocok untuk data. Perhatikan bahwa fungsi regresi dapat berupa linear (garis lurus) atau non-linear (garis melengkung).