Regresi dan Korelasi







Pernyataan yang sering kita dengan adalah bahwa regresi dimengerti dengan kata kunci pengaruh, dan korelasi dimengerti dengan kata kunci hubungan. Pengertian sederhana itu tidaklah salah, akan tetapi, tidak ada salahnya juga kita memahami secara lebih lanjut tentang regresi dan korelasi.
Analisis korelasi berkaitan erat dengan regresi, tetapi secara konsep berbeda dengan analisis regresi. Analisis korelasi adalah mengukur suatu tingkat atau kekuatan hubungan linear antara dua variabel. Koefisien korelasi adalah mengukur kekuatan hubungan linear. Sebagai contoh, kita tertarik untuk menemukan korelasi antara merokok dengan penyakit kanker, berdasarkan penjelasan statistik dan matematika, pada anak sekolah dan mahasiswa (dst). Dalam analisis regresi, kita tidak menggunakan pengukuran tersebut. Analisis regresi mencoba untuk mengestimasi atau memprediksikan nilai rata-rata suatu variabel yang sudah diketahui nilainya, berdasarkan suatu variabel lain yang juga sudah diketahui nilainya. Misalnya, kita ingin mengetahui apakah kita dapat memprediksikan nilai rata-rata ujian statistik berdasarkan nilai hasil ujian matematika.


Regresi dan korelasi mempunyai perbedaan mendasar. Dalam analisis regresi terdapat asimtri pada variabel tergantung dan terkiat yang akan dianalisis. Variabel terikat diasumsikan random atau stokastik, sehingga mempunyai distribusi probabilitas. Variabel penjelas (variabel bebas) diasumsikan mempunyai nilai yang tertentu (dalam sampel tertentu). Sebenarnya sangat dimungkinkan bahwa variabel bebas juga stokastik secara intrinsik, akan tetapi untuk kegunaan analisis regresi, maka kita asumsikan bahwa nilai variabel bebas adalah tertentu (fixed). Nilai-nilai pada variabel bebas adalah sama pada berbagai sampel sehingga tidak random atau tidak stokastik.


Dalam analisis korelasi, kita menggunakan dua variabel yang simetris, sehingga tidak ada perbedaan antara variabel terikat dengan variabel penjelas. Korelasi antara nilai ujian matematika dan ujian statistik (dalam contoh di atas) adalah sama dengan korelasi antara ujian statistik dan ujian matematika. Lebih lanjut, dua variabel tersebut diasumsikan random. Seperti yang telah kita ketahui, bahwa kebanyakan teori korelasi berdasarkan pada asumsi variabel random, di mana kebanyakan teori regresi berdasarkan pada asumsi variabel tergantung stokastik dan variabel bebas adalah tertentu atau non stokastik. Meskipun demikian, dalam analisis yang lebih mendalam, kita dapat mempertimbangkan kembali asumsi bahwa variabel penjelas merupakan non stokastik.

Komentar