Pernyataan yang
sering kita dengan adalah bahwa regresi dimengerti dengan kata kunci pengaruh,
dan korelasi dimengerti dengan kata kunci hubungan. Pengertian sederhana itu
tidaklah salah, akan tetapi, tidak ada salahnya juga kita memahami secara lebih
lanjut tentang regresi dan korelasi.
Analisis korelasi
berkaitan erat dengan regresi, tetapi secara konsep berbeda dengan analisis
regresi. Analisis korelasi adalah mengukur suatu tingkat atau kekuatan hubungan
linear antara dua variabel. Koefisien korelasi adalah mengukur kekuatan
hubungan linear. Sebagai contoh, kita tertarik untuk menemukan korelasi antara
merokok dengan penyakit kanker, berdasarkan penjelasan statistik dan
matematika, pada anak sekolah dan mahasiswa (dst). Dalam analisis regresi, kita
tidak menggunakan pengukuran tersebut. Analisis regresi mencoba untuk
mengestimasi atau memprediksikan nilai rata-rata suatu variabel yang sudah
diketahui nilainya, berdasarkan suatu variabel lain yang juga sudah diketahui
nilainya. Misalnya, kita ingin mengetahui apakah kita dapat memprediksikan
nilai rata-rata ujian statistik berdasarkan nilai hasil ujian matematika.
Regresi dan
korelasi mempunyai perbedaan mendasar. Dalam analisis regresi terdapat asimtri
pada variabel tergantung dan terkiat yang akan dianalisis. Variabel terikat
diasumsikan random atau stokastik, sehingga mempunyai distribusi probabilitas.
Variabel penjelas (variabel bebas) diasumsikan mempunyai nilai yang tertentu
(dalam sampel tertentu). Sebenarnya sangat dimungkinkan bahwa variabel bebas
juga stokastik secara intrinsik, akan tetapi untuk kegunaan analisis regresi,
maka kita asumsikan bahwa nilai variabel bebas adalah tertentu (fixed).
Nilai-nilai pada variabel bebas adalah sama pada berbagai sampel sehingga tidak
random atau tidak stokastik.
Dalam analisis
korelasi, kita menggunakan dua variabel yang simetris, sehingga tidak ada
perbedaan antara variabel terikat dengan variabel penjelas. Korelasi antara
nilai ujian matematika dan ujian statistik (dalam contoh di atas) adalah sama
dengan korelasi antara ujian statistik dan ujian matematika. Lebih lanjut, dua
variabel tersebut diasumsikan random. Seperti yang telah kita ketahui, bahwa
kebanyakan teori korelasi berdasarkan pada asumsi variabel random, di mana
kebanyakan teori regresi berdasarkan pada asumsi variabel tergantung stokastik
dan variabel bebas adalah tertentu atau non stokastik. Meskipun demikian, dalam
analisis yang lebih mendalam, kita dapat mempertimbangkan kembali asumsi bahwa
variabel penjelas merupakan non stokastik.
Komentar
Posting Komentar