REGRESI
A. Pengertian Regresi
Seringkali peneliti ingin melihat kondisi di waktu yang akan datang dengan suatu dasar keadaan sekarang atau ingin melihat kondisi diwaktu yang lalu dengan dasar keadaan sekarang. Sifat ini melakukan prediksi atau taksiran mulai berkembang dalam dunia ekonomi, tetapi sekarang banyak dilakukan di dunia ekonomi, tetai sekarang banyak dilakukan di dunia pendidikan. Bahkan dewasa ini, melakukan prediksi keadaan siswa untuk waktu yang akan datang merupakan kondisi yang sangat dibutuhkan dalam dunia pendidikan. Melalui prediksi yang baik, perencanaan pendidikan, baik yang menyangkut kurikulum, metode mengajar, fasilitas ruang dan guru, dan lain-lainnya, akan dapat direalisasikan seefisien mungkin.
Pada pembahasan bab ketujuh kita telah membahas korelasi antara satu variabel dengan variabel yang lainnya. hubungan yang telah dibahas di muka merupakan hubungan yang bersifat korelasional, artinya mana yang sebagai sebab dan mana yang menjadi akibat tidaklah jelas.
Dalam melakukan prediksi, kita harus dapat menentukan dengan tegas mana yang sebab dan mana yang akibat (tentunya dengan bantuan kajian teoritis). Dengan diketahuinya sebab dan akibat, maka hubungan yang dicari bersifat kausal (sebab akibat). Selanjutnya, jika kita tahu tentang variabel sebab (variabel bebas), maka kita dapat melakukan prediksi tentang kondisi variabel akibat (variabel terikatnya).
Sebagaimana layaknya arti kata prediksi, prediksi disini pun bukanlah merupakan hal yang pasti, tetapi merupakan suatu keadaan yang mendekati kebenaran. Jika kita membandingkan nilai asli variabel yang kita predik dengan nilai prediksinya berkemungkinan akan terdapat perbedaan. Perbedaan tersebut biasa terlalu besar maupun terlalu kecil. Sepanjang perbedaan tersebut tidak besar, maka prediksi yang kita lakukan merupakan hasil kerja yang luar biasa. Penyimpangan-penyimpangan nilai asli dan nilai prediksi ini sering terjadi karena dalam melakukan prediksi kita berdasarkan nilai-nilai rata-rata, dan menggunakan suatu persamaan yang menggambarkan suatu garis tertentu. Sifat yang menggambarkan garis bermacam-macam, ada yang lurus, hiperbola dan lainnya. untuk menentukan rumus mana yang akan dipakai tergantung pada teori yang dipakai dan kondisi yang diperoleh, karena masing-masing rumus dikembangkan melalui beberapa asumsi.
B. Regresi Linear Sederhana
Pembahasan pada sub bab ini dititikberatkan pada pembahasan regresi linear dengan satu variabel bebas. Kita mulai dengan model linear sederhana ditujukan untuk mempermudah pemahaman konsep regresi, karena model inilh yang paling sederhana dibanding dengan model-model lainnya. Tanpa mempelajari model linear sederhana memungkinkan terlalu sukar mendalami dan memahami model-model lainnya.
Untuk mempermudah pemahaman regresi perlu kita kembali pada pola penyebaran skor (titik-titik penyebaran skor) yaitu titik-titik perpotongan antara nilai X dan Y.
Contoh:
Misalnya kita mempunyai data dari dua buah variabel yaitu variabel inteligensi (X) dan variabel hasil belajar (Y), yang penyebarannya sebagai berikut:
| X | 90 | 100 | 100 | 95 | 105 | 110 | 105 | 105 | 115 | 120 |
| Y | 70 | 75 | 80 | 80 | 85 | 85 | 85 | 90 | 95 | 100 |
Berdasarkan data tersebut di atas kita buat gambar diagramnya (scatter diagram) sebagai berikut:

Beberapa variasi yang perlu dilihat adalah:
1. Variasi kekeliruan taksiran (standar error estimate) yang dapat dihitung dengan rumus 7.3.
S2xy = ∑ (Y-
)2/ (n-2)
2. Variasi koefisien regresi terdiri dari dua macam:
a. Koefisien regresi dihitung dengan rumus
b. Koefisien regresi b dihitung dengan rumus
3. Variasi ramalan Y untuk setiap X
a. Rata-rata ramalan dihitung dengan rumus

b. Ramalan individu dihitung dengan rumus

Langkah lain untuk menguji hipotesis berkaitan dengan regresi liniear adalah melalui analisis variance atau analisis variasi. Dalam hal ini akan berhubungan dengan jumlah kuadrat (sum of squares) dari masing-masing variabel. Di sini jumlah kuadrat variabel terikat merupakan jumlah dari; kuadrat jumlah Y dibagi dengan jumlah sampel, ditambah dengan hasil kali b dengan jumlah hasil kali simpangan masing-masing variabel dengan rata-ratanya, dan jumlah kuadrat simpangan Y dengan Y'. Jika ditulis dalam bentuk matematikal, maka jumlah kuadrat variabel terikat dapat dilihat pada rumus:
Persamaan di atas dapat diubah menjadi bentuk lain
Dengan demikian maka sumber variasi terdiri dari 3 macam, yaitu:
1. Regresi a, dengan derajat kebebasan 1
2. Regresi (b/a) dengan derajat kebebasan 1
3. Sisa, dengan derajat kebebasan n – 2
Dari ketiga sumber variasi di atas kita dapat menghitung dari masing-masingnya berupa sum of squares dan mean squares. Sum of squares yang berkaitan dengan regresi a dapat dihitung dengan rumus:
Untuk contoh di atas SSa adalah:
= 714025 : 10
= 71402.5
Dapat disederhanakan menjadi rumus:

Untuk contoh soal di atas, nilai SSb/a adalah:
= 0.93 [88975-{(1045 x 845):10}]
= 625.425
Sum of square sisa dapat dihitung dengan rumus:
SSb/a = ∑Y2 – SSa – SSb/a
Untuk contohnya adalah sebagai berikut:
= 72125 – 71402.5 – 625.425
= 97.075
Mean square yang berkaitan dengan regresi a dapat dihitung dengan rumus:
MSa = SSa / dk SSa
Untuk soal di atas mean squaresnya adalah:
= 71402.5 : 1
= 71402.5
Tahap akhir dalam pengujian hipotesis signifikansi konstribusi atau sumbangan variabel X terdapat variabel Y adalah menghitung nilai F yang dapat diperoleh dengan rumus:
F = MSb/a : MSsisa
Nilai F untuk contoh di atas adalah :
= 625.425 : 12.134375
= 51.54159155 = 51.54
Setelah nilai F hitung diperoleh, maka kita akan menerima atau menolak H0 dengan jalan membandingkan nilai F hitung dengan nilai F tabel. Apabila kita mengambil alpha (α) sebesar 0,01 maka F0,01 (1,8) = 11,26.
Dengan demikian maka tampak bahwa hasil perhitungan dengan langkah pertama maupun kedua menghasilkan kesimpulan yang sama, yaitu sama-sama menyatakan bahwa persamaan regresi liner Y' = -12.77 + 0.93 X dapat digunakan untuk melakukan predisi. Untuk lebih jelasnya, biasanya hasil langkah terakhir ini disimpulkan/diringkas dalam satu tabel yang disebut dengan tabel ANOVA. Tabel ANOVA untuk contoh di atas sebagai berikut:
| Sumber variansi | dk | SS | MS | F |
| Regresi a | 1 | 71402.5 | 71402.5 | |
| Regresi b/a | 1 | 625.425 | 625.425 | 51.54 |
| Sisa | 8 | 97.075 | 12.134375 | |
| Total | 10 | 72125 | - | - |
Langkah-langkah tersebut di atas akan menghasilkan analisis yang baik jika beberapa syarat telah dipenuhi. Oleh karena itu, sebelum kita beranjak lebih jauh lebih baik kita menguji apakah kondisi data sampel kita telah memenuhi seluruh persyaratan analisis regresi atau tidak. Sedangkan syarat-syarat yang harus dipenuhi dalam perhitungan di atas adalah:
1. Sampel diambil secara random (acak)
2. Variabel X dan variabel Y mempunyai hubungan yang kausal, dimana X merupakan sebab dan Y merupakan akibat.
3. Nilai Y mempunyai penyebaran yang berdistribusi normal.
4. Persamaan tersebut hendaknya benar-benar linear.
C. Uji Linear Regresi Sederhana
Pada pembahasan yang lalu kita tidak secara teliti dan terperinci membahas tentang linieritas dari pesamaan regresi yang kita peroleh. Pada saat pengujian signifikansi koefisien regresi telah kita simpulkan bahwa koefisien regresi adalah signifikan dan linear. Untuk lebih telitinya analisis, masih perlu dilakukan analisis terpisah tentang apakah persamaan regresi linear barulah bisa digunakan untuk melakukan prediksi dengan bentuk linear, sebaliknya jika ternyata persamaan regresi yang diperoleh tidak linear, maka kita perlu menggunakan persamaan lain yang lebih cocok. Pada pembahasan yang lalu pun telah disinggung selintas pengujian liniaritas dengan leas square. Jika jumlah data tidak banyak, leas squares memang bisa membantu peneliti untuk melihat bentuk persamaan. Tetapi jika jumlah sampel yang dihadapi banyak, maka pengamatan melalui least squares bisa menyesatkan. Di samping itu, leas squares tergantung pada pengamatan mata semata. Untuk itulah leas squares perlu disertai dengan bentuk pengujian linearitas.
Pengujian linearitas berkaitan dengan sum of squares sisa, dimana sum of squares sisa dipisah menjadi dua bagian yaitu sum of squares ketidaksamaan, dan sum of squares error. Dalam mebahas ketidaksamaan kita perlu melihat (mengelompokkan) Y berdasarkan nilai X, artinya kita cari simpangan nilai Y dalam setiap kelompok X. sehingga banyaknya derajat kebebasannya adalah k (banyak kelompok X) dikurang dengan 2. Sedangkan sum of squares error merupakan selisih sum of squares sisa dengan sum of squares ketidaksamaan, dengan derajat kebebasan n-k.
Untuk lebih jelasnya marilah kita uji liniaritas contoh soal seperti di atas.
Langkah awal adalah menyusun penyebaran nilai-nilai data Y berdasarkan niali X.
Penyebaran nilai pengamatan Y berdasarkan nilai X untuk soal sebgai berikut:
| X | Y |
| 120 | 100 |
| 115 | 95 |
| 110 | 85 |
| 105 | 90 |
| 105 | 85 |
| 105 | 85 |
| 100 | 80 |
| 100 | 75 |
| 95 | 80 |
| 90 | 70 |
Berdasarkan tabel di atas dapat dihitung sum of square error (SSeror) dengan rumus:
Untuk contoh soal di atas squares ketidaksamaannya sebagai berikut:

SSketidaksamaan = SSsisa – SSerror
= 97.075 – 29.167
= 67.908
MSketidaksamaan = SSketidaksamaan : dk SSketidaksamaan
= 67.908 : (7-2)
= 13.5816
MSerror = SSerror : dk SSerror
= 29.167 : (10-7)
= 9.722333333
= 9.7223
Tidak ada komentar:
Posting Komentar