Jumat, 04 Mei 2012

CIRI-CIRI TES YANG BAIK

PENDAHULUAN

           Dalam sebuah evaluasi alat yang digunakan digolongkan menjadi dua macam yaitu tes dan non tes. Istilah tes diambil dari kata testum suatu pengertian dalam bahasa Prancis kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada pula yang mengartikannya sebagai piring yang dibuat dari tanah (Suharsimi Arikunto, 2005: 52). Muchtar Bukhari dalam bukunya “ Teknik-teknik Evaluasi “ (dalam halaman web) mengatakan bahwa tes adalah suatu percobaan yang diadakan untuk mengetahui ada tidaknya hasil-hasil pelajaran tertentu pada seseorang murid atau kelompok murid.
            Didorong oleh munculnya statistik dalam penganalisisan data dan informasi, maka akhirnya tes digunakan dalam berbagai bidang seperti tes kemanpuan dasar, tes kelelahan perhatian, tes ingatan, tes minat, tes sikap, dan sebagainya. Yang terkenal penggunaannya di sekolah hanyalah tes prestasi belajar.
            Di Indonesia, sebelum ada Ejaan Yang Disempurnakan dalam bahasa Indonesia ditulis dengan test. Tes adalah alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Untuk mengerjakan tes ini tergantung dari petunjuk yang diberikan. Misalnya: melingkari huruf di depan pilihan jawaban, menerangkan, mencoret jawaban yang salah, melakukan tugas atau suruhan, menjawab secara lisan, dan sebagainya.
            Seperti yang telah kita ketahui bahwa tes itu mempunyai dua bentuk, yaitu bentuk obyektif ( multiple choice) dan bentuk subyektif (uraian). Baik tes objektif maupun tes uraian haruslah memiliki syarat dan ciri-ciri tertentu agar tes itu dapat digunakan dan disebut sebagai tes yang baik. Tes yang baik memiliki ciri-ciri seperti memiliki validitas, reliabelitas, memiliki daya beda, dan praktis. Dalam buku Arikunto, “Dasar-Dasar Evaluasi Pendidikan” kita akan melihat ciri lain dari tes yang baik, yaitu bersifat ekonomis (2005: 63). Begitu pula dalam buku, “Evaluasi Pendidikan”.
Dalam bab-bab selanjutnya akan diuraikan satu persatu ciri tes yang baik, yaitu validitas, reliabelitas, daya beda, dan praktis.

BAB I
VALIDITAS

2.1  Pengertian Validitas dan Macam-Macam Validitas
Sebuah tes haruslah memiliki validitas. Ini adalah karakteristik sebuah tes yang  sangat penting. Sebuah tes dikatakan valid jika ia mengukur apa yang seharusnya diukur (Nurkancana dkk, 1982: 122. Mudjijo, 1995: 40. Chabib Thoha, 2003: 109). Jadi, validitas (ketepatan) di sini berarti menilai apa yang seharusnya dinilai dengan menggunakan alat penilaian yang benar-benar sesuai.  Seandainya kita ingin mengukur perubahan perilaku siswa misalnya, kita memerlukan alat penilaian yang dapat memberi indikasi bahwa telah terjadi perubahan pada tingkat tertentu seperti yang kita harapkan.
Sebuah tes prestasi belajar diharapkan benar-benar dapat mengukur jenis perubahan yang sudah ditetapkan dalam tujuan pengajaran. Tes juga diharapkan “comprehensiveness”, di mana semua kategori tujuan harus dinilai untuk menetapkan sampai sejauh mana tujuan-tujuan tersebut telah tercapai. Bukan hanya pengetahuan saja, tetapi juga pengembangan berpikir, sikap, perasaan, nilai-nilai dan ketrampilan untuk dinilai.
Menurut Arikunto (2005: 58) sebelum mulai dengan penjelasan mengenai validitas, perlu kiranya dipahami terlebih dahulu perbedaan arti istilah “validitas” dengan “valid”. Validitas merupakan sebuah kata benda dan valid merupakan kata sifat. Dari pengalaman sehari-hari tidak sedikit siswa dan guru mengatakan: “Tes ini baik karena sudah validitas.” Jelas kalimat tersebut tidak tepat. Yang benar adalah: “Tes itu sudah baik karena sudah valid.” atau “Tes ini baik karena memiliki validitas yang tinggi.”.
Slameto (2001: 216) mengatakan bahwa untuk mengetahui kualitas validitas suatu tes dapat dilakukan dengan dua cara pokok, yaitu:
1)      Dari segi penyusunannya telah dipertimbangkan secara rasional atau logis bahwa tes tersebut akan mengukur apa yang dimaksud akan diukur. Cara ini akan melahirkan validitas isi (content validity). Isi tes tersebut merupakan sample materi dari bahan uji secara keseluruhan dan dapat dikembangkan melalui table kisi-kisi. Bila syarat ini dipenuhi maka tes tersebut dapat juga dikatakan memiliki validitas kurikuler. Menurut Daryanto (2005: 178) validitas yang penting dari tes buatan guru adalah validitas kurikuler (content validity). Untuk mengadakan checking validity kurikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.
Lebih lanjut Daryanto menjelaskan bahwa tes yang tidak mempunyai validitas kurikuler ataupun walaupun mempunyai tetapi kecil, maka dapat juga terjadi jika salah satu atau beberapa tujuan khusus tidak dicantumkan dalam table spesifikasi. Semakin banyak tujuan khusus yang tidak dicantumkan, berarti bahwa validitas kurikulernya semakin kecil.
Dalam hal ini Terry D. Ten Brink dalam bukunya “Edaluation, a Practical Guide for Theacher” (dikutip Daryanto, 2005: 179) mengemukakan pendapatnya demikian:
a)      Untuk tes yang dirancang akan menggunakan norm referenced tidak harus menuliskan setiap tujuan khusus, tetapi cukup dengan tujuan-tujuan yang esensial saja.
b)      Untuk tes yang dirancang akan menggunakan criterion referenced, maka setiap tujuan khusus harus dicantumkan dalam table spesifikasi.
2)      Validitas tes juga dapat dicapai dengan jalan membandingkan hasil pengukuran dari tes-tes yang lain, baik yang berasal dari guru lain atupun dengan tes yang sudah diketahui valid. Cara ini akan menghasilkan suatu tes yang memiliki empirical validity, atau statistical validity. Apabila ukuran perbandingannya diperoleh beberapa waktu berselang, disebut validitas ramalan (prediction validity) dan bila dalam waktu yang bersamaan disebut concurrent validity.
Criterion referenced validity dikatakan dimiliki oleh suatu tes apabila tes tersebut menghasilkan hasil yang mendekati kreteria yang telah ditetapkan sebelumnya. Demikian juga suatu tes memiliki grup referenced validity, bila hasilnya mendekati hasil kelompok dari suatu tes yang telah distandardisasikan.

Secara garis besar menurut Arikunto (2005: 65) ada dua macam validitas, yaitu validitas logis dan validitas empiris. Kedua validitas tersebut dapat dijelaskan sebagai berikut.

A.    Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”, yang berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrument evaluasi menunjuk pada kondisi bagi sebuah instrument yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrument yang bersangkutan sudah dirancang sevara baik, mengikuti teori dan ketentuan yang ada.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu validitas isi (senada dengan pendapat Slameto di atas) dan validitas konstrak (cunstruct validity). Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan konstrak-aspek-aspek kejiwaan- yang seharusnya dievaluasi.

B.     Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalamannya. Validitas empiris tidak bisa diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis tetapi harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yaitu ada dua cara yang dapat dilakukan untuk menguji bahwa sebuah instumen memang valid. Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen yang bersangkutan dengan kreterium atau sebuah ukuran. Kreterium yang digunakan sebagai pembanding kondisi instrumen dimaksud ada dua, yaitu yang sudah tersedia dan belum ada tetapi akan terjadi diwaktu yang akan datang.
Bagi instrumen yang kondisinya sesuai dengan kreterium yang sudah tersedia, disebut memiliki validitas “ada sekarang”, yang dalam istilah bahasa inggris disebut memiliki concurent validity. Selanjutnya instrumen yang kondisinya sesuai dengan kreterium yang diramalkan akan terjadi, disebut memiliki validitas prediksi (predictive validity).
Dari validitas lodis dan validitas empiris tercakup di dalamnya empat validitas, yakni:
(1) validitas isi,
(2) validitas konstrak,
(3) validitas ada sekarang, dan
(4) validitas prediksi.
2.2   Cara Menentukan Validitas Alat Ukur
Seperti apa yang telah kita ketahui, tes dikatakan memiliki validitas jika hasilnya sesuai dengan kreterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kreterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Person.
Rumus korelasi product moment ada dua macam, yaitu:
a.       korelasi product moment dengan simpangan, dan
b.      korelasi product moment dengan angka dasar.
Rumus korelasi product moment dengan simpangan:
di mana:
    =  koefisien korelasi antara variabel X dan Variabel Y, dua variabel yang dikorelasikan (x =dan y = ).
 =  jumlah perkalian x dengan y
     =  kuadrat dari x
     =  kuadrat dari y

Contoh perhitungan:
Misalnya akan menghitung validitas tes prestasi belajar Bahasa Indonesia di kelas 2 SMA. Sebagai kreterium diambil rata-rata ulangan yang dicari validitasnya diberi kode X dan rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai berikut.

TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI BAHASA INDONESIA

No.
Nama
X
Y
x’
y’
xy
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
Tole
Gun
6,5
7
7,5
7
6
6
5,5
6,5
7
6
6,3
8,8
7,2
6,8
7
6,2
5,1
6
6,5
5,9
0
+ 0,5
+ 1,0
+ 0,5
- 0,5
- 0,5
- 0,1
0
+ 0,5
- 0,5
- 0,1
+ 0,4
+ 0,8
+ 0,4
+ 0,6
- 0,2
- 1,3
- 0,4
+ 0,1
- 0,6
0,0
0,25
1,0
0,25
0,25
0,25
1,0
0,0
0,25
0,25
0,01
0,16
0,64
0,16
0,36
0,04
1,69
0,16
0,01
0,36
0,0
+ 0,2
+ 0,8
+ 0,2
- 0,3
+ 0,1
+ 1,3
0,0
+0,05
+ 0,3

Jumlah
65,0
63,8


3,5
3,59
2,65

 = 
  =   dibulatkan 6,4
Dimasukan ke rumus
           
         
         
Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
Rumus korelasi product moment dengan angka kasar:

di mana:
  =  koefisien korelasi antara variabel X dan variabel Y, dua variabel yang dikorelasikan.
Dengan demikian data hasil tes prestasi bahasa Indonesia di atas kini dihitung dengan rumus korelasi product moment  dengan angka kasar yang tabel persiapannya sebagai berikut.

TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI BAHASA INDONESIA

No.
Nama
X
Y
XY
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
Tole
Gun
6,5
7
7,5
7
6
6
5,5
6,5
7
6
6,3
6,8
7,2
6,8
7
6,2
5,1
6
6,5
5,9
42,25
49
56,25
49
36
36
30,25
42,25
49
36
39,69
46,24
51,84
46,24
49
38,44
26,01
45,5
36
34,81
40,95
47,6
45,0
47,6
42
37,2
28,05
39
45,5
35,4

Jumlah
65,0
63,8
426,0
410,52
417,3
Dimasukan ke dalam rumus:
  = 
=
          Jika diperbandingkan dengan validitas soal yang dihitung dengan rumus simpangan, ternyata terdapat perbadaan sebesar 0,003, lebih besar yang dihitung dengan rumus simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan ke atas. Perbedaan ini sangat kecil sehingga dapat diabaikan.

2.3   Validitas Butir Soal dan Validitas Item
Di samping mencari validitas soal perlu juga dicari validitas item. Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal tes misalnya terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui butir-butir tes manakah yang menyebabkan secara keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk keperluan inilah dicari validitas butir soal.
Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor pada total tinggi atau menjadi rendah. Untuk soal-soal objektif skor untuk item biasa deberikan dengan 1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah), sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua item yang membangun soal tersebut.
Contoh perhitungan:

TABEL ANALISIS ITEM UNTUK PERHITUNGAN
 VALIDITAS ITEM

No.
Nama
Butir soal/item
Skor
total
1
2
3
4
5
6
7
8
9
10
1.
2.
3.
4.
5.
6.
7.
8.
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
1
0
0
1
1
1
1
0
0
0
1
1
1
0
1
1
1
1
0
0
1
1
1
0
0
0
0
0
1
0
1
1
1
1
0
1
1
1
1
1
1
0
1
1
1
0
1
1
1
0
0
0
0
1
1
1
1
1
1
0
0
0
0
1
1
1
0
1
0
0
0
1
1
1
1
0
0
0
0
1
8
5
4
5
6
4
7
8

Misalnya akan dihitung validitas nomor 6, maka skor item tersebut disebut variabel X dan skor total disebut variabel Y. Selanjutnya perlu dilakukan dengan menggunakan rumus korelasi product moment, baik dengan rumus simpangan maupun rumus angka dasar.
Penggunaan rumus tersebut masing-masing ada keuntungannya. Menggunakan rumus simpangan angkanya kecil-kecil, tetapi kadang-kadang pecahannya rumit. Jika skor rata-rata (mean-nya) pecahan, simpangannya cendrung banyak pecahan. Mengalikan pecahan persepuluh ditambah dengan tanda-tanda + (plus) dan – (minus) kadang-kadang bisa menyesatkan. Penggunaan rumus angka kasar bilangannya besar-besar tetapi bulat. Jika ada kalkultor statistik disarankan menggunakan rumus angka kasar saja. Yang dibutuhkan hanyalah :  dan tidak perlu membuat tabel seutuhnya.
Contoh perhitungan mencari validitas item
Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel persiapannya sebagai berikut.

No.
Nama
x
Keterangan:
X = skor item nomor 6
Y = skor total
Dari perhitungan kalkulator
diperoleh data sebagai berikut:
∑X =  6            = 6
∑Y =  46          = 288
∑XY =  37
 =  5,57      
 =  6,17      

 
y
1.
2.
3.
4.
5.
6.
7.
8.
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
1
0
1
1
1
0
1
1
8
5
3
5
6
4
7
8

Sesudah dan tinggal memasukan bilangan-bilangan tersebut ke dalam rumus korelasi product moment dengan rumus angka kasar.
Data di atas dimasukkan ke dalam rumus korelasi product moment dengan angka kasar sebagai berikut:
                                
            Koefisien validitas item nomor 6 adalah 0,421. Dilihat secara sepintas bilangan ini memang sesuai dengan kenyataan. Hal ini dapat diketahui dari skor-skor yang tertera baik pada item maupun skor total. Oktaf yang hanya memiliki skor total 3 dapat memperoleh skor 1 pada item, sedangkan Yoyok dan Wendi yang mempunyai skor total sama yaitu 5 skor pada item tidak sama. Validitas item tersebut kurang meyakinkan. Tentu saja validitasnya tidak tinggi.




BAB II
RELIABILITAS

3.1 Pengertian Reliabilitas
Sifat penting berikutnya yang harus dimiliki oleh setiap tes adalah reliabilitas. Menurut Arikunto (2005: 59) kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam bahasa Inggris, berasal dari kata asal reliable yang artinya dapat dipercaya. Seperti halnya istilah validitas dan valid kekacauan dalam penggunaan istilah “reliabilitas” sering dikacaukan dengan istilah “riliabel”. “reliabilitas” merupakan kata benda, sedangkan “reliabel” adalah kata sifat atau kata keadaan.
Sebuah tes yang reliabel adalah ajeg atau konsisten, yaitu apabila tes itu diulang, maka skor siswa secara kasar adalah relatif sama dengan hasil yang mereka peroleh pada saat pertama mereka menempuh tes tersebut (Chabib Thoha, 2003: 118 dan Slameto 2001: 20). Pendapat tersebut senada dengan Nurkancana (1982: 126) yang mengatakan bahwa tes yang reliabel adalah tes yang menunjukan hasil yang mantap.
Ada berbagai faktor yang dapat mempengaruhi reliabilitas sebuah tes. Ebel sebagaimana dikutip oleh Fraenkel (dalam halaman web) mengemukakan beberapa faktor yang dapat mempengaruhi tingkat reliabilitas sebuah tes. Pertama, jika soal terlalu sukar, terlalu mudah atau tidak jelas, maka akan menghasilkan skor yang tidak reliabel. Kedua, jika siswa yang menempuh tes tersebut amat beragam karakteristiknya. Ketiga, jika seseorang yang memberi skor pada tes tersebut tidak menggunakan standar yang sama, maka semua hasil pekerjaan atau skornya pun tidak reliabel. Tes juga harus memberi banyak contoh perilaku yang akan kita nilai.
  Terdapat hubungan yang erat antara validitas dan reliabilitas sebuah tes. Sebuah tes yang valid sudah pasti reliabel namun tidak demikian sebaliknya. Itu berarti sebuah tes yang mengukur apa yang seharusnya diukur maka tes tersebut akan mengukur secara reliabel. Menurut Arikunto (2005: 60), jika kita hubungkan antara validitas dan reliabilitas maka akan tampak seperti berikut.

-          Validitas adalah ketepatan.
-          Reliabilitas adalah ketetapan.

3.2 Arti Reliabilitas Bagi Sebuah Tes
Sudah kita ketahui bahwa reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Konsep reliabilitas ini tidak akan sulit dimengerti apabila kita telah memahami konsep validitas. Tuntunan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya data yang palid sesuai dengan kenyataan.
Arti reliabilitas bagi sebuah tes sangat banyak, namun setidaknya kita dapat mengelompokannya menjadi tiga garis besar, yaitu:
  1. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soal.
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa soal. Tinggi rendahnya validitas menunjukan tinggi rendahnya reliabilitas tes. Dengan demikian maka semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam menghitung besarnya reliabilitas berhubungan dengan penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman dan Brown sehingga dikenal dengan rumus Spearman-Brown.
Rumus:   
di mana:
 =  besarnya koefisien reliabilitas tes tersebut ditambahkan butir soal baru.
n      =    berapa kali butir-butir soal itu ditambahkan
r       = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambahkan
  1. Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarkan besar kecilnya reliabilitas. Tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukan reliabilitas yang lebih besar daripada yang dicobakan kepada kelompok tertentu yang diambil secara dipilih.
  1. Hal yang berhungan dengan penyelenggaraan tes
Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat administratif, sangat menentukan hasil tes.

3.3 Cara-Cara Mencari Besarnya Reliabilitas
Ada berbagai cara mencari reliabilitas, diantaranya adalah sebagai berikut.
  1. Metode bentuk paralel
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam menggunakan metode tes paralel ini, pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama.
Keunggulan:
Penggunaan metode ini baik karena siswa dihadapkan pada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan:
Pengetes pekerjaannya berat karena harus menyusu dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
  1. Metode tes ulang
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua kali. Metode ini juga disebut single-test-double-trial method. Kemudian hasil dari kedua tes itu dihitung korelasinya.
Pada umumya hasil tes yang kedua lebih baik daripada hasil tes pertama. Hal ini disebabkan adanya practice-effect dan carry-over effect.
  1. Metode belah dua atau split-half method
Kelemahan penggunaan metode dua-tes dua kali percobaan dansatu-tes dua kali percobaandiatasi dengan metode ketiga ini, yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-trial method.
Berbeda dengan metode pertama dan metode kedua yang setelah ditemukan koefisien korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown sebagai berikut.
Rumus:  
di mana:
    =  korelasi antara skor-skor setiap belahan tes.
       =  korelasi reliabilitas yang sudah disesuaikan.
Contoh:
Korelasi antara belahan tes = 0,60
Maka reliabilitas tes =   =   =  0,75
Cara-cara untuk mencari reliabilitas dapat dilakukan dengan menggunakan metode atau rumus-rumus lain seperti pembelahan ganjil-genap, pembelahan awal-akhir, penggunaan rumus Flanangan, penggunaan rumus Rulon, romus K-R. 20, rumus K-R. 21, dan rumus Alpha.







BAB III
DAYA BEDA

4.1 Pengertian Daya Beda Suatu Tes
Arikunto (2005: 211) dan Daryanto (2005: 183) mempunyai pendapat yang sama mengenai daya beda itu. Menurut mereka daya beda soal, adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah).
Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi, disingkat D (d besar). Seperti halnya indeks kesukaran, indeks diskriminasi ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi, seperti yang sudah dijelaskan di atas, mengenal tanda negatif. Tanda negatif pada indeks diskriminasi digunakan jika suatu soal “terbalik” menunjukan kualitas testee. Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.
Dengan demikian ada tiga titik pada daya pembeda yaitu:
- 1,00                                    0,00                                      1,00
  daya pembeda                    daya pembeda                      daya pembeda
  negatif                                rendah                                        tinggi (positif)

Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun bodoh, maka soal itu tidak baik karena tidak mempunyai daya pembeda. Demikian pula jika semua siswa baik pandai maupun bodoh tidak dapat menjawab dengan benar. Soal tersebut tidak baik juga karena tidak mempunyai daya pembeda. Soal yang baik adalah soal yang dijawab benar oleh siswa-siswa yang pandai saja.
Seluruh pengikut kelompok tes dikelompokan menjadi dua kelompok, yaitu kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab semua soal tersebut dengan benar, sedang seluruh kelompok bawah mwnjawab salah, maka soal tersebut mempunyai D paling besar, yaitiu 1,00. sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah mwnjawab benar, maka nilai D-nya – 1,00. tetapi jika siswa kwlompok atas dan bawah sama-sama menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai D 0,00. karena tidak mempunyai daya beda sama sekali.

4.2 Cara Menentukan Daya Pembeda.
Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100 orang ke atas).
  1. Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah.
Siswa
A
B
C
D
E
Skor
9
8
7
7
6
 F
G
H
I
J
5
5
4
4
3

 
 

Contoh:
kelompok atas (JA)
 
kelompok atas (JB)
 
 








Seluruh pengikut tes, dideretkan mulai dari sekor teratas sampai terbawah, lalu dibagi 2.
  1. Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas sebagai kelompok atas (JA) dan 27% skor terbawah sebagai kelompok bawah (JB).
J
A   =  Jumlah kelompok atas
            JB   =  Jumlah kelompok bawah
           


Contoh:
9
9
8
27% sebagai JA
 
8
8

.
.
.
-
.
.
.
-
.
.
.
27% sebagai JB
 
2
1
1
1
0

Rumus mencari D
Text Box:  Rumus untuk menentukan indeks diskriminasi adalah:



di mana:
J    =   jumlah peserta tes
JA    =   banyaknya peserta kelompok atas
JB   =   banyaknya peserta kelompok bawah
BA  =  banyaknya peserta kelompok atas yang menjawab pertanyaan itu dengan benar
BB  =   banyaknya peserta kelompok bawah yang menjawab pertanyaan itu dengan benar
proporsi peserta kelompok atas yang menjawab benar (ingat, P sebagai indeks kesukaran)
proporsi peserta kelompok bawah yang menjawab benar
BAB IV
PRAKTIKABILITAS

            Arikunto (2005: 62) berpendapat bahwa sebuah tes yang praktikabilitas (practicability) yang tinggi apabila tes tersebut bersifat praktis, mudah pengadministrasikannya. Tes yang praktis adalah tes yang:
1.          Mudah dilaksanakan
misalkan tidak menuntut peralatan yang banyak dan memberi kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah oleh siswa.
2.          Mudah pemeriksaannya
Mudah pemeriksaannya artinya bahwa tes itu dilengkapi dengan kunci jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif, pemeriksaannya akan lebih mudah dilakukan jika dikerjakan oleh siswa dalam lembar jawaban.
3.          Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan / diawali oleh orang lain.

Tes juga dikatakan praktis apabiala ditinjau dari segi pembiayaan maupun segi pelaksanaannya efesien dan mudak dilaksanakannya (Slameto, 2001: 21). Ini nampaknya sependapat dengan apa yang disebut tes itu ekonomis oleh Arikunto (2005: 63). Yang dimaksud dengan ekonomis di sini ialah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga yang banyak dan waktu yang lama.
Thorndike, R.L dan Hagen, H.P. (dalam Mudjijo, 1995: 60) mengatakan bahwa untuk dapat mempertimbangan kepraktisan suatu tes, kiranya kita dapat menilai dari hal-hal berikut:
  1. Administrasi atau pelaksanaan tes
yang mnyangkut bagaimana dan oleh siapa tes itu dapat dilaksanakan, apakah petunjuk yang ada sudah jelas, apakah ada pembatasan waktu untuk setiap atau sekelompok soal, dan lain sebagainya.

  1. Lamanya waktu tes
Waktu tes jangan terlalu sedikit atau jangan terlalu lama. Semuanya harus disesuaikan dengan jumlah dn tingkat kesulitan soal.
  1. Pengelolaan, Penafsiran, dan Penggunaan Hasil
Faktor yang tidak kalah pentingnya adalah bagaimana hasil tes itu diolah, ditafsirkan serta apa manfaat bagi pelaksanaan pendidikan (seperti antara tujuan seleksi, diagnostik, penempatan, atau perbaikan PBM yang telah dilakukan).
  1. Pemeriksaan Hasil Tes
Sebelum hasil tes itu diolah dan ditafsirkan lebih lanjut diperlukan pemeriksaan dan pemberian skor terlebih dahulu. Bagaimana kunci jawaban itu digunakan untuk memeriksa pekerjaan siswa.

DAFTAR PUSTAKA


Arikunto, Suharsimi. 2005. Dasar-Dasar Evaluasi Pendidikan. Jakarta: PT Bumi Aksara. 
Daryanto. 2005. Evaluasi Pendidikan. Jakarta: PT Rineka Cipta.
Mudjijo. 1995. Tes Hasil Belajar. Jakarta: Bumi Aksara.
Nurkancana, Wayan dkk. 1982. Evaluasi Pendidikan. Surabaya: Usaha Nasional. 
Slameto. 2001. Evaluasi Pendidikan. Jakarta: PT Bumi Aksara.
Thoha, Chabib. 2003. Teknik Evaluasi Pendidikan. Jakarta: PT Rajar Lindo Persada.
http://www.ialf.edu/kipbipa/papers/Maryanto.doc Diakses Rabu, 19 November 2008.

Tidak ada komentar:

Posting Komentar