PENDAHULUAN
Dalam sebuah evaluasi alat yang digunakan digolongkan menjadi dua macam yaitu tes dan non tes. Istilah tes diambil dari kata testum suatu pengertian dalam bahasa Prancis kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada pula yang mengartikannya sebagai piring yang dibuat dari tanah (Suharsimi Arikunto, 2005: 52). Muchtar Bukhari dalam bukunya “ Teknik-teknik Evaluasi “ (dalam halaman web) mengatakan bahwa tes adalah suatu percobaan yang diadakan untuk mengetahui ada tidaknya hasil-hasil pelajaran tertentu pada seseorang murid atau kelompok murid.
Didorong oleh munculnya statistik
dalam penganalisisan data dan informasi, maka akhirnya tes digunakan dalam
berbagai bidang seperti tes kemanpuan dasar, tes kelelahan perhatian, tes
ingatan, tes minat, tes sikap, dan sebagainya. Yang terkenal penggunaannya di
sekolah hanyalah tes prestasi belajar.
Di Indonesia, sebelum ada Ejaan Yang
Disempurnakan dalam bahasa Indonesia ditulis dengan test. Tes adalah
alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam
suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Untuk mengerjakan
tes ini tergantung dari petunjuk yang diberikan. Misalnya: melingkari huruf di
depan pilihan jawaban, menerangkan, mencoret jawaban yang salah, melakukan
tugas atau suruhan, menjawab secara lisan, dan sebagainya.
Seperti yang telah kita ketahui
bahwa tes itu mempunyai dua bentuk, yaitu bentuk obyektif ( multiple choice)
dan bentuk subyektif (uraian). Baik tes objektif maupun tes uraian haruslah
memiliki syarat dan ciri-ciri tertentu agar tes itu dapat digunakan dan disebut
sebagai tes yang baik. Tes yang baik memiliki ciri-ciri seperti memiliki
validitas, reliabelitas, memiliki daya beda, dan praktis. Dalam buku Arikunto,
“Dasar-Dasar Evaluasi Pendidikan” kita akan melihat ciri lain dari tes
yang baik, yaitu bersifat ekonomis (2005: 63). Begitu pula dalam buku, “Evaluasi
Pendidikan”.
Dalam bab-bab selanjutnya akan diuraikan satu persatu ciri
tes yang baik, yaitu validitas, reliabelitas, daya beda, dan praktis.
BAB I
VALIDITAS
2.1 Pengertian Validitas dan
Macam-Macam Validitas
Sebuah tes haruslah memiliki validitas.
Ini adalah karakteristik sebuah tes yang sangat penting. Sebuah tes dikatakan valid
jika ia mengukur apa yang seharusnya diukur (Nurkancana dkk, 1982: 122. Mudjijo,
1995: 40. Chabib Thoha, 2003: 109). Jadi, validitas (ketepatan) di sini
berarti menilai apa yang seharusnya dinilai dengan menggunakan alat penilaian yang
benar-benar sesuai. Seandainya kita ingin mengukur perubahan perilaku
siswa misalnya, kita memerlukan alat penilaian yang dapat memberi indikasi
bahwa telah terjadi perubahan pada tingkat tertentu seperti yang kita harapkan.
Sebuah tes prestasi belajar diharapkan
benar-benar dapat mengukur jenis perubahan yang sudah ditetapkan dalam tujuan
pengajaran. Tes juga diharapkan “comprehensiveness”, di mana semua kategori
tujuan harus dinilai untuk menetapkan sampai sejauh mana tujuan-tujuan tersebut
telah tercapai. Bukan hanya pengetahuan saja, tetapi juga pengembangan
berpikir, sikap, perasaan, nilai-nilai dan ketrampilan untuk dinilai.
Menurut Arikunto (2005: 58)
sebelum mulai dengan penjelasan mengenai validitas, perlu kiranya dipahami
terlebih dahulu perbedaan arti istilah “validitas” dengan “valid”. Validitas
merupakan sebuah kata benda dan valid merupakan kata sifat. Dari pengalaman
sehari-hari tidak sedikit siswa dan guru mengatakan: “Tes ini baik karena sudah
validitas.” Jelas kalimat tersebut tidak tepat. Yang benar adalah: “Tes itu
sudah baik karena sudah valid.” atau “Tes ini baik karena memiliki validitas
yang tinggi.”.
Slameto
(2001: 216) mengatakan bahwa untuk mengetahui kualitas validitas suatu tes
dapat dilakukan dengan dua cara pokok, yaitu:
1)
Dari segi penyusunannya telah
dipertimbangkan secara rasional atau logis bahwa tes tersebut akan mengukur apa
yang dimaksud akan diukur. Cara ini akan melahirkan validitas isi
(content validity). Isi tes tersebut merupakan sample materi dari bahan
uji secara keseluruhan dan dapat dikembangkan melalui table kisi-kisi. Bila
syarat ini dipenuhi maka tes tersebut dapat juga dikatakan memiliki validitas
kurikuler. Menurut Daryanto (2005: 178) validitas yang penting dari tes
buatan guru adalah validitas kurikuler (content validity).
Untuk mengadakan checking validity kurikuler, kita harus merumuskan
tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal
dapat kita jodohkan dengan setiap tujuan khusus tersebut.
Lebih lanjut Daryanto menjelaskan bahwa tes yang
tidak mempunyai validitas kurikuler ataupun walaupun mempunyai tetapi kecil,
maka dapat juga terjadi jika salah satu atau beberapa tujuan khusus tidak
dicantumkan dalam table spesifikasi. Semakin banyak tujuan khusus yang tidak
dicantumkan, berarti bahwa validitas kurikulernya semakin kecil.
Dalam hal ini Terry D. Ten Brink dalam bukunya “Edaluation,
a Practical Guide for Theacher” (dikutip Daryanto, 2005: 179)
mengemukakan pendapatnya demikian:
a)
Untuk tes yang dirancang akan
menggunakan norm referenced tidak harus menuliskan setiap tujuan khusus,
tetapi cukup dengan tujuan-tujuan yang esensial saja.
b)
Untuk tes yang dirancang akan
menggunakan criterion referenced, maka setiap tujuan khusus harus
dicantumkan dalam table spesifikasi.
2)
Validitas tes juga dapat dicapai
dengan jalan membandingkan hasil pengukuran dari tes-tes yang lain, baik yang
berasal dari guru lain atupun dengan tes yang sudah diketahui valid. Cara ini
akan menghasilkan suatu tes yang memiliki empirical validity,
atau statistical validity. Apabila ukuran perbandingannya
diperoleh beberapa waktu berselang, disebut validitas ramalan (prediction
validity) dan bila dalam waktu yang bersamaan disebut concurrent
validity.
Criterion referenced validity
dikatakan dimiliki oleh suatu tes apabila tes tersebut menghasilkan hasil yang
mendekati kreteria yang telah ditetapkan sebelumnya. Demikian juga suatu tes
memiliki grup referenced validity, bila hasilnya mendekati hasil
kelompok dari suatu tes yang telah distandardisasikan.
Secara garis besar menurut Arikunto (2005:
65) ada dua macam validitas, yaitu validitas logis dan validitas empiris. Kedua
validitas tersebut dapat dijelaskan sebagai berikut.
A.
Validitas Logis
Istilah “validitas logis” mengandung
kata “logis” berasal dari kata “logika”, yang berarti penalaran. Dengan makna
demikian maka validitas logis untuk sebuah instrument evaluasi menunjuk pada
kondisi bagi sebuah instrument yang memenuhi persyaratan valid berdasarkan
hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrument
yang bersangkutan sudah dirancang sevara baik, mengikuti teori dan ketentuan
yang ada.
Ada dua macam validitas logis yang dapat
dicapai oleh sebuah instrumen, yaitu validitas isi (senada dengan
pendapat Slameto di atas) dan validitas konstrak (cunstruct
validity). Validitas isi bagi sebuah instrumen menunjuk suatu kondisi
sebuah instumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah
instrumen yang disusun berdasarkan konstrak-aspek-aspek kejiwaan- yang
seharusnya dievaluasi.
B.
Validitas Empiris
Istilah “validitas empiris” memuat kata
“empiris” yang artinya “pengalaman”. Sebuah instrumen dapat dikatakan memiliki
validitas empiris apabila sudah diuji dari pengalamannya. Validitas empiris
tidak bisa diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan
seperti halnya validitas logis tetapi harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yaitu ada
dua cara yang dapat dilakukan untuk menguji bahwa sebuah instumen memang valid.
Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen yang
bersangkutan dengan kreterium atau sebuah ukuran. Kreterium yang digunakan
sebagai pembanding kondisi instrumen dimaksud ada dua, yaitu yang sudah
tersedia dan belum ada tetapi akan terjadi diwaktu yang akan datang.
Bagi instrumen yang kondisinya sesuai dengan
kreterium yang sudah tersedia, disebut memiliki validitas “ada sekarang”,
yang dalam istilah bahasa inggris disebut memiliki concurent validity.
Selanjutnya instrumen yang kondisinya sesuai dengan kreterium yang diramalkan
akan terjadi, disebut memiliki validitas prediksi (predictive
validity).
Dari validitas lodis dan validitas
empiris tercakup di dalamnya empat validitas, yakni:
(1) validitas isi,
(2) validitas konstrak,
(3) validitas ada sekarang, dan
(4) validitas prediksi.
2.2
Cara Menentukan Validitas Alat Ukur
Seperti apa yang telah kita ketahui, tes
dikatakan memiliki validitas jika hasilnya sesuai dengan kreterium, dalam arti
memiliki kesejajaran antara hasil tes tersebut dengan kreterium. Teknik yang
digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment
yang dikemukakan oleh Person.
Rumus korelasi product moment ada
dua macam, yaitu:
a.
korelasi product moment dengan
simpangan, dan
b.
korelasi product moment
dengan angka dasar.
Rumus korelasi product moment dengan simpangan:
di mana:
= koefisien korelasi antara variabel X dan
Variabel Y, dua variabel yang dikorelasikan (x =dan y = ).
= jumlah perkalian x dengan y
= kuadrat dari x
= kuadrat dari y
Contoh perhitungan:
Misalnya akan menghitung validitas tes
prestasi belajar Bahasa Indonesia di kelas 2 SMA. Sebagai kreterium diambil
rata-rata ulangan yang dicari validitasnya diberi kode X dan rata-rata nilai
harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai berikut.
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI BAHASA INDONESIA
No.
|
Nama
|
X
|
Y
|
x’
|
y’
|
|
|
xy
|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
|
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
Tole
Gun
|
6,5
7
7,5
7
6
6
5,5
6,5
7
6
|
6,3
8,8
7,2
6,8
7
6,2
5,1
6
6,5
5,9
|
0
+ 0,5
+ 1,0
+ 0,5
- 0,5
- 0,5
- 0,1
0
+ 0,5
- 0,5
|
- 0,1
+ 0,4
+ 0,8
+ 0,4
+ 0,6
- 0,2
- 1,3
- 0,4
+ 0,1
- 0,6
|
0,0
0,25
1,0
0,25
0,25
0,25
1,0
0,0
0,25
0,25
|
0,01
0,16
0,64
0,16
0,36
0,04
1,69
0,16
0,01
0,36
|
0,0
+ 0,2
+ 0,8
+ 0,2
- 0,3
+ 0,1
+ 1,3
0,0
+0,05
+ 0,3
|
|
Jumlah
|
65,0
|
63,8
|
|
|
3,5
|
3,59
|
2,65
|
=
= dibulatkan 6,4
Dimasukan
ke rumus
Indeks
korelasi antara X dan Y inilah indeks validitas soal yang dicari.
Rumus
korelasi product moment dengan angka kasar:
di
mana:
= koefisien korelasi antara variabel X dan
variabel Y, dua variabel yang dikorelasikan.
Dengan
demikian data hasil tes prestasi bahasa Indonesia di atas kini dihitung dengan
rumus korelasi product moment
dengan angka kasar yang tabel persiapannya sebagai berikut.
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI BAHASA INDONESIA
No.
|
Nama
|
X
|
Y
|
|
|
XY
|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
|
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
Tole
Gun
|
6,5
7
7,5
7
6
6
5,5
6,5
7
6
|
6,3
6,8
7,2
6,8
7
6,2
5,1
6
6,5
5,9
|
42,25
49
56,25
49
36
36
30,25
42,25
49
36
|
39,69
46,24
51,84
46,24
49
38,44
26,01
45,5
36
34,81
|
40,95
47,6
45,0
47,6
42
37,2
28,05
39
45,5
35,4
|
|
Jumlah
|
65,0
|
63,8
|
426,0
|
410,52
|
417,3
|
Dimasukan ke dalam rumus:
=
=
Jika diperbandingkan
dengan validitas soal yang dihitung dengan rumus simpangan, ternyata
terdapat perbadaan sebesar 0,003, lebih besar yang dihitung dengan rumus
simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan
jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan ke atas.
Perbedaan ini sangat kecil sehingga dapat diabaikan.
2.3
Validitas Butir Soal dan Validitas Item
Di samping mencari validitas soal perlu
juga dicari validitas item. Jika seorang peneliti atau seorang guru mengetahui
bahwa validitas soal tes misalnya terlalu rendah atau rendah saja, maka
selanjutnya ingin mengetahui butir-butir tes manakah yang menyebabkan secara
keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk keperluan
inilah dicari validitas butir soal.
Pengertian umum untuk validitas item adalah
demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar
terhadap skor total. Skor pada item menyebabkan skor pada total tinggi atau
menjadi rendah. Untuk soal-soal objektif skor untuk item biasa deberikan dengan
1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah),
sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua item
yang membangun soal tersebut.
Contoh perhitungan:
TABEL ANALISIS ITEM UNTUK PERHITUNGAN
VALIDITAS ITEM
No.
|
Nama
|
Butir soal/item
|
Skor
total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
1.
2.
3.
4.
5.
6.
7.
8.
|
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
|
1
0
0
1
1
1
1
0
|
0
0
1
1
1
0
1
1
|
1
1
0
0
1
1
1
0
|
0
0
0
0
1
0
1
1
|
1
1
0
1
1
1
1
1
|
1
0
1
1
1
0
1
1
|
1
0
0
0
0
1
1
1
|
1
1
1
0
0
0
0
1
|
1
1
0
1
0
0
0
1
|
1
1
1
0
0
0
0
1
|
8
5
4
5
6
4
7
8
|
Misalnya akan dihitung validitas nomor
6, maka skor item tersebut disebut variabel X dan skor total disebut variabel
Y. Selanjutnya perlu dilakukan dengan menggunakan rumus korelasi product
moment, baik dengan rumus simpangan maupun rumus angka dasar.
Penggunaan rumus tersebut masing-masing
ada keuntungannya. Menggunakan rumus simpangan angkanya kecil-kecil, tetapi
kadang-kadang pecahannya rumit. Jika skor rata-rata (mean-nya) pecahan,
simpangannya cendrung banyak pecahan. Mengalikan pecahan persepuluh ditambah
dengan tanda-tanda + (plus) dan – (minus) kadang-kadang bisa menyesatkan.
Penggunaan rumus angka kasar bilangannya besar-besar tetapi bulat. Jika ada
kalkultor statistik disarankan menggunakan rumus angka kasar saja. Yang
dibutuhkan hanyalah : dan tidak perlu membuat tabel seutuhnya.
Contoh perhitungan mencari validitas item
Untuk menghitung validitas item nomor 6,
dibuat terlebih dahulu tabel persiapannya sebagai berikut.
No.
|
Nama
|
x
|
|
||
1.
2.
3.
4.
5.
6.
7.
8.
|
Era
Dewik
Mas
Suci
Candri
Wawan
Adi
Balang
|
1
0
1
1
1
0
1
1
|
8
5
3
5
6
4
7
8
|
Sesudah
dan tinggal memasukan bilangan-bilangan tersebut ke dalam rumus
korelasi product moment dengan rumus angka kasar.
Data
di atas dimasukkan ke dalam rumus korelasi product moment dengan angka
kasar sebagai berikut:
Koefisien validitas item nomor 6
adalah 0,421. Dilihat secara sepintas bilangan ini memang sesuai dengan
kenyataan. Hal ini dapat diketahui dari skor-skor yang tertera baik pada item
maupun skor total. Oktaf yang hanya memiliki skor total 3 dapat memperoleh skor
1 pada item, sedangkan Yoyok dan Wendi yang mempunyai skor total sama yaitu 5
skor pada item tidak sama. Validitas item tersebut kurang meyakinkan. Tentu saja
validitasnya tidak tinggi.
BAB II
RELIABILITAS
3.1 Pengertian Reliabilitas
Sifat penting berikutnya yang harus
dimiliki oleh setiap tes adalah reliabilitas. Menurut Arikunto (2005:
59) kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam
bahasa Inggris, berasal dari kata asal reliable yang artinya dapat
dipercaya. Seperti halnya istilah validitas dan valid kekacauan dalam
penggunaan istilah “reliabilitas” sering dikacaukan dengan istilah “riliabel”.
“reliabilitas” merupakan kata benda, sedangkan “reliabel” adalah kata sifat
atau kata keadaan.
Sebuah tes yang reliabel adalah ajeg
atau konsisten, yaitu apabila tes itu diulang, maka skor siswa secara kasar
adalah relatif sama dengan hasil yang mereka peroleh pada saat pertama mereka
menempuh tes tersebut (Chabib Thoha, 2003: 118 dan Slameto 2001:
20). Pendapat tersebut senada dengan Nurkancana (1982: 126) yang mengatakan
bahwa tes yang reliabel adalah tes yang menunjukan hasil yang mantap.
Ada berbagai faktor yang dapat mempengaruhi
reliabilitas sebuah tes. Ebel sebagaimana dikutip oleh Fraenkel (dalam
halaman web) mengemukakan beberapa faktor yang dapat mempengaruhi tingkat
reliabilitas sebuah tes. Pertama, jika soal terlalu sukar, terlalu mudah atau
tidak jelas, maka akan menghasilkan skor yang tidak reliabel. Kedua, jika siswa
yang menempuh tes tersebut amat beragam karakteristiknya. Ketiga, jika
seseorang yang memberi skor pada tes tersebut tidak menggunakan standar yang
sama, maka semua hasil pekerjaan atau skornya pun tidak reliabel. Tes juga
harus memberi banyak contoh perilaku yang akan kita nilai.
Terdapat hubungan yang erat
antara validitas dan reliabilitas sebuah tes. Sebuah tes yang valid sudah pasti
reliabel namun tidak demikian sebaliknya. Itu berarti sebuah tes yang mengukur
apa yang seharusnya diukur maka tes tersebut akan mengukur secara reliabel.
Menurut Arikunto (2005: 60), jika kita hubungkan antara validitas dan
reliabilitas maka akan tampak seperti berikut.
-
Validitas adalah ketepatan.
-
Reliabilitas adalah ketetapan.
3.2 Arti Reliabilitas Bagi Sebuah Tes
Sudah kita ketahui bahwa reliabilitas
berhubungan dengan masalah kepercayaan. Suatu tes dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.
Konsep reliabilitas ini tidak akan sulit dimengerti apabila kita telah memahami
konsep validitas. Tuntunan bahwa instrumen evaluasi harus valid menyangkut
harapan diperolehnya data yang palid sesuai dengan kenyataan.
Arti reliabilitas bagi sebuah tes sangat
banyak, namun setidaknya kita dapat mengelompokannya menjadi tiga garis besar,
yaitu:
- Hal yang berhubungan dengan tes
itu sendiri, yaitu panjang tes dan kualitas butir-butir soal.
Tes yang terdiri dari banyak butir, tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa soal. Tinggi rendahnya
validitas menunjukan tinggi rendahnya reliabilitas tes. Dengan demikian maka
semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam menghitung
besarnya reliabilitas berhubungan dengan penambahan banyaknya butir soal dalam
tes ini ada sebuah rumus yang diberikan oleh Spearman dan Brown sehingga
dikenal dengan rumus Spearman-Brown.
Rumus:
di mana:
= besarnya koefisien reliabilitas tes tersebut
ditambahkan butir soal baru.
n
= berapa kali butir-butir soal
itu ditambahkan
r =
besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambahkan
- Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari
banyak siswa akan mencerminkan keragaman hasil yang menggambarkan besar
kecilnya reliabilitas. Tes yang dicobakan kepada bukan kelompok terpilih, akan
menunjukan reliabilitas yang lebih besar daripada yang dicobakan kepada
kelompok tertentu yang diambil secara dipilih.
- Hal yang berhungan dengan penyelenggaraan tes
Sudah disebutkan bahwa faktor penyelenggaraan tes yang
bersifat administratif, sangat menentukan hasil tes.
3.3 Cara-Cara Mencari Besarnya Reliabilitas
Ada berbagai cara mencari reliabilitas, diantaranya adalah
sebagai berikut.
- Metode bentuk paralel
Tes paralel atau tes ekuivalen adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir
soalnya berbeda. Dalam menggunakan metode tes paralel ini, pengetes harus
menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang
sama.
Keunggulan:
Penggunaan metode ini baik karena siswa dihadapkan pada dua
macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi
disebut adanya practice-effect dan carry-over effect, artinya ada
faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan:
Pengetes pekerjaannya berat karena harus menyusu dua seri
tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
- Metode tes ulang
Metode tes ulang dilakukan orang untuk menghindari
penyusunan dua seri tes. Dalam metode ini pengetes hanya memiliki satu seri tes
tetapi dicobakan dua kali. Metode ini juga disebut single-test-double-trial
method. Kemudian hasil dari kedua tes itu dihitung korelasinya.
Pada umumya hasil tes yang kedua lebih baik daripada hasil
tes pertama. Hal ini disebabkan adanya practice-effect dan carry-over
effect.
- Metode belah dua atau split-half
method
Kelemahan penggunaan metode dua-tes dua kali percobaan
dansatu-tes dua kali percobaandiatasi dengan metode ketiga ini, yaitu metode
belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes
dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-trial
method.
Berbeda dengan metode pertama dan metode kedua yang setelah
ditemukan koefisien korelasi langsung ditafsirkan itulah koefisien
reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu
membelah dua dan mengkorelasikan dua belahan, baru diketahui separo tes. Untuk
mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown sebagai
berikut.
Rumus:
di mana:
= korelasi antara skor-skor setiap belahan tes.
= korelasi reliabilitas yang sudah disesuaikan.
Contoh:
Korelasi antara belahan tes = 0,60
Maka reliabilitas tes =
= = 0,75
Cara-cara untuk mencari reliabilitas dapat dilakukan dengan
menggunakan metode atau rumus-rumus lain seperti pembelahan ganjil-genap,
pembelahan awal-akhir, penggunaan rumus Flanangan, penggunaan rumus Rulon,
romus K-R. 20, rumus K-R. 21, dan rumus Alpha.
BAB III
DAYA BEDA
4.1 Pengertian Daya Beda Suatu Tes
Arikunto (2005:
211) dan Daryanto (2005: 183) mempunyai pendapat yang sama
mengenai daya beda itu. Menurut mereka daya beda soal, adalah kemampuan suatu
soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan
siswa yang bodoh (berkemampuan rendah).
Angka yang menunjukan besarnya daya
pembeda disebut indeks diskriminasi, disingkat D (d besar). Seperti halnya
indeks kesukaran, indeks diskriminasi ini berkisar antara 0,00 sampai 1,00.
Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada
indeks diskriminasi, seperti yang sudah dijelaskan di atas, mengenal tanda
negatif. Tanda negatif pada indeks diskriminasi digunakan jika suatu soal
“terbalik” menunjukan kualitas testee. Yaitu anak pandai disebut bodoh dan anak
bodoh disebut pandai.
Dengan demikian ada tiga titik pada daya pembeda yaitu:
- 1,00 0,00 1,00
daya pembeda daya pembeda daya pembeda
negatif
rendah tinggi (positif)
Bagi suatu soal yang dapat dijawab benar
oleh siswa pandai maupun bodoh, maka soal itu tidak baik karena tidak mempunyai
daya pembeda. Demikian pula jika semua siswa baik pandai maupun bodoh tidak
dapat menjawab dengan benar. Soal tersebut tidak baik juga karena tidak
mempunyai daya pembeda. Soal yang baik adalah soal yang dijawab benar oleh
siswa-siswa yang pandai saja.
Seluruh pengikut kelompok tes
dikelompokan menjadi dua kelompok, yaitu kelompok pandai atau kelompok atas (upper
group) dan kelompok bodoh atau kelompok bawah (lower group).
Jika seluruh kelompok atas dapat
menjawab semua soal tersebut dengan benar, sedang seluruh kelompok bawah
mwnjawab salah, maka soal tersebut mempunyai D paling besar, yaitiu 1,00.
sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah
mwnjawab benar, maka nilai D-nya – 1,00. tetapi jika siswa kwlompok atas dan
bawah sama-sama menjawab benar atau sama-sama menjawab salah, maka soal
tersebut mempunyai nilai D 0,00. karena tidak mempunyai daya beda sama sekali.
4.2 Cara Menentukan Daya Pembeda.
Untuk ini perlu dibedakan antara
kelompok kecil (kurang dari 100) dan kelompok besar (100 orang ke atas).
- Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar, 50% kelompok
atas dan 50% kelompok bawah.
|
Contoh:
|
||||
|
||||
Seluruh pengikut tes, dideretkan mulai dari sekor teratas
sampai terbawah, lalu dibagi 2.
- Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk
kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor
teratas sebagai kelompok atas (JA) dan 27% skor terbawah sebagai
kelompok bawah (JB).
JA = Jumlah kelompok atas
JA = Jumlah kelompok atas
JB = Jumlah kelompok bawah
Contoh:
9
9
8
|
8
.
.
.
-
.
.
.
-
.
.
.
|
1
1
1
0
Rumus mencari D
Rumus
untuk menentukan indeks diskriminasi adalah:
di mana:
J
= jumlah peserta tes
JA = banyaknya peserta kelompok atas
JB =
banyaknya peserta kelompok bawah
BA
= banyaknya peserta kelompok atas
yang menjawab pertanyaan itu dengan benar
BB
= banyaknya peserta kelompok bawah
yang menjawab pertanyaan itu dengan benar
proporsi peserta kelompok atas yang menjawab benar (ingat, P
sebagai indeks kesukaran)
proporsi peserta kelompok bawah yang menjawab benar
BAB
IV
PRAKTIKABILITAS
Arikunto (2005: 62)
berpendapat bahwa sebuah tes yang praktikabilitas (practicability) yang
tinggi apabila tes tersebut bersifat praktis, mudah pengadministrasikannya. Tes
yang praktis adalah tes yang:
1.
Mudah dilaksanakan
misalkan tidak menuntut peralatan yang banyak dan memberi
kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap
mudah oleh siswa.
2.
Mudah pemeriksaannya
Mudah pemeriksaannya artinya bahwa tes itu dilengkapi
dengan kunci jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif,
pemeriksaannya akan lebih mudah dilakukan jika dikerjakan oleh siswa dalam
lembar jawaban.
3.
Dilengkapi dengan
petunjuk-petunjuk yang jelas sehingga dapat diberikan / diawali oleh orang
lain.
Tes juga dikatakan praktis apabiala ditinjau dari segi
pembiayaan maupun segi pelaksanaannya efesien dan mudak dilaksanakannya (Slameto,
2001: 21). Ini nampaknya sependapat dengan apa yang disebut tes itu ekonomis
oleh Arikunto (2005: 63). Yang dimaksud dengan ekonomis di sini ialah
bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos/biaya yang mahal,
tenaga yang banyak dan waktu yang lama.
Thorndike, R.L dan Hagen,
H.P. (dalam Mudjijo, 1995: 60) mengatakan bahwa untuk dapat
mempertimbangan kepraktisan suatu tes, kiranya kita dapat menilai dari hal-hal
berikut:
- Administrasi atau pelaksanaan tes
yang mnyangkut bagaimana dan oleh siapa tes itu dapat
dilaksanakan, apakah petunjuk yang ada sudah jelas, apakah ada pembatasan waktu
untuk setiap atau sekelompok soal, dan lain sebagainya.
- Lamanya waktu tes
Waktu tes jangan terlalu sedikit atau jangan terlalu lama.
Semuanya harus disesuaikan dengan jumlah dn tingkat kesulitan soal.
- Pengelolaan, Penafsiran, dan Penggunaan Hasil
Faktor yang tidak kalah pentingnya adalah bagaimana hasil
tes itu diolah, ditafsirkan serta apa manfaat bagi pelaksanaan pendidikan
(seperti antara tujuan seleksi, diagnostik, penempatan, atau perbaikan PBM yang
telah dilakukan).
- Pemeriksaan Hasil Tes
Sebelum hasil tes itu diolah dan ditafsirkan lebih lanjut
diperlukan pemeriksaan dan pemberian skor terlebih dahulu. Bagaimana kunci
jawaban itu digunakan untuk memeriksa pekerjaan siswa.
DAFTAR PUSTAKA
Arikunto,
Suharsimi. 2005. Dasar-Dasar Evaluasi Pendidikan. Jakarta: PT Bumi
Aksara.
Daryanto. 2005. Evaluasi
Pendidikan. Jakarta: PT Rineka Cipta.
Mudjijo. 1995. Tes Hasil
Belajar. Jakarta: Bumi Aksara.
Nurkancana, Wayan dkk. 1982. Evaluasi
Pendidikan. Surabaya: Usaha Nasional.
Slameto. 2001. Evaluasi
Pendidikan. Jakarta: PT Bumi Aksara.
Thoha, Chabib. 2003. Teknik
Evaluasi Pendidikan. Jakarta: PT Rajar Lindo Persada.
http://one.indoskripsi.com/judul-skripsi-tugas-makalah/metodologi-penelitian/uji-validitas-dan-reliabilitas
Diakses Rabu, 19 November 2008.
http://www.ialf.edu/kipbipa/papers/Maryanto.doc Diakses Rabu, 19 November 2008.
Tidak ada komentar:
Posting Komentar