Kualitas Alat Ukur (Instrumen)

0
46

Kualitas Alat Ukur (Instrumen)

By. Weldan Firnando Smith, S.Pd.,M.AP

Abstrak

Setelah memeriksa hasil tes sumatif semester pertama, Bu Fatimah merasa
terkejut karena nilai yang diperoleh siswa-siswanya pada tes tersebut
jauh di bawah yang diharapkan. Untuk mengetahui di mana letak kesalahannya, Bu Fatimah mencoba melihat kembali kumpulan Satuan Pelajaran yang, telah dibuatnya selama satu semester. Dari kumpulan satuan pelajaran tersebut Bu Fatimah mencoba menganalisis kembali tujuan pembelajaran yan,-, harus dicapai. Hasil analisis menunjukkan bahwa tujuan pembelajaran yang harus dicapai tidak terlalu tinggi dan sesuai dengan tingkat perkembangan anak. Karena tidak menemukan kesalahan pada tujuan pembelajaran, Bu Fatimah mencoba mengingat-ingat kembali tentang proses pembelajaran yang selama ini dilakukannya. Menurutnya, ia sudah mencoba sekuat tenaga untuk mengajar dengan balk yaitu dengan memilih metode dan media yang tepat agar para siswa dapat menangkap dengan mudah dan jelas tentang konsepkonsep yang ia ajarkan.

 

  • Pendahuluan

 

Secara teoretis terdapat hubungan timbal batik antara Tujuan Pembelajaran, Proses Pembelajaran, dan Penilaian Hasil Belajar. Perhatikan skema berikut.

Gambar 1.
Hubungan antara tujuan pembelajaran, proses pembelajaran,

dan penilaian hasil belajar.

Jika tujuan pembelajaran yang Anda rumuskan sudah tepat dan proses pembelajaran yang Anda laksanakan sudah maksimal maka salah satu hal yang perlu Anda cermati adalah alat penilaian hasil belajar. Apakah alat ukur yang Anda gunakan (dalam hal ini tes yang Anda susun atau instrument lain yang Anda gunakan) mempunyai kualitas yang baik sehingga dapat digunakan untuk mengukur tujuan pembelajaran yang telah Anda tetapkan?

Untuk menjawab permasalahan tersebut pada tulisan ini Anda akan diajak untuk mempelajari lebih rinci berbagai cara yang dapat ditempuh untuk meningkatkan kualitas alat ukur atau instrumen yang Anda gunakan agar benar-benar dapat mengukur apa yang ingin Anda ukur. Dalam Tulisan ini akan dibahas mengenai pengujian kualitas alat ukur atau instrumen yang akan disajikan  membahas tentang validitas dan reliabilitas hasil pengukuran, dan membahas tentang bagaimana cara menganalisis butir soal dan bagaimana cara meningkatkan kualitas butir soal berdasarkan hasil analisis Berta bagaimana meningkatkan kualitas alat ukur non-tes.

Setelah mempelajari Tulisan ini Anda akan dapat meningkatkan kualitas alat ukur yang Anda gunakan dan secara lebih rinci Anda dapat:

  1. menjelaskan konsep validitas;
  2. menjelaskan konsep reliabilitas;
  3. membedakan validitas dan reliabilitas;
  4. menjelaskan hubungan antara validitas dan reliabilitas;
  5. menentukan tingkat kesukaran butir soal;
  6. menentukan daya beda butir soal;
  7. menganalisis butir soal; dan
  8. memperbaiki kualitas alat ukur.

Pembahasan dalam Tulisan ini merupakan kelanjutan dari pembahasan materi-materi yang ada pada Tulisan-Tulisan sebelumnya, seperti bagaimana membuat perencanaan atau kisi-kisi tes dan bagaimana mengkonstruksi tes yang baik. Jika Anda benar-benar telah menguasai seluruh materi yang dibahas pada Tulisan-Tulisan sebelumnya sampai dengan materi yang dibahas dalam Tulisan ini, maka Anda akan dapat menyiapkan set tes yang benarbenar dapat mengukur apa yang ingin Anda ukur. Dengan demikian kejadian seperti yang dialami Bu Fatimah seperti dicontohkan di depan atau yang mungkin juga Anda alami tidak akan terulang lagi.

KEGIATAN BELAJAR

Validitas dan Reliabilitas Hasil Pengukuran

Pernahkah Anda melihat perlombaan memanah? Kami yakin hampir semua di antara Anda pernah menyaksikan perlombaan tersebut baik secara Iangsung maupun tidak langsung misalnya melalui pesawat televisi. Nah, dalam perlombaan memanah setiap peserta lomba diminta untuk dapat melepaskan anak panah dengan tepat pada sasaran yang telah  ditetapkan. sasaran dalam perlombaan memanah biasanya berupa beberapa lingkaran yang disusun berurutan mulai dari lingkaran yang paling kecil yang diletakkan di tengah sampai dengan lingkaran yang terbesar yang diletakkan paling luar. Perhatikan gambar berikut ini.

Seorang pemanah akan dinyatakan sebagai pemenang jika hasil bidikannya dapat tepat mengenai sasaran yaitu daerah lingkaran yang paling dalam atau yang paling mendekati lingkaran yang paling dalam. Jika hasil bidikan peserta didik dapat mengenai daerah di lingkaran paling dalam maka is akan memperoleh skor tertinggi dan perolehan skor tersebut semakin berkurang jika hasil bidikannya semakin jauh dari sasaran. Karena anak panah yang harus maka dapat tepat mengenai sasaran.

Hasil bidikan dari peserta dapat tepat mengenai sasaran atau dapat juga meleset dari sasaran. Nah, hasil yang sama dapat terjadi pada saat Anda mengukur hasil belajar siswa. Jika alat ukur yang Anda gunakan tidak Anda persiapkan dengan cermat maka skor yang Anda peroleh tidak dapat menggambarkan dengan tepat tingkat kemampuan setiap siswa. Perhatikan kasus yang dialami Bu Fatimah yang telah diuraikan dalam pendahuluan. Dari penjelasan tersebut terdapat dua masalah pokok yang harus diperhatikan dalam menyusun alat ukur hasil belajar yang baik yaitu masalah yang berhubungan dengan ketepatan hasil Bidikan hasil

Pengukuran dan ketetapan pengukuran.

Masalah yang berhubungan dengan ketepatan hasil pengukuran inilah yang dikenal dengan istilah validitas sedangkan masalah-masalah yang berhubungan dengan ketetapan hasil pengukuran dikenal dengan istilah reliabilitas. Dalam Kegiatan Belajar 1 ini Anda akan kami ajak untuk membicarakan kedua hal tersebut.

 

  • Pembahasan

 

APAKAH VALIDITAS ITU?

Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa yang ingin Anda ukur. Jika Anda ingin mengukur panjang sebuah meja maka Anda harus dapat memilih alat ukur yang tepat untuk mengukur panjang meja tersebut. Untuk menghitung waktu tempuh pelari cepat dalam perlombaan lari cepat 100 meter maka Anda juga harus dapat memilih alat ukur yang tepat untuk digunakan. Demikian juga jika Anda ingin mengukur hasil belajar siswa maka Anda juga dituntut untuk menggunakan alat ukur (dalam hal ini tes) yang dapat dengan tepat mengukur hasil belajar yang Anda harapkan. Agar Anda dapat memperoleh gambaran tentang pengertian validitas suatu hasil pengukuran, berikut ini disajikan contoh yang Bering Anda jumpai dalam kehidupan sehari-hari. Perhatikan dua jenis timbangan berikut ini.

Jika Anda ingin menimbang berat perhiasan emas, jenis timbangan yang Anda yang memilih manakah yano akan Anda gunakan? Adakah di antara Anda yang memilih timbangan duduk? Jika ada di antara Anda yang memilih timbangan duduk maka pilihan Anda tersebut kurang tepat. Mengapa? Nah, walaupun kedua jenis timbangan tersebut sama-sama dapat berfungsi untuk menimbang berat tetapi timbangan neracalah yang akan memberikan hasil penimbangan yang lebih tepat. Hal ini disebabkan karena timbangan neraca mempunyai ketelitian yang lebih tinggi.

Jika dibandingkan dengan timbangan duduk, hasil penimbangan berat emas dengan timbangan neraca dikatakan mempunyai ketepatan (validitas) yang tinggi sedangkan hasil penimbangan berat emas dengan timbangan duduk dikatakan mempunyai ketepatan yang rendah. Demikian pula jika Anda ingin menghitung waktu tempuh dari Yogyakarta ke Surakarta dengan mengendarai mobil. Jam tangan yang Anda pakai akan memberikan hasil pengukuran yang tepat, tetapi jam tangan tersebut akan memberikan hasil pengukuran yang kurang tepat jika Anda gunakan untuk mengukur waktu yang diperlukan oleh pelari cepat dalam menempuh jarak 100 meter.

Dari contoh yang diberikan tersebut dapatkah Anda menarik kesimpulan apa yang dimaksud dengan validitas? Jika, Anda telah berhasil menarik kesimpulan mengenai apa yang dimaksud dengan validitas, cocokkanlah hasil kesimpulan Anda dengan pengertian validitas berikut ini.

Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi (Gronlund dan Linn, 1990). Secara umum validitas ada tiga jenis.

  1. Validitas isi (content validity).
  2. Validitas konstrak (construct validity).
  3. Validitas yang dikaitkan dengan kriteria tertentu (criterion related validity).

Validitas isi diperlukan untuk menjawab pertanyaan “sejauh mana item-item yang ada dalam tes dapat mengukur keseluruhan materi yang telah diajarkan”. Tinggi rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau pertimbangan ahli terhadap isi tes tersebut. Hal ini merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu tes dapat Anda lihat pada perencanaan atau kisikisi tes. Semakin representatif materi yang dapat ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya. Bagaimana dengan validitas isi tes dari tes akhir semester disekoiah Anda?

Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapat mengungkap keseluruhan konstrak yang digunakan sebagai dasar dalam penyusunan tes tersebut. Yang dimaksud dengan konstrak di sini adalah dengan

hipotetis (hipotetical concept) yang digunakan sebagai dasar dalam sebagai  alat ukur. Validitas konstrak ini banyak digunakan terutama dalam pengukuran-pengukuran psikologi seperti pengukuran sikap, minas, tingkah laku dan sebagainya. Campbell dan Fiske (Djemari Mardapi, 2004) mengembangkan satu pendekatan untuk menentukan validitas konstrak dengan menggunakan teknik multi trait-multi method. Validasi dengan multi trait-multi method dilakukan dengan menggunakan lebih dari satu metode untuk mengukur lebih dari satu macam trait (sifat). Dengan menggunakan matrik korelasi sehingga interkorelasi antara trait dan metode dapat dilihat dengan jelas. Perhatikan tabel multi trait-multi method ideal berikut.

Tabel 5.1. Validitas konvergen dan validitas deskrimen pada persekatan

Multitrait multimethod.

Keterangan : Huruf melambangkan trait sementara angka melambangkan metode, sedangkan r adalah Tulisanus korelasi.

A I : trait A yang diukur dengan metode I

A2 : trait A yang diukur dengan metode 2

B I : trait B yang diukur dengan metode 1

B2 : trait B yang diukur dengan metode 2

A 1 A2 :  dua metode yang berbeda yang digunakan untuk mengukur trait yang sama

A1B1 : dua trait yang berbeda diukur dengan metode yang sama

Dari Tabel 5.1 tersebut dapat dilihat adanya dua tipe validitas yaitu validitas konvergen (Convergent validity) dan validitas pembeda (discriminant validity). Adanya validitas konvergen dapat dilihat pada korelasi yang tinggi antara skor tes yang mengukur trait yang sama dengan metode yang berbeda (rAIA2 dan rB I B2) sedangkan adanya validitas pembeda dapat dilihat pada korelasi yang rendah antara skor tes yang mengukur trait berbeda (rA1B1, rA1B2, rA2BI, dan rA2B2), terutama bila trait yang berbeda diukur dengan metode yang sama (rAIBI dan rA2B2). Adanya korelasi yang rendah ini menunjukkan bahwa item tersebut mempunyai days pembeda yang baik dan mampu mengukur trait yang spesifik. Sebagai contoh, jika Anda ingin mengetahui bagaimana pola kepemimpinan seorang kepala sekolah maka item-item yang Anda gunakan dikatakan mempunyai validitas konstrak yang tinggi jika item tersebut dapat mengungkapkan pola kepemimpinan setiap individu yang menjadi sampel dalam pengukuran tersebut.

Jika suatu tes dimaksudkan untuk memprediksi keberhasilan seseorang di mass yang akan datang atau dimaksudkan untuk mengetahui kesesuaian antara pengetahuan dengan keterampilan yang dimiliki maka alat ukur yang digunakan harus mempunyai criterion related validity yang tinggi. Sebagai contoh jika siswa SD yang mempunyai Nilai Ebtanas Murni (NEM) tinggi ternyata mempunyai prestasi yang bagus setelah melanjutkan di SLTP maka dapat dikatakan bahwa tes yang digunakan dalam Ebtanas SD mempunyai criterion related validity yang tinggi. Suatu tes untuk teori komputer dikatakan mempunyai criterion related validity jika dari hasil tes ternyata siswa yang mempunyai skor tinggi memang mempunyai keterampilan yang tinggi dalam menggunakan komputer daripada siswa yang mendapat skor rendah.

APAKAH RELIABILITAS ITU?

Nah, dalam pendahuluan telah dijelaskan bahwa untuk menyusun set tes yang baik ads dua hal yang perlu diperhatikan yaitu validitas dan reliabilitas. Kalau tadi Anda telah memahami spa yang dimaksud dengan validitas maka berikut ini Anda akan diajak untuk membahas konsep reliabilitas. Untuk memperoleh pemahaman tentang pengertian reliabilitas, lakukanlah kegiatan berikut ini! Ukurlah panjang sepuluh benda yang berada di sekitar Anda sebanyak dua kali pada waktu yang berbeda dengan menggunakan alat ukur yang tepat kemudian tuangkanlah hasilnya pada tabel berikut ini!

No. Nama benda Alat ukur yang

digunakan

Hasil Pengukuran
1 2
1
2
3
4
5
6
7
8
9
10

Apakah hasil yang Anda peroleh dalam dua kali pengukuran, memberikan hasil yang berbeda? Jika cara pengukuran yang Anda lakukan benar maka hasil pengukuran yang Anda peroleh mestinya sama. Jika hasil pengukuran yang Anda peroleh sama, dapat dikatakan bahwa alat ukur yang Anda gunakan memberikan hasil pengukuran yang reliabel (tetap, konsisten, stabil). Hasil-hasil pengukuran yang berhubungan dengan aspek-aspek fisik seperti mengukur panjang meja, tinggi almari, berat badan, dan tinggi badan biasanya menghasilkan reliabilitas yang sangat tinggi Artinya walaupun pengukuran dilakukan lebih dari sekali tetapi tetap memberikan hasil yang tidak jauh berbeda. Hasil pengukuran yang berbeda akan sering Anda temukan jika Anda melakukan pengukuran terhadap hal-hal yang berhubungan dengan aspek-aspek psikologi dan sosial seperti dalam pengukuran mewakili intelegensi, sikap, dan konsep diri. Aspek-aspek sosialpsikologis seperti itu tidak dapat diukur dengan ketepatan dan konsistensi yang tinggi. Hal ini disebabkan karena hasil pengukuran yang diperoleh tidak dapat lepas dari pengaruh hal-hal di luar maksud pengukuran tersebut misalnya alat ukur itu sendiri mungkin bukan merupakan alat ukur yang tepat untuk mengukur aspek yang diinginkan. Di samping itu karena subjek pengukurannya adalah manusia maka cara-cara penyajian tes, emosi, motivasi, kondisi fisik, dan keadaan ruangan tes akan mempengaruhi hasil pengukuran walaupun sebenarnya aspek-aspek yang ingin kits ukur tersebut maka pilihan Anda tersebut kurang tepat tidak berubah. Dengan demikian hasil pengukuran yang diperoleh menjadi kurang reliabel.

Dari hasil kegiatan yang telah Anda lakukan dan setelah memahami uraian di atas, Anda telah memperoleh gambaran mengenai apa yang dimaksud dengan reliabilitas. Kalau pengertian validitas mengacu pada ketepatan hasil pengukuran maka pengertian reliabilitas mengacu pada ketetapan hasil yang diperoleh dari suatu pengukuran (Gronlund dan Linn, 1990). Salah satu Cara untuk mengetahui ketetapan atau reliabilitas suatu hasil pengukuran, dapat diperoleh dengan Cara melakukan pengukuran dua kali seperti contoh kegiatan yang telah Anda lakukan tersebut. Hasil pengukuran dikatakan mempunyai reliabilitas yang tinggi jika hasil pengukuran pertama hampir sama dengan hasil pengukuran kedua. Dan sebaliknya hasil pengukuran dikatakan mempunyai reliabilitas yang rendah jika hasil pengukuran pertama jauh berbeda dengan hasil pengukuran kedua. Nah, bagaimana hal tersebut dapat diterapkan sehubungan dengan tugas Anda sebagai guru?

Jika Anda mempunyai seperangkat tes misalnya tes untuk mengukur penguasaan siswa dalam matematika maka untuk mengetahui apakah tes Anda tersebut mempunyai reliabilitas yang tinggi atau rendah dapat dengan mudah Anda lakukan yaitu dengan Cara mengujikan set tes tersebut pada kelas yang sama sebanyak dua kali dengan selisih waktu yang tidak tertalu lama dan juga tidak terlalu dekat. Mengapa tenggang waktunya tidak boleh terlalu dekat atau terlalu lama? Coba diskusikan dengan teman-teman Anda. Pada prinsipnya hal ini berhubungan dengan kekhawatiran bahwa siswa masih mengingat soal-soal tersebut dan kekhawatiran adanya penambahan pengetahuan selama selang waktu kedua pengukuran tersebut. Jika skor yang Anda peroleh dari pelaksanaan tes pertama tidak jauh berbeda dengan skor yang Anda peroleh pada waktu tes kedua maka dapat dikatakan bahwa set tes Anda mempunyai reliabilitas yang tinggi. Semakin sama skor yang Anda peroleh pada pengukuran pertama dan kedua menunjukkan semakin tinggi reliabilitas set tes tersebut. Jika Anda ingin lebih teliti untuk melihatnya dapat Anda lakukan dengan melihat skor setiap individu pada kedua hasil pengukuran tersebut.

Jika skor yang diperoleh setiap individu pada kedua pengukuran cenderung sama berarti set tes tersebut mempunyai reliabilitas yang tinggi. Hubungan antara skor yang diperoleh pada pengukuran pertama dengan kedua akan menghasilkan angka korelasi bergerak antara -1 (baca negatif satu) sampai dengan +1 (baca positif satu). Semakin tinggi angka koefisien reliabilitas (mendekati 1) maka semakin tinggi reliabilitas tes tersebut. Suatu perangkat tes dinyatakan cukup reliabel jika mempunyai koefisien reliabilitas lebih besar 0,5 (Fernandes, 1984). Cara menghitung koefisien korelasinya dapat Anda hitung dengan menggunakan formula korelasi product-moment sebagai berikut.

rxy=NXY-(X)(Y)√NX2(X)2x√NY2(Y)2

Dimana:  r xy : koefisien korelasi dari xy
   N : jumlah data

   X : data pertama

   Y : data kedua

Contoh:

Nama Skor tes I

(X)

Skor tes II

(Y)

XY X2 Y2
Andi 40 42 1680 1600 1764
Adi 43 43 1849 1849 1849
Anto 39 38 1482 1521 1444
Amin 52 50 2600 2704 2500
Amir 50 51 2550 2500 2601
Amrin 44 45 1980 1936 2025
Ali 44 44 1936 1936 1936
Alam 51 49 2499 2601 2401
Adang 48 49 2352 2304 2401
Anang 47 46 2162 2209 2116
458 457 21090 21160 21037

rxy=10 x 21090 – 458 x 457 √10 x 21160 – 209764 x√10 x 21037 – 208849

                               =21160 – 209764  42,8 x 39

       =1594  1669,2

                            =0,95

Para mahasiswa yang berbahagia, konsep reliabilitas yang baru saja Anda pelajari adalah konsep reliabilitas dalam arti stabilitas tes. Sebenarnya masih ada dua konsep reliabilitas yang lain yaitu konsep reliabilitas dalam arti equivalent tes dan konsep reliabilitas dalam arti konsistensi internal.

Konsep reliabilitas dalam arti equivalent test dimaksudkan untuk mengetahui apakah dua set tes yang Anda gunakan paralel atau tidak. Keparalelan dua set tes ini dapat diperoleh dengan cara mengembangkan dua set tes yang paralel (misalnya tes A dan tes B dari kisi-kisi tes yang sama), kemudian masing-masing set tes tersebut diujikan pada dua kelas yang mempunyai tingkat kemampuan yang sama. Hasil kedua tes tersebut kemudian dikorelasikan. Jika hasil korelasinya tinggi, hat ini menunjukkan kedua tes tersebut paralel. Koefisien korelasinya dapat dihitung dengan menggunakan formula product-moment.

Sedangkan konsep reliabilitas dalam arti konsistensi internal dimaksudkan untuk mengetahui apakah kumpulan butir soal yang ada dalam satu set tes tersebut mengukur dimensi hasil belajar yang sama atau tidak. Reliabilitas dalam arti konsistensi internal ini dapat diperoleh dengan mengujikan satu set tes pada satu kelas kemudian jawaban seluruh siswa terhadap, butir soal nomor genap dikorelasikan dengan jawaban seluruh siswa terhadap butir soal nomor ganjil, kemudian dikorelasikan. Teknik ini dikenal dengan nama teknik belch tengah (split half). Untuk menghitung koefisien korelasinya dapat digunakan rumus product-moment. Koefisien reliabilitas dalam arti konsistensi internal juga dapat dihitung dengan menggunakan formula Kuder-Richardson versi 20 atau 21 (KR20 atau KR21). Jika hasil korelasinya tinggi, hal ini menunjukkan bahwa antar butir soal dalam set tes tersebut adalah konsisten satu dengan yang lain. Atau dapat dikatakan bahwa setup butir soal yang terdapat dalam set tes tersebut mengukur dimensi hasil belajar yang sama. Jika Anda berminat untuk menghitungnya, silakan cari rumus tersebut dalam buku-buku statistika. Anda juga dapat menggunakan program-program pengolahan data yang sudah terdapat di pasaran, misalnya Program Iteman.

BAGAIMANA HUBUNGAN ANTARA VALIDITAS DAN RELIABILITAS?

Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk memperoleh alat ukur yang dapat memberikan hasil pengukuran yang tepat (valid). Walaupun demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu secara otomatis mempunyai validitas yang tinggi. Karena tingginya reliabilitas yang dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat memberikan informasi yang salah tentang apa yang ingin Anda ukur. Sebagai ilustrasi berikut ini disajikan hasil perlombaan memanah yang diikuti Anto, Andi; dan Anang. Dari 10 anak panah yang telah mereka lepaskan diperoleh hasil sebagai berikut:

Hasil bidikan Anto    Hasil bidikan Andi Hasil bidikan Anang

Gambar 5.4.
Hasil bidikan dalam perlombaan memanah

Hasil bidikan siapakah yang tidak valid dan tidak reliabel? Hasil bidikan siapakah yang tidak valid tetapi reliabel? Dan hasil bidikan siapakah yang valid dan reliabel? Dengan menggunakan pengertian validitas dan reliabilitas yang telah dijelaskan di depan maka Anda akan dapat menjawab ketiga pertanyaan tersebut. Hasil bidikan Anto adalah hasil bidikan yang tidak valid dan tidak reliabel. Mengapa? Hal ini disebabkan karma dari 10 anak panah yang dilepaskan Anto selalu mengenai sasaran yang berbeda. Bagaimana hasil bidikan Andi? Kalau Anda perhatikan hasil bidikan Andi ternyata dari 10 anak panah yang dilepaskan tidak satu pun anak panah yang tepat mengenai sasaran. Walaupun kesepuluh anak panah yang dilepaskan tidak tepat pada sasaran yang ditentukan tetapi hasil bidikan Andi selalu mengenai sasaran yang relatif sama. Kalau kita menggunakan konsep validitas dan reliabilitas yang telah dijelaskan di depan maka dapat dikatakan bahwa hasil bidikan Andi adalah tidak valid tetapi reliabel. Hasil bidikan Ananglah yang dikatakan valid dan reliabel. mengapa? Hal ini disebabkan karena kesepuluh hasil bidikan Anang tepat dan tetap mengenai sasaran yang ditentukan.

BAGAIMANA MENINGKATKAN RELIABILITAS TES?

Reliabilitas suatu tes dapat ditingkatkan dengan menarnbah jumlah butir ke dalam tes tersebut. Yang mungkin menjadi pertanyaan bagi Anda kemudian adalah apakah setiap penambahan butir soal akan selalu dapat menaikkan reliabilitas tes? Jawabannya adalah belum tentu.

Penambahan butir soal pada tes akan meningkatkan reliabilitas jika butir soal yang ditambahkan adalah butir-butir soal yang homogen dengan butir soal yang ada. Yang dimaksud dengan butir soal yang homogen adalah butir soal-soal yang mengukur hal yang sama dengan butir soal yang sudah ada. Penambahan butir soal tidak akan menaikkan reliabilitas tes jika butir soal yang ditambahkan tidak homogen dengan butir soal yang telah ada. Reliabilitas tes yang baru sebagai akibat adanya penambahan butir soal secara sederhana dapat dihitung dengan menggunakan rumus Spearman-Brown sebagai berikut.

rxx=Jryy1+(J-1)ryy

di mana:

ryy = reliabilitas sebelum penambahan butir soal

ryy = reliabilitas setelah penambahan butir soal

J = rasio jumlah butir soal setelah dan sebelum penambahan

Contoh:

Reliabilitas suatu tes yang terdiri atas 40 butir adalah ryy = 0,40. Berapakah reliabilitas tes setelah ditambahkan 20 butir soal yang homogen dengan butir soal yang sudah ada?

Jawab:

Reliabilitas sebelum penambahan = 0,40. Jumlah butir soal sebelum ditambah = 40 dan setelah ditambah 20 berarti 60. Deegan demikian rasio jumlah butir soal setelah dan sebelum penambahan adalah 1,5 (karena ada penambahan butir setengah kali lipat). Jika angka tersebut kita masukkan dalam rumus, akan kita peroleh reliabilitas tes baru sebagai berikut.

rxx=1, 5(0, 40) 1 + (1,5 —1)(0,40)= 0, 692

Hubungan antara banyaknya butir soal baru yang ditambahkan dengan peningkatan reliabilitas tes tidak menunjukkan hubungan yang linear artinya setiap penambahan butir soal tidak selalu terns diikuti dengan kenaikan reliabilitas. Perkiraan tingginya koefisien reliabilitas setelah penambahan butir soal dapat dilihat pada gambar berikut.

Gambar 5.5.
Efek penambahan butir soat terhadap peningkatan reliabilitas

Pada gambar di atas tampak bahwa tes yang reliabilitasnya 0,20 walaupun tesnya ditambah 10 kali lipat pun maka reliabilitasnya tidak akan menjadi sempurna (rxx = 1,00).

 

  • Kesimpulan

 

Untuk mengukur sesuatu Anda harus dapat memilih alat ukur yang sesuai agar Anda dapat memperoleh hasil pengukuran yang tepat. Ketepatan hasil pengukuran inilah yang dinamakan validitas. Validitas dapat dibedakan menjadi tiga macam yaitu validitas isi (content validity), validitas konstrak (construct validity), dan validitas yang dikaitkan dengan kriteria lain (criteria related validity).

Validitas isi mengacu pada sejauh mana materi alat ukur tersebut digunakan untuk mengukur keseluruhan materi yang seharusnya diukur. Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapat mengukur konstrak-konstrak yang digunakan sebagai dasar penyusunan tes tersebut. Sedangkan validitas yang dikaitkan dengan kriteria lain mengacu pada sejauh mana alat ukur tersebut dapat dengan tepat memprediksi kesesuaian antara pengetahuan yang dimiliki sekarang dengan keberhasilannya pada mana yang akan datang atau kesesuaian antara penguasaan suatu pengetahuan dengan keterampilan penggunaan pengetahuan tersebut. Dari ketiga macam validitas tersebut validitas isilah yang paling penting Anda pahami dalam rangka mempersiapkan tes hasil belajar yang baik. Ada dua masalah yang harus Anda perhatikan dalam rangka mempersiapkan tes hasil belajar yang baik yaitu masalah validitas (dalam hal ini validitas isi) dan reliabilitas.

Agar tes hasil belajar mempunyai validitas isi yang tinggi dapat ditempuh dengan cara membuat perencanaan tes (kisi-kisi tes). Di samping tes harus memiliki validitas isi yang dapat dipertanggungjawabkan maka tes tersebut harus reliabel artinya jika tes tersebut digunakan lebih dari satu kali pada kelompok yang sama maka tes tersebut harus dapat memberikan hasil pengukuran yang tetap. Reliabilitas suatu tes dapat ditingkatkan dengan cara menambah jumlah butir soal, dengan catatan bahwa soal yang ditambahkan harus homogen dengan butir soal yang sudah ada.

Daftar Pustaka

Azwar, S. (1986). Reliabilitas dan Validitas, Liberty, Yogyakarta.

Ebel, R.L., & Frisbie, D.A. (1986). Essentials of Educational Measurement, Prentice Hall, New York.

Fernades, H.J.X. (1984). Testing and Measurement, National Educational planning, Evaluation and Curriculum Development, Jakarta.

Hanna, G.S. (1993). Better teaching Trough Better Measurement, Harcourt Brace Jovanovich College Pub., New York.

Mardapi, D. (2004). Penyusunan Tes Hasil Belajar. Yogyakarta: PPS-UNY.

Mehrens, W.A & lehmann, I.J. (1973). Measurement and Evaluation in Education and Psychology, Holt Renehart and Winton, New York.

Nasoetion, N & Suryanto, A. (2002). Tes, Pengukuran dan Penilaian. Jakarta: Pusat Penerbitan Universitas Terbuka.

Nitko, A.J. (1983). Educational Test and Measurement an Introduction, Harcourt Brace Jovanovich, inc., New York.

Sax,G. (1980). Principles of Educational and Psychological Measurement and Evaluation, Wadsworth, California.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.