Lilin Kecil di Tengah Malam: evaluasi

CIRI-CIRI TES YANG BAIK

Tes yang baik adalah tes yang dapat mengukur hasil belajar siswa dengan tepat. Untuk dapat menghasilkan tes yang seperti itu maka tes tersebut harus dibuat melalui perencanaan yang baik. Hal-hal yang perlu diperhatikan dalam membuat perencanaan tes yang baik adalah ( http://pustaka.ut.ac.id/learning.php):

Tentukan tujuan pembelajaran yang ingin diukur.
Pilih pokok bahasan dan sub-pokok bahasan yang relevan untuk mencapai tujuan tersebut.
Tentukan proses berpikir yang ingin diukur.
Tentukan jenis tes yang tepat digunakan untuk mengukur tujuan pembelajaran tersebut.
Tentukan tingkat kesukaran butir soal yang akan dibuat.

Selain itu, menurut para pakar sebuah tes dapat dikatakan baik sebagai alat pengukur harus memenuhi kriteria yaitu: memiliki Validitas, Reliabilitas, Praktikabilitas dan Objektivitas, Ekonomis. Adapun rinciannya sebagai berikut:

1) Validitas

Sebelum menuju kepenjelasan mengenai validitas, terlebih ada baiknya terlebih dahulu mengetahui perbedaan antara ”Validitas” dan ”Valid”. ”Validitas” merupakan sebuah kata benda, sedangkan ”Valid” merupakan kata sifat. Sebuah data atau informasi dapat dikatakan valid apabila sesuai dengan keadaan senyatanya. Jika data yang dihasikan dari sebuah instrumen tersebut valid, maka dapat dikatakan bahwa instrumen tersebut valid, karena dapat memberikan gambaran tentang data secara benar sesuai dengan kenyataan. (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 58).

Validitas merupakan ciri yang amat penting, yang seharusnya dimiliki oleh setiap tes yang digunakan untuk berbagai tujuan, termasuk tujuan pengajaran bahasa. Secara konvensional, validitas diartikan sebagai ciri yang menunjukkan adanya kesesuaian antara tes dengan apa yang ingin diukur dengan menggunakan tes itu. (Djiwandono, 1996: Tes Bahasa dalam Pengajaran, halaman 91).

Secara konvensional, Crocker dan Algina (1986) membedakan validitas menjadi tiga, yaitu:

a. Validitas isi

Validitas isi menuntut adanya kesesuaian isi antara kemampuan yang ingin diukur dan tes yang digunakan untuk mengukurnya. Kesesuaian itu tercermin pada jenis kemampuan yang dituntut untuk mengerjakan tes, dibandingkan dengan jenis kemampuan yang dijadikan sasaran pengukuran. Kesesuaian isi juga menyangkut cakupan bahan tes, yang harus mencerminkan cakupan bahan dari kemampuan yang dijadikan sasaran pokok tes.

b. Validitas kriteria

Validitas kriteria mengacu kepada kesesuaian antara hasil suatu tes dengan hasil tes lain yang digunakan sebagai kriteria. Kriteria yang digunakan untuk menetapkan tingkat kesesuaian itu dapat diambil dari tes sejenis yang diketahui ciri-cirinya sebagai tes yang baik, dan yang diselenggarakan pada saat (hampir) bersamaan. Validitas jenis ini dikenal sebagai validitas kesetaraan waktu. Validitas kriteria dapat pula berupa validitas peramalan. Dalam hal ini kriteria yang digunakan sebagai bahan perbandingan adalah hasil tes sejenis yang baik, yang diselenggarakan setelah suatu waktu tertentu dan tahapan perkembangan kemampuan tertentu.

c. Validitas konstruk

Kesesuaian antara hasil tes dengan kemampuan yang ingin diukur dapat pula ditinjau dari konstruk, yaitu konsep atau teori yang mendasari penggunaan suatu jenis kemampuan, termasuk kemampuan berbahasa. Pembuktian keberadaan validitas konstruk sebagai sesuatu yang bersifat abstrak dan konseptual. Tingkat rendahnya kadar validitas konstruk ditentukan oleh tinggi rendahnya koefisien korelasi antara kedua deret skor yang dibandingkan, dengan menempuh prosedur yang pada dasarnya sama dengan prosedur pembuktian keberadaan validitas kriteria.

v Jenis-jenis validitas

Suatu tes dapat memiliki validitas yang bertingkat-tingkat: tinggi, sedang, rendah, bergantung pada tujuannya. Sehubungan dengan itu, ada beberapa jenis validitas, yaitu (Purwanto, 2000: Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, halaman 138)

1. Content validity (curricular validity)

Suatu tes dikatakan memiliki Content validity jika scope dan isi tes sesuai dengan scope dan isi kurikulum yang sudah diajarkan.

2. Construct validity

Untuk menentukan adanya Construct validity, suatu tes dikorelasikan dengan suatu konsepsi atau teori.

3. Predictive validity

Suatu tes dikatakan memiliki Predictive validity jika hasil korelasi tes itu dapat meramalkan dengan tepat keberhasilan seseorang pada masa mendatang di dalam lapangan tertentu.

4. Concurrent validity

Jika hasil suatu tes mempunyai korelasi yang tinggi dengan hasil suatu alat ukur lain terhadap bidang yang sama pada waktu yang sama, maka dikatakan tes itu memiliki Concurrent validity.

v Cara menghitung validitas suatu tes dapat dilakukan antara lain sebagai berikut:

1. Dengan product moment correlation (Metode Pearson):

Rumusnya:

2. Dengan rank methodof correlation (metode Spearman)

Rumusnya:

2) Reliabilitas

Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam bahasa Inggris. Berasal dari kata reliable yang artinya dapat dipercaya. Sebuah tes dikatakan dapat dipercaya jika memberikan hasil yang tetap apabila diteskan berkali-kali. Jika dihubungkan dengan validitas, maka validitas adalah ketepatan sedangkan reliabilitas adalah ketetapan. (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 58).

Kehandalan atau reliabilitas meliputi ketepatan/kecermatan hasil pengukuran, keajegan/kestabilan dari hasil pengukuran. Kecermatan hasil pengukuran ditentukan oleh banyaknya informasi yang dihasilkan dan sangat berkaitan dengan satuan ukuran dan jarak rentang dari skala yang digunakan. Secara lebih tepat, reliabilitas sebenarnya terkait bukan dengan tesnya sebagai alat ukur, melainkan dengan hasil pengukurannya dalam bentuk skor yang ajeg.

Tentang syarat kestabilan atau keajegan dari skor suatu tes, ada dua istilah yang perlu dikenal yaitu keajegan internal dan keajegan eksternal. Keajegan internal adalah tingkat sejauh mana sebuah tes itu homogen baik dari segi tingkat kesukaran maupun dari segi bentuk soal dan prosedur menjawabnya. Sedangkan keajegan yang bersifat eksternal, pokok permasalahannya adalah mengenai tingkat sejauh mana skor yang dihasilkan dari penyajian sebuah tes kepada sekelompok orang akan tetap sama sepanjang kemampuan orang-orang yang akan diukur tersebut masih belum berubah. Surapranata, 2005: Panduan Penulisan Tes Tertulis, halaman 27-28)

Sebagai ciri yang pembuktiannya hanya dapat dilakukan secara empirik dengan perhitungan statistik, tingkat reliabilitas dapat diketahui dengan menerapkan berbagai metode perhitungan. Beberapa metode perhitungan tingkat reliabilitas yang biasa digunakan yaitu (Djiwandono, 1996: Tes Bahasa dalam Pengajaran, halaman 99-103).

a) Metode tes ulang

Perhitungan tingkat reliabilitas dengan metode tes ulang mempersyaratkan pengguna tes yang sama dua kali, pada sejumlah peserta tes yang sama. Metode tes ulang ini dilakukan dengan memperkecil pengaruh faktor ingatan maupun faktor perkembangan kemampuan. Keduanya itu cenderung mengaburkan koefisien realibilitas yang diperoleh dari perbandingan skor-skor yang dihasilkan.

b) Metode tes setara

Untuk menerapkan metode ini perlu dikembangkan dua buah tes yang setara, yang mampu menghasilkan skor yang sama atau setara pula bagi kelompok peserta tes yang sama, tanpa mengulang penggunaan tes yang sama.

c) Metode belah dua

Pada penerapan metode belah dua, tes yang tingkat reliabilitasnya perlu dikaji cukup digunakan sekali terhadap sekelompok peserta tes. Koefisien relialibitas suatu tes diperoleh melalui metode ini dengan mengkorelasikan skor peserta yang dihasilkan dari pengerjaan butir tes nomor genap, dengan skor peserta yang dihasilkan dari pengerjaan butir tes nomor ganjil.

d) Rumus Kuder-Richardson atau K-R

Penyelenggaran satu kali tes dalam penghitungan reliabilitas diterapkan pula pada metode Kuder-Richardson (disingkat K-R), khususnya KR-20 dan KR-21, yang banyak digunakan untuk tes buatan guru.

e) Koefisien alpha

Penerapan metode ini cukup sederhana, dan hanya memerlukan perhitungan varian masing-masing butir soal, atau SD², dan varian seluruh skor, atau SDx².

f) Koefesien antar penilai

Dalam penerapan metode ini, setiap pekerjaan peserta tes dinilai oleh lebih dari seorang penilai, sekurang-kurangnya dua orang. Masing-masing penilai melakukan penilaiannya sendiri secara terpisah, atas dasar kriteria yang telah ditentukan sebelumnya.

g) Metode perkiraan

Metode perkiraan digunakan dalam perhitungan tingkat reliabilitas, khususnya bagi tes buatan guru. Untuk itu dapat digunakan dua macam tabel, satu untuk tes yang dikategorikan tes yang mudah, dan satu lagi untuk tes yang sulit.

v Faktor-faktor yang dapat mempengaruhi kehandalan suatu tes, yaitu (Purwanto, 2000: Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, halaman 141)

1) Luas tidaknya sampling yang diambil.

2) Perbedaan bakat dan kemampuan murid yang di tes.

3) Suasana dan kondisi testing.

3) Praktikabilitas

Sebuah tes dikatakan memiliki praktikabilitas yang tinggi apabila tes itu bersifat praktis, mudah untuk pengadministrasiannya. Tes yang praktis adalah tes yang (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 62):

1). Mudah dilaksanakannya; misalnya tidak menuntut peralatan yang banyak dan memberi kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah oleh siswa.

2). Mudah memeriksanya artinya bahwa tes itu dilengkapi dengan kunci jawaban maupun pedoman skoringnya. Untuk soal yang obyektif, pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa dalam lembar jawaban.

3). Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan/ diawali oleh orang lain.

v Kriteria untuk mengukur praktis-tidaknya suatu tes dapat dilihat dari (Purwanto, 2000: Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, halaman 141-142)

a. biaya yang diperlukan untuk menyelenggarakan tes itu,

b. waktu yang diperlukan untuk menyusun tes itu,

c. sukar-mudahnya menyusun tes itu,

d. sukar-mudahnya menilai hasil tes itu,

e. sulit-tidaknya menginterpretasikan (mengolah) hasil tes itu,

f. lamanya waktu yang diperlukan untuk melaksanakan tes itu.

4) Objektivitas

Sebuah tes dikatakan memiliki objektivitas apabila dalam melaksanakan tes itu tidak ada faktor subjektivitas yang mempengaruhi. Hal ini terutama terjadi pada sistem skoringnya. Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan pada skoring, sedangkan reliabilitas menekankan ketetapan dalam hasil tes. Adapun dua faktor yang mempengaruhi subjektivitas dari suatu tes yaitu bentuk tes dan penilai. (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 61)

Selain itu, objektivitas suatu tes ditentukan oleh tingkat kesamaan skor-skor yang diperoleh dengan tes tersebut meskipun hasil tes itu dinilai oleh beberapa orang penilai. Untuk ini diperlukan kunci jawaban tes (sooring key). Kualitas objektivitas dapat dibagi tiga tingkatan yaitu (Purwanto, 2000: Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, halaman 141) :

1. Objektivitas tinggi ialah jika hasil-hasil tes itu menunjukkan tingkat kesamaan yang tinggi.

2. Objektivitas sedang ialah seperti tes yang sudah distandardisasi, tetapi pandangan subjektif skor masih mungkin muncul dalam penilaian dan interpretasinya.

3. Objektivitas fleksibel ialah seperti beberapa jenis tes yang digunakan oleh LBP (Lembaga Bimbingan dan Penyuluhan) untuk keperluan counseling.

5) Ekonomis

Yang dimaksud dengan ekonomis disini adalah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga yang banyak dan waktu yang lama. (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 63).

DAFTAR PUSTAKA

Anggota IKAPI. 2001. Penerbit Mandar Mundur

Arikunto, Suharsimi. 2009. Dasar-Dasar Evaluasi Pendidikan. Jakarta: PT Bumi Aksara.

Djiwandono, Soenardi. 1996. Tes Bahasa dalam Pengajaran. Bandung: Penerbit ITB.

Nasoetion, Noehi. Suryanto Judu dan Adi. 2000. Hakikat tes, pengukuran dan penilaian. http://pustaka.ut.ac.id/learning.php.

Purwanto, Ngalim. 2000. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. Bandung: PT Remaja Rosdakarya.

Surapranata, Sumarna. 2005. Panduan Penulisan Tes Tertulis. Bandung: PT Remaja Rosdakarya.

Lilin Kecil di Tengah Malam

Sabtu, 07 Januari 2012

evaluasi

Tidak ada komentar:

Posting Komentar