A. Pengertian Tes

        Istilah tes diambil dari kata “testum” suatu pengertian dalam bahasa Perancis kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada pula yang mengartikan sebagai sebuah piring yang dibuat dari tanah. Dalam perkembangannya, istilah tes diadopsi dalam psikologi dan pendidikan.

        Tes merupakan suatu teknik atau cara yang digunakan dalam rangka melaksanakan kegiatan pengukuran, yang didalamnya terdapat berbagai pertanyaan, pernyataan atau serangkaian tugas yang harus dikerjakan atau dijawab oleh peserta didik untuk mengukur aspek perilaku peserta didik.  Menurut seorang ahli bernama James Ms. Cattel, pada tahun 1890 telah memperkenalkan pengertian tes ini kepada masyarakat melalui bukunya yang berjudul “mental test and measurement”. Selanjutnya di Amerika Serikat tes ini berkembang dengan cepat sehingga dalam tempo yang tidak begitu lama masyarakat mulai menggunakannya.

         Banyak ahli yang mulai mengembangkan tes ini untuk berbagai bidang, namun yang terkenal adalah sebuah tes intelegensi yang disusun oleh orang Perancis bernama Binet, yang kemudian di bantu penyempurnaannya oleh Simon, sehingga tes tersebut dikenal sebagai tes binet-simon (tahun 1904).

       Pengertian tes lebih ditekankan pada penggunaan alat pengukuran. Terdapat beberapa istilah yang berhubungan dengan tes, yaitu tes, testing, testee dan tester, maka diterangkan sebagai berikut:

Tes: adalah merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Untuk mengerjakan tes ini tergantung dari petunjuk yang diberikan misalnya : melingkari salah satu huruf di depan pilihan jawaban, menerangkan, mencoret jawaban yang salah, melakukan tugas atau suruhan, menjawab secara lisan dan sebagainya.

Testing: testing merupakan saat pada waktu tes itu dilaksanakan atau testing saat pengambilan tes.

Testee :(dalam istilah Indonesia tercoba), adalah responden yang sedang mengerjakan, dinilai atau diukur, baik mengenai kemampuan, minat, bakat, pencapaian dan sebagainya.

Tester:(dalam istilah Indonesia: percoba), adalah orang yang diserahi untuk melaksanakan pengambilan tes terhadap para responden. Dengan lain perkataan, tester adalah subyek evaluasi (tetapi adakalanya hanya orang yang ditunjuk oleh subyek evaluasi untuk melaksanakan tugasnya). Menurut Sumadi Suryabrata (1984:22) tes adalah pertanyaan-pertanyaan yang harus dijawab dan atau perintah-perintah yang harus dijalankan, yang mendasarkan harus bagaimana tester menjawab pertanyaan atau melakukan perintah-perintah itu, penyelidik mengambil kesimpulan dengan cara membandingkannya dengan dengan standar atau testee yang lain.

      Untuk memahami tentang pengertian tes, berikut ini dikutip beberapa pendapat pendapat para ahli, yaitu :

a. Tes adalah suatu pengukuran yang berisi serangkaian pertanyaan, dimana masing-masing pertanyaan memiliki jawaban yang benar (Ebel & Eriesbie, 1986)

b. Tes merupakan serangkaian tugas-tugas yang digunakan dalam berbagai observasi (Sax, 1980)

c. Tes seringkali berkonotasi dengan adanya pertanyaan-pertanyaan yang standar yang perlu dijawab ( Mehrenns & Lehmann, 1973)

B.     Pengertian Tes Objektif

Tes objektif yang juga dikenal dengan istilah tes jawaban pendek (short answer test) tes ya-tidak (yes-no test) dan test model baru (new tipe test) adalah salah satu jenis tes hasil belajar yang terdiri dari butir-butir soal (item) yang dapat jawab oleh testee dengan jalan memilih salah satu jawaban (atau lebih) di antara beberapa kemungkinan jawaban yang dapat dipasangkan pada masing-masing items atau dengan cara mengisikan (menuliskan) jawaban berupa kata-kata atau simbol-simbol tertentu pada tempat atau ruang yang telah disediakan untuk masing-masing butir items yang bersangkutan.

Dilihat dari sistem penskorannya, tes objektif akan menghasilkan skor yang sama. Sebagaimana nama yang digunakannya, soal objektif adalah soal yang tingkat kebenarannya objektif. Oleh karenanya, tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara objektif (Arikunto, 1995: 165). Karena sifatnya yang objektif maka penskorannya dapat dilakukan dengan bantuan mesin. Soal ini tidak memberi peluang untuk memberikan penilaian yang bergradasi karena dia hanya mengenal benar dan salah. Apabila respons siswa sesuai dengan jawaban yang dikehendaki maka respons tersebut benar dan biasa diberi skor 1. Apabila kondisi yang terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0. Jawaban siswa bersifat mengarah kepada satu jawaban yang benar (convergence).

Merujuk kepada berbagai pendapat tentang tes objektif dapat diambil kesimpulan bahwa tes objektif adalah tes yang semua informasi yang diperlukan peserta tes untuk memberikan respon telah disediakan oleh penyusun tes, sehingga peserta tes tinggal memilihnya. Jawaban yang berupa pilihan bersifat deterministik, sehingga hanya ada dua kemungkinan kebenaran jawaban – benar atau salah.

C.    Ketepatan Penggunaan Tes Objektif

Tes hasil belajar bentuk objektif sebagai salah satu bentuk tes hasil belajar tepat digunakan apabila tester berhadapan dengan kenyataan-kenyataan disebutkan berikut ini:

  1. Peserta tes jumlahnya cukup banyak
  2. Penyusun tes (tester) telah memiliki kemampuan dan bekal pengalaman yang luas dalam menyusun butir-butir tes obyektif.
  3. Penyusunan tes memiliki waktu yang cukup longgar dalam mempersiapkan penyusunan butir-butir soal test objektif.
  4. Penyusun tes merencanakan, bahwa butir-butir tes soal objektif itu tidak hanya akan dipergunakan dalam satu kali tes saja melainkan akan dipergunakan lagi dalam kesempatan tes hasil belajar yang akan datang.
  5. Penyusunan tes mempunyai keyakinan penuh bahwa dengan menggunakan butir-butir soal tes objektif yang disusunnya itu akan dapat dianalisa dalam rangka mengetahui kualitas butir-butir itemnya, misalnya dari segi derajat kesukaran, daya pembedanya dan sebagainya.
  6. Penyusunan tes objektif berkeyakinan bahwa dengan menggeluarkan butir-butir soal tes objektif maka prinsip objektivitas akan lebih mungkin untuk diwujudkan ketimbang menggunakan butir-butir soal tes subjektif.

D.  Kebaikan dan Kelemahan Tes Objektif

Seperti halnya tes uraian, sebagai alat pengukur keberhasilan belajar peserta didik, tes objektif ini disamping memiliki keunggulan-keunggulan juga memiliki kekurangan-kekurangan.

Di antara keunggulan-keunggulan yang memiliki yang dimiliki oleh tes objektif ialah bahwa:

  1. Tes objetif sifatnya lebih representatif dalam hal mencakup dan mewakili materi yang telah diajarkan kepada peserta didik atau telah diperintahkan kepada peserta didik untuk mempelajarinya.
  2. Tes objektif lebih memungkinkan bagi tester untuk bertindak lebih objektif, baik dalam mengoreksi lembar-lembar soal, menentukan bobot skor maupun dalam menentukan hasil nilai tesnya.
  3. Mengoreksi tes objektif jauh lebih mudah dan lebih cepat dibandingkan dengan tes uraian, bahkan dapat menggunakan menggunakan alat-alat kemajuan teknologi misalnya mesin scanner.
  4. Berbedanya dengan tes uraian, maka tes objektif memberikan kemungkinan kepada orang lain untuk ditugasi atau dimintai bantuan guna mengoreksi hasil tes tersebut.
  5. Butir-butir soal pada tes objektif jauh lebih mudah dianalisis, baik dari segi derajat kesukarannya, daya pembedanya, validitas maupun reliabilitasnya.

Adapun dari segi kelemahan dari tes objektif antara lain adalah:

  1. Menyusun butir-butir soal tes objektif adalah tidak semudah seperti halnya menyusun tes uraian.
  2. Tes objektif pada umumnya kurang dapat mungukur atau mengungkap proses berpikir tinggi atau mendalam.
  3.  Dengan tes objektif, terbuka kemungkinan bagi testee untuk bermain spekulasi, tebak terka, adu untung dalam memberikan jawaban soal.
  4. Cara memberikan jawaban soal pada tes objektif dimana dipergunakan simbol-simbol huruf yang sifatnya seragam seperti A, B, C, D dan sebagainya ini memungkinkan peluang bagi testee untuk saling bekerja sama.

 E.     Petunjuk Penggunaan Tes Objektif

Dengan tujuan agar tes objektif betul-betul dapat menjalankan fungsinya sebagai alat pengukur hasil belajar, maka petunjuk operasional berikut ini kiranya dapat dijadikan pedoman dalam menyusun butir-butir item obyektif.

Pertama, untuk dapat menyusun butir-butir soal tes objektif yang bermutu tinggi, pembuat tes (dalam hal ini guru, dosen dan lain-lain) harus membiasakan diri dan sering berlatih, sehingga dari waktu ke waktu ia akan dapat merancang dan menyusun butir-butir soal tes objektif dengan lebih baik dan lebih sempurna.

Kedua, setiap kali alat pengukur hasil belajar berupa tes obyetif itu selesai digunakan, hendaknya dilakukan penganalisisan item dengan tujuan dapat mengidentifikasi butir-butir item mana yang sudah termasuk dalam kategori “baik” dan butir-butir item mana yang masih termasuk dalam kategori “kurang baik” dan “tidak baik”.

Ketiga, dalam rangka mencegah timbulnya permainan spekulasi dan kerjasama yang tidak sehat di kalangan testee, perlu disiapkan terlebih dahulu suatu norma yang memperhitungkan faktor tebakan. Norma dimaksud berupa sanksi yang akan diberikan kepada testee, di mana untuk setiap butir item yang dijawab salah, kepada testee yang bersangkutan akan dikenai denda berupa pengurangan skor. Dengan cara demikian maka testee diharapkan akan bekerja secara jujur dan berusaha menjawab soal menurut keyakinannya sendiri, sebab bukan mungkin bahwa “pertolongan” yang diperoleh dari kalimat testee lainnya justru akan menjadi “mala petaka” bagi dirinya sendiri.

Keempat, agar tes obyektif disamping mengungkap aspek ingatan atau hafalan juga dapat mengungkap aspek-aspek berpikir yang lebih dalam, maka dalam merancang dan menyusun butir-butir item tes obyektif hendaknya tester menggunakan alat bantu berupa tabel spesifikasi soal atau yang sering dikenal dengan istilah blue print atau kisi-kisi soal. Dengan menggunakan alat bantu tersebut diharapkan akan terjadi keseimbangan antara butir soal (yang jumlahnya cukup banyak itu) dengan aspek-aspek psikologis (yang seharusnya diungkapkan dalam tes tersebut).

Kelima, dalam menyusun  kalimat soal-soal tes obyektif, bahasa atau istilah-istilah yang dipergunakan hendaknya cukup sederhana, ringkas, jelas dan mudah dipahami oleh testee. Susunan kalimat yang berkepanjangan istilah-istilah yang tidak jelas atau meragukan dapat berakibat terjadinya hambatan bagi testee untuk memberikan jawabannya.

Keenam, untuk mencegah terjadinya silang pendapat atau perbedaan antara testee dengan tester, dalam menyusun butir-butir soal tes obyektif hendaknya diusahakan sungguh-sungguh agar tidak ada butir-butir yang dapat mengahasilkan penafsiran ganda atau kerancuan dalam pemberian jawabannya.

Ketujuh, cara memenggal atau memutus kalimat, membubuhkan tanda baca seperti titik, koma dan sebagainya, penulisan tanda-tanda aljabar seperti kuadrat, akar dan sebagainya, hendak ditulis dengan secara benar, usahakan agar tidak terjadi kesalahan ketik atau kesalahan cetak sehingga tidak mengganggu konsentrasi testee dalam memberikan jawaban soal.

Kedelapan, dengan cara bagaimanakah testee seharusnya memberikan jawaban terhadap butir-butir soal yang diajukan dalam tes, hendaknya diberikan pedoman atau petunjuknya secara jelas dan tegas sehingga testee dapat bekerja sesuai dengan petunjuk umum atau petunjuk khusus yang dicantumkan dalam lembar jawaban soal tes.

F.  Jenis-jenis Tes Objekti

1.      Tes Objektif Menjodohkan

a)      Pengertian

Tes menjodohkan adalah butir soal atau tugas yang jawabannya dijodohkan dengan seri jawaban. Dengan kata lain, tugas peserta tes hanya menjodohkan premis dengan salah satu seri jawaban. Tes menjodohkan terdiri atas dua bagian (kolom), yaitu :

1)      Bagian pertama disebut seri stem, atau premis, atau pokok soal yang dapat berbentuk pernyataan atau pertanyaan.

2)      Bagian kedua disebut seri jawaban.

Format tes menjodohkan dapat berbentuk :

(a)    Kolom pertama atau lajur kiri untuk  stem  atau pokok soal

(b)   Kolom kedua atau lajur kanan untuk seri jawaban

b)      Teknik Penyusunan

1)      Pastikan seri pertanyaan  atau pernyataan (kolom pertama/jalur kiri) dan seri jawaban (kolom kedua/jalur kanan) bersifat homogen, agar salah satu dari semua seri jawaban ada kemungkinan sebagai jawaban yang benar.

2)      Pastikan petunjuk mengerjakan tes jelas

3)      Seyogyanya seri pertanyaan atau pernyataan tidak lebih dari lima item, karena kalau lebih akan membingungkan dan mengurangi homogenitas

4)      Seyogyanya seri jawaban lebih banyak dari seri pernyataan atau pertanyaan untuk mendorong peserta tes lebih cermat.

5)      Seyogyanya seri pernyataan (stem) diberi urut dengan menggunakan nomor dan seri jawaban dengan menggunakan huruf.

6)      Seyogyanya tes ditulis dalam halaman yang sama

c)      Kelemahan dan Kelebihan

Kelebihan tes menjodohkan

1)      Sangat baik untuk menguji hasil belajar tentang istilah, definisi, peristiwa, dan penanggalan

2)      Sangat baik untuk menguji kemampuan menghubungkan dua hal yang berhubungan langsung dan tidak langsung

3)      Relatif mudah dikonstruksi, khususnya dalam satu pokok bahasan tertentu.

4)      Relatif dapat menguji banyak bahan ajar yang lebih luas.

5)      Mudah diskor oleh dosen/guru secara langsung atau oleh orang lain, karena sudah ada kunci jawaban

6)      Penskoran hasil kerja peserta tes dapat dikerjakan secara objektif

Kelemahan tes menjodohkan

1)      Ada kecenderungan terlalu menguji kemampuan aspek ingatan

2)      Kurang cocok untuk mengukur hasil belajar secara menyeluruh

3)      Tidak dapat mengukur semua tujuan pembelajaran/kompetensi yang lebih menekankan pada pendemistrasian keterampilan dan pengungkapan sesuatu yang ekspresif

4)      Tidak dapat mengukur hasil belajar yang kompleks, baik dari segi domain maupun dari segi tinngkat kesulitan, khususnya domain afeksi dan motorik.

5)      Tidak dapat mengukur hasil belajar yang mengintegrasikan berbagai konsep atau ide dari berbagai  sumber ke dalam satu pikiran utama

6)      Tidak cocok untuk mengukur hasil belajar  yang mengungkapkan pikiran dalam bentuk tulis sesuai dengan gaya pikir dan gaya bahasa seseorang

d)     Contoh soal

Kelompok A                                            Kelompok B

  1. kekurangan Vitamin C                        a. penyakit rabun ayam
  2. kekurangan vitamin B kompleks         b. Sariawan
  3. kekurangan vitamin B1                       c. penyakit gondok
  4. kekurangan vitamin A                         d. penyakit rakhitis
  5. kekurangan vitamin D                         e. penyakit beri-beri

                                                                       f.  pertumbuhan badan lambat

e)      Cara mengolah skor tipe tes menjodohkan

Rumus untuk mencari skor dalam tes tipe menjodohkan adalah :

Sk = B

Dengan ketentuan :

Sk = skor yang diperoleh peserta tes

B   = jumlah jawaban yang benar

Jadi yang dihitung adalah hanya jawaban yang benar saja, sedangkan jawaban yang salah tidak mempengaruhi skor.

2.      Tes Objektif Pilihan Ganda

1. Pengertian

Tes pilihan ganda adalah butir soal atau tugas yang jawabannya dipilih dari alternatif yang lebih dari dua. Alternatif jawaban kebanyakan berkisar antara 4 (empat) dan 5 (lima). Nitko (2007) menjelaskan tujuan dasar dari tugas penilaian, soal pilihan ganda adalah untuk mengidentifikasi siswa yang telah mencapai tingkat (atau diperlukan) pengetahuan (keterampilan, kemampuan, atau kinerja) cukup dari target pembelajaran yang dinilai. Pilihan ganda terdiri atas dua bagian, yaitu :

1)      Bagian perteama disebut stem yang dapat berbentuk pernyataan atau pertanyaan. Stem menurut Nitko (2007) adalah bagian dari soal yang mengajukan pertanyaan, menetapkan tugas yang harus dilakukan siswa, atau menyatakan masalah yang harus dipecahkan siswa. Dengan menulis stem sehingga siswa mengerti apa tugas yang dilakukan atau pertanyaan apa yang dijawab.

2)      Bagian kedua disebut options atau alternatif jawaban. Nitko (2007) menjelaskan alternatif harus selalu diatur dengan cara yang benar (logis, numerik, abjad, dll). Urutan kronologis di mana peristiwa terjadi dan ukuran benda (besar, menengah, kecil) adalah contoh dari perintah logis. Jika tidak ada urutan logis atau numerik di antara mereka, alternatif harus diatur dalam urutan abjad. Alasannya pertama adalah bahwa tidak membangun pola yang dapat menjadi petunjuk jawaban untuk siswa yang tidak tahu jawaban. Kedua, mengikuti aturan ini dapat menghemat waktu siswa.

Alternatif jawaban terdiri atas dua unsur, yaitu :

a)      Kunci jawaban sebagai jawaban yang benar

b)      Alternatif bukan kunci disebut dengan pengecoh atau distractor atau foils

Tes pilihan ganda ada beberapa macam, yaitu :

1)      Pilihan ganda biasa

2)      Pilihan ganda analisis hubungan antar hal

3)      Pilihan ganda analisis kasus

4)      Pilihan ganda kompleks

5)      Pilihan ganda menggunakan gambar, grafik, atau tabel

  1. Teknik Penyusunan

1)      Menyusun “stem” soal

Yang Dilakukan

Yang dihindari

  1. Kalau memungkinkan, tulis dengan pertanyaan langsung
  2. Jika melengkapi kalimat yang digunakan, pastikan :

–          Stem dinyatakan dengan pertanyaan langsung

–          Pilihan diletakkan pada akhir dari kalimat

  1. Mengontrol susunan kata-kata sehingga  kosa kata dan struktur kalimat
  2. Dalam soal tes definisi,  tempatkan kata atau istilah dalam stem dan gunakan definisi atau gambaran pada alternatif jawaban
  3. Hindari kata atau ungkapan  asing, berlebihan, dan tidak berguna yang dapat menjadi “window dressing
  4. Hindari menggunakan soal negatif
  5. Hindari ungkapan pada soal sehingga pendapat sendiri dari penempuh ujian menjadi pilihan.
  6. Hindari susunan kata yang “textbook atau ungkapan berupa kalimat klise
  7. Hindari  soal-soal yang memberi “petunjuk” dan “pengait”

2)      Menyusun Pilihan dan Pengecoh

Yang dilakukan Yang dihindari
  1. Pada umumnya berusaha membuat tiga sampai lima pilihan
  2. Semua pilihan harus sejenis dan  tepat dengan “stem
  3. Meletakkan pengulangan kata dan ungkapan pada “stem
  4. Konsisten menggunakan dan  tanda baca yang benar yang berhubungan dengan “stem”
  5. Mengatur pilihan dalam daftar susunan daripada berurutan
  6. Mengatur urutan  pilihan secara logis dan bermakna
  7. Semua pengecoh secara gramatikal harus benar dengan mengikuti kepada “stem”
  8. Hindari tumpang tindih pada pilihan
  9. Hindari membuat pilihan kumpulan dari soal benar salah
  10. Hindari menggunakan “not given” “tidak ada yang di atas” dan lain-lain sebagai pilihan dalam tipe jenis soal jawaban paling benar (gunakan pada jenis jawaban benar)
  11. Hindari menggunakan “semua yang ada di atas” : batasi penggunaannya pada jenis jawaban benar
  12. Hindari menggunakan petunjuk lisan pada pilihan
  13. Hindari menggunakan istilah teknis, kata yang tidak diketahui atau penamaan dan istilah lucu atau penamaan sebagai pengecoh
  14. Hindari membuat pilihan lebih susah untuk menyisihkan pengecoh sehingga memilih kunci jawaban

3)      Menyusun Pilihan yang Benar

a)      Umumnya hanya ada satu jawaban benar atau jawaban terbaik pada soal pilihan ganda

b)      Pastikan ahli yang kompeten dapat menyetujui yang menjadi kunci jawaban yang benar adalah fakta yang benar

c)      Jawaban yang benar harus secara gramatikal benar untuk menjawab “stem

d)     Memeriksa kembali seluruh tes untuk memastikan pilihan yang benar tidak mengikuti pola yang mudah dipelajari

e)      Hindari ungkapan pada pilihan benar yang textbook atau gaya klise

f)       Pilihan benar harus yang kira-kira secara keseluruhan sama kedalamannya sebagai pengecoh

g)      Keuntungan tes pilihan ganda adalah mengurangi  jumlah waktu yang digunakan untuk menulis jawaban, dengan demikian membiarkan penilaian mencakup lebih banyak bahan.

  1. Kelemahan dan Kelebihan

Beberapa tahun kita dapat melihat banyak penggunaan tes pilihan ganda dalam proses penilaian hasil belajar siswa. Contohnya tes ini digunakan pada ujian akhir nasional baik di SD, SMP, maupun SMA. Menurut Popham (1995) soal pilihan ganda dapat digunakan untuk mengukur pengetahuan milik siswa atau kemampuan seorang siswa dalam berpikir dengan tingkat tinggi. Kekuatan dari soal pilihan ganda adalah tes ini adalah memuat beberapa jawaban yang berbeda dalam yang saling berhubungan kebenarannya. Sehingga ujian dapat kita sebut untuk membuat perbedaan hampir tidak kentara diantara pilihan jawaban, beberapa yang mungkin menjadi sedikit benar.

Sedangkan menurut Nitko (2007) merinci beberapa kelebihan dari tes pilihan ganda ini, yakni sebagai berikut:

1)      Format pilihan ganda dapat digunakan untuk menilai berbagai jenis keragaman target pembelajaran dibandingkan format soal pilihan jawaban lainnya.

2)      Soal pilihan ganda tidak memerlukan siswa untuk menulis dan menguraikan jawaban mereka dan sehingga mengurangi kesempatan untuk siswa berkemampuan kurang untuk “menipu” jawaban mereka.

3)      Tes pilihan ganda fokus pada membaca dan berpikir.  Tes tidak menuntut siswa untuk menggunakan proses menulis dalam kondisi pemeriksaan.

4)      Siswa  memiliki sedikit kesempatan untuk  menebak jawaban yang benar untuk soal pilihan ganda daripada soal benar-salah atau soal mencocokkan.

5)      Pilihan untuk pengecoh siswa mungkin memberikan kita diagnosis pengetahuan yang dalam tentang siswa yang mengalami kesulitan.  Namun, untuk pengecoh untuk membuatnya harus berhati-hati sehingga pengecoh menarik siswa yang biasa membuat kesalahan atau yang biasa memiliki kesalahpahaman.

Lebih rincinya tes pilihan ganda ini memiliki kelebihan sebagai berikut :

1)      Dapat mengukur semua tujuan pembelajaran/kompetensi khususnya domain kognisi, dari yang paling sederhana sampai yang paling kompleks

2)      Dapat menggunakan tes yang relatif banyak yang mewakili bahan ajar yang lebih luas

3)      Penskoran hasil kerja peserta tes dapat dikerjakan secara  objektif

4)      Penskoran hasil kerja peserta tes dapat dikerjakan oleh mesin atau orang lain secara objektif, karena sudah ada kunci jawaban

5)      Menuntut kecermatan yang tinggi untuk membedakan jawaban yang paling benar di antara jawaban yang benar

6)      Dapat mengurangi kesempatan menebak, karena option-nya lebih dari dua

7)      Tingkat kesukaran butir tes relatif dapat dikendalikan dengan mengubah tingkat homogenitas alternatif jawaban

Kelemahan tes pilihan ganda

Setiap tes memiliki kelemahan tersendiri, menurut Popham (1995) tes ini hanya perlu mengenali sebuah jawaban benar. Tes ini tidak butuh menghasilkan jawaban benar. Sedangkan Nitko (2007) menjelaskan beberapa kelemahan dari soal pilihan ganda, yaitu sebagai berikut :

1)      Siswa harus memilih diantara daftar pilihan yang telah ditetapkan, bukan menciptakan atau mengekspresikan ide-ide atau solusi mereka sendiri.

2)      Kelemahan dalam penulisan tes pilihan ganda akan menjadikan soal dangkal, sepele, dan terbatas pada pengetahuan yang faktual.

3)      Karena biasanya hanya satu pilihan dari soal yang sebagai kunci yang benar, siswa yang pintar menjadi dihukum untuk tidak memilih jawaban yang benar. Siswa yang pintar dapat mendeteksi cacat dalam soal pilihan ganda karena ambiguitas dari kata-kata, sudut pandang yang berbeda, atau pengetahuan mata pelajaran tambahan, sedangkan siswa lain tidak mungkin mendeteksinya.

4)      Soal pilihan ganda cenderung berdasarkan pada pengetahuan “standar,” “adakan,” atau “disahkan”. Masalah siswa memecahkan pada soal pilihan ganda cenderung sangat terstruktur dan tertutup (telah memiliki satu jawaban yang benar). Ini memberikan kesan bahwa semua masalah dalam bidang mata pelajaran memiliki satu jawaban yang benar, yang dapat mendorong siswa untuk menempatkan kepercayaan yang berlebihan pada kebenaran figur otoritas atau mungkin menggambarkan suatu subyek yang memiliki basis pengetahuan yang tetap dan terbatas. Selanjutnya, sehingga guru menggunakan tes pilihan ganda yang gagal untuk menggunakan soal yang terkait dengan bahan penafsiran yang realistis, hasil tes ini tidak memiliki konteks dunia nyata. Hal ini disebut sebagai pengetahuan yang tidak kontekstual. Akibatnya, tes tidak dapat menilai apakah siswa dapat menggunakan apa yang telah mereka pelajari dalam kondisi yang berarti dan nyata.

5)      Penggunaan pengujian pilihan ganda yang secara berlebihan untuk kepentingan penilaian  dapat membentuk pendidikan dengan cara yang tidak diinginkan. Penolakan pada tes soal pilihan ganda ini menunjukkan penilaian yang guru gunakan dapat membentuk muatan dan jenis pengajaran yang guru berikan pada siswa. Jika merancang tinggi penilaian soal pilihan ganda yang memusatkan pada pengetahuan nyata, guru cenderung untuk menggunakan teknik latihan dan pratek untuk mempersiapkan siswa untuk melakukan penilaian dengan soal pilihan ganda. Jika tes mengandung soal pilihan ganda yang digunakan menilai pengetahuan dan menerapkan berpikir tingkat tinggi, strategi mengajar latihan dan praktek tidaklah efektif.

Lebih lanjut kelemahan tes pilihan ganda ini dapat dirinci sebagai berikut:

1)      Sukar dikonstruksi, khususnya mencari alternatif jawaban yang homogen

2)      Ada kecenderungan hanya menguji kemampuan ingatan domain kognisi

3)      Kurang cocok untuk mengukur hasil belajar  yang menyeluruh atau total

4)      Testwise mempunyai pengaruh pada hasil tes peserta karena faktor kebiasaan

5)      Tidak dapat mengukur semua tujuan pembelajaran/kompetensi yang lebih menekankan pada pendemonstrasian keterampilan dan pengungkapan sesuatu yang ekspresif

6)      Tidak dapat mengukur hasil belajar yang komplesk, baik dari segi domain maupun dari segi tingkat kesulitan, khususnya domain afeksi dan motorik

7)      Tidak dapat mengukur hasil belajar yang mengintegrasikan berbagai konsep atau ide dari berbagai sumber ke dalam satu pikiran utama

  1. Jenis-jenis Soal Pilihan Ganda dan Contohnya

1)      Melengkapi Pilihan

Soal dalam bentuk ini terdiri atas kalimat pokok yang berupa pernyataan yang belum lengkap diikuti oleh empat atau lima kemungkinan jawaban yang dapat melengkapi pernyataan tersebut. Responden atau testee diminta untuk memilih salah satu dari kelima kemungkinan jawaban yang tersedia. Dalam bentuk ini hanya satu jawaban benar, seperti dalam contoh diatas, dan perhatikan contoh soal berikut ini:

  1. Hak yang tersebut dibawah ini TIDAK termasuk prerogatif presiden.
  2. Interpelasi
  3. Grasi
  4. Amnesti
  5. Abolisi
  6. Rehabilitas
    1. Bahan-bahan berikut dapat menimbulkan pencemaran lingkungan hidup, kecuali:
    2. Insektisida
    3. Pestisida
    4. Buangan minyak bumi
    5. Busa detergen
    6.  Pupuk hijau

Dalam bentuk soal tersebut kita dapat mengenal adanya variasi lain, yaitu variasi bentuk “tidak” dan variasi bentuk “kecuali”. Kedua bentuk ini memerlukan kemampuan diskriminatif dari yang dites.

2)      Pilihan Ganda Analisis Hubungan Antar Hal

Pada bentuk soal hubungan antarhal, siswa dituntut untuk mengidentifikasi hubungan sebab-akibat antara pernyataan pertama (yang merupakan akibat) dan pernyataan kedua (yang merupakan sebab). Kedua pernyataan (pertama dan kedua) dihubungkan dengan kata “sebab”. Kedua pernyataan itu dapat benar, salah, atau dapat juga pernyataan yang satu benar, yang lain salah. Apabila kedua pernyataan itu benar, yang perlu diperhatikan ialah apakah kedua pernyataan itu mempunyai hubungan sebab-akibat. Contoh:

Petunjuk:

Untuk soal berikut pilihlah:

  1. Jika pernyataan pertama betul, pernyataan kedua betul dan keduanya mempunyai hubungan sebab-akibat.
  2. Jika pernyataan pertama betul, pernyataan kedua betul, tetapi keduanya tidak mempunyai hubungan sebab-akibat.
  3. Jika salah satu dari kedua pernyataan salah.
  4. Jika kedua pernyataan salah.

Soal:

Transmigrasi sangat penting peranannya dalam pelaksanaan pembangunan

Sebab

Transmigrasi dapat menunjang pemerataan pelaksanaan pembangunan.

(kunci: a)

3)      Pilihan Ganda Analisis Kasus

Soal test bentuk ini merupakan simulasi keadaan nyata; jadi seolah-olah yang diuji diharapkan kepada keadaan sebenarnya. Kasus yang diberikan biasanya berupa cerita atau uraian tentang kejadian, situasi, proses dan hasil percobaan ataupun penelitian, yang ada hubungannya dengan bidang studi atau mata pelajaran yang akan diujikan. Dari satu kasus dapat dibuat lebih dari satu pertanyaan atau soal didahului oleh satu kasus. Contoh:

Petunjuk:

Untuk soal berikut ini disediakan suatu teks yang harus dipahami secara cermat. Kemudian menyusul soal-soal yang memasalahkan hal-hal yang berhubungan dengan isi teks. Pilih salah satu jawaban yang paling tepat pada soal-soal yang mengiringi teks.

Pada suatu waktu disuatu daerah banyak terdapat awan, udara panas, dan kilat serta halilintar silih berganti. Yang menyebabkan udara menjadi panas ialah:

(a). Matahari tidak kelihatan

(b). Kilat dan halilintar

(c). Hujan akan turun

(d). Penguapan tertahan

4)      Pilihan Ganda Melengkapi Berganda (asosiasi pilihan ganda)

Bentuk soal ini hampir sama dengan bentuk soal “melengkapi pilihan”, yaitu satu pernyataan yang tidak lengkap diikuti dengan beberapa kemungkinan. Perbedaannya ialah, pada bentuk “melengkapi berganda” ini kemungkinan yang benar satu, dua, tiga, atau empat. Contoh:

Petunjuk:

Dibawah ini terdapat soal-soal yang mempunyai kejadian yang dapat timbul bersama.

Pilihlah:

a.       Jika (1), (2), dan (3) benar

b.       Jika (1) dan (2) benar

c.       Jika (2) dan (4) benar

d.       Jika hanya (4) yang benar

e.       Jika semuanya benar

Soal: Salah satu vitamin yang larut dalam lemak adalah vitamin A yang terdapat didalam:

(1)  Minyak ikan dan telur

(2)  Bayam dan kubis

(3)  Air susu dan wortel

(4)  Kecambah dan buah-buahan yang asam

 

5)      Pilihan Ganda dengan Pemakaian Diagram, Grafik, atau Tabel

Bentuk ini mempermasalahkan atau mengacu pada gambar, diagram grafik, dan sejenisnya. Yang ditanyakan adalah kelainan, keadaan, atau gejala yang terungkap didalamnya. Permasalahannya diajukan dengan suatu gambar, diagram, atau grafik yang bersangkutan. Bentuk soalnya sama dengan bentuk “melengkapi lima pilihan”.

 Contoh:

Grafik berikut menggambarkan konsumsi bensin di Provinsi A dalam tujuh tahun terakhir

Jika kecenderungan konsumsi tersebut berlanjut, berapa juta liter perkiraan konsumsi bensin pada tahun ke-8

  1. 40
  2. 43
  3. 44
  4. 45
  5. 47
  1. Cara Mengolah Skor Tes Pilihan Ganda

Rumus untuk mencari skor dalam tes tipe pilihan ganda ada 2 macam, yaitu :

1)      Sistem Denda

Rumus skor dengan sistem denda adalah :

Dengan ketentuan

Sk = skor yang diperoleh peserta tes

B  = jumlah jawaban yang benar

S  = jumlah jawaban yang salah

P  = banyaknya pilihan (option)

1   = bilangan tetap

Contoh :

     Jumlah soal tes ganda = 20 butir soal. Pilihan jawaban (option) sebanyak 5 buah. Kartika dapat menjawab dengan betul sejumlah 13 butir soal, jawaban yang salah berjumlah 4 butir soal dan 3 butir soal tidak dikerjakan. Maka skor untuk Kartika adalah  :

Kelebihan sistem denda akan mengurangi kemungkinan peserta tes untuk berspekulasi (untung-untungan) dalam menjawab soal tes, namun kelemahannya ada kemungkinan seorang peserta tes memperoleh skor negatif.

2)       Sistem Tanpa Denda

Rumus skor dengan sistem tanpa denda adalah :

Sk = B

Dengan ketentuan :

Sk      = skor yang diperoleh peserta tes

B        = jumlah jawaban yang benar

Jadi yang dihitung adalah hanya jawaban yang benar saja, sedangkan jawaban yang salah tidak mempengaruhi skor.

Apabila jawaban Kartika dalam contoh di atas menggunakan sistem tanpa denda, maka Kartika memperoleh skor = 13

Kekurangan sistem tanpa denda adalah mendorong peserta tes berspekulasi (untung-untungan) dalam menjawab soal tes, namun kelebihannya adalah tidak ada peserta tes yang memperoleh skor negatif.

3.      Tes Objektif Benar Salah

  1. Pengertian

Tes benar salah adalah butir soal atau tugas yang berupa pernyataan yang jawabannya menggunakan pilihan pernyataan benar atau salah. Alternatif jawaban dapat berbentuk:

1)      Benar-salah

2)      Setuju-tidak setuju

3)      Baik-tidak baik

  1. Teknik Penyusunan

1)      Pastikan pernyataan tes bersifat absolut benar atau salah sesuai dengan kondisinya.

2)      Pastikan tes pernyataan mengukur hasil belajar yang sesuai dengan kompetensi yang dikembangkan

3)      Pastikan kunci jawaban benar

4)      Pastikan petunjuk mengerjakan tes jelas

5)      Hindari tes tentang pernyataan yang masih diperdebatkan

6)      Pastikan pernyataan tidak menggunakan ungkapan atau kata-kata yang bermakna tidak tentu, misalnya kata kebanyakan, sering kali, kadang-kadang, selalu, dan sejenisnya

7)      Seyogyanya jumlah antara jawaban yang benar dan yang salah seimbang

  1. Kelemahan dan Kelebihan

Kelebihan tes benar salah

1)      Sangat baik untuk menguji hasil belajar tentang fakta dan ingatan

2)      Relatif mudah dikonstruksi, khususnya dalam satu pokok bahasan tertentu

3)      Relatif dapat menguji banyak bahan ajar yang lebih luas

4)      Mudah diskor oleh dosen/guru secara langsung atau oleh orang lain, karena sudah ada kunci jawaban

5)      Penskoran hasil kerja peserta tes dapat dikerjakan secara objektif

6)      Petunjuk cara mengerjakan mudah dimengerti

Kelemahan tes benar-salah

1)      Sering membingungkan bagi mereka yang tidak mengetahui secara pasti

2)      Lebih mendorong peserta tes untuk menebak jawaban, khususnya ketika ia tidak mengetahui jawabannya. Sebab, kemungkinan untuk benar sebanding dengan kemungkinan untuk salah.

3)      Ada kecenderungan terlalu menguji kemampuan aspek ingatan

4)      Ada kecenderungan mendidik berpikir “hitam-putih”, padahal kebanyakan hasil belajar bukanlah sesuatu yang memiliki kebenaran absolut

5)      Banyak masalah yang tidak dapat dinyatakan dengan kemungkinan benar atau salah

6)      Kurang cocok untuk mengukur hasil belajar yang menyeluruh

7)      Tidak dapat mengukur semua tujuan pembelajaran/kompetensi yang lebih menekankan pada pendemonstrasian keterampilan dan pengungkapan sesuatu yang ekspresif

8)      Tidak dapat mengukur hasil belajar yang kompleks, baik dari segi domain maupun dari segi tingkat kesulitan, khususnya domain afeksi dan motorik

9)      Tidak dapat mengukur hasil belajar yang mengintegrasikan berbagai konsep atau ide dari berbagai sumber ke dalam satu pikiran utama

  1. Contoh soal
  1. B — S       Gaya adalah sesuatu yang mengubah bentuk benda.
  2. B — S       25% dari 44 adalah kurang dari 12
  3. B — S       UUD 1945 telah diamandemen sebanyak 4 kali
  4. B — S       UUD 1945 tidak boleh dirubah substansinya.
  1. Cara Mengolah Skor Tes Tipe Benar-Salah

1)      Sistem Denda

Rumus skor dengan sistem denda adalah :

Sk = B – S

Dengan ketentuan :

Sk = skor yang diperoleh peserta tes

B   = jumlah jawaban yang benar

S    – jumlah jawaban yang salah

Contoh :

Jumlah soal tes = 100 butir soal. Ahmad dapat menjawab dengan betul sejumlah 70 butir soal, jawaban yang salah berjumlah 25 butir soal dan 5 butir soal tidak dikerjakan. Maka skor untuk Ahmad adalah :

            70 – 25 = 45

Kelebihan system denda akan mengurangi kemungkinan peserta tes untuk berspekulasi (untung-untungan) dalam menjawab soal tes, namun kelemahannya ada kemungkinan seorang peserta memperoleh skor negatif.

2)      Sistem Tanpa Denda

Rumus skor dengan sistem tanpa denda adalah :

Sk = B

Dengan ketentuan

Sk = skor yang diperoleh peserta tes

B   = jumlah jawaban yang benar

Jadi yang dihitung adalah hanya jawaban yang benar saja, sedangkan jawaban yang salah tidak memengaruhi skor akhir.

Apabila jawaban Ahmad dalam contih di atas menggunakan sistem tanpa denda, maka Ahmad memperoleh skor = 70.

Kekurang sistem tanpa denda adalah mendorong peserta tes untuk berspekulasi (untung-untungan) dalam menjawab soal tes, namun kelebihannya adalah tidak ada peserta tes yang memperoleh skor negatif.

  1. Tes Obyektif Bentuk Isian Melengkapi (Completion Test)
  2. Pengertian

Tes melengkapi adalah butir soal atau tugas yang jawabannya diisi oleh peserta tes dengan melengkapi satu kata, satu frasa, satu angka, satu rumus, atau satu formula. Butir soal ini berupa kalimat pernyataan yang belum selesai sehingga peserta harus melengkapi kalimat penyataan tersebut.

  1. Teknik Penyusunan

Ebel (Azwar, 2012: 101) mengemukakan beberapa petunjuk dalam penulisan item soal tes isian melengkapi agar dapat dicapai kualitas item yang baik. Petunjuk itu antara lain:

1)      Pertanyaan atau pernyataan soal harus ditulis dengan hati-hati sehingga dapat dijawab dengan hanya satu jawaban yang pasti

Kurang baik:

Sapi adalah hewan…

Komentar: Jawaban pelengkap terhadap aiteini sangat banyak yang dianggap benar, tergantung bagaimana siswa menangkap maksud item, yang sangat mungkin tidak sesuai dengan keinginan penulis item. Walaupun penulis item menghendaki satu jawaban yang benar, akan tetapi jawaban seperti “berkaki empat”, “pemakan rumput”, “berguna”, “jinak”, dan sebagainya, semuanya tidak dapat disalahkan.

Lebih baik:

Makanan sapi adalah…

2)      Sebaiknya rumuskan jawabannya lebih dahulu baru kemudian menulis pertanyaannya.

Petunjuk ini sesuai dengan sifat item tipe jawaban melengkapi yang memang memusat pada jawaban yang diinginkan. Dengan menulis pertanyaan sambil memperhatikan jawaban yang kita kehendaki maka dapat dijaga bahwa hanya akan ada satu jawaban yang layak diberikan terhadap item.

3)      Gunakan pertanyaan lagsung, kecuali bilamana model kalimat tak selesai akan memungkinkan jawaban yang lebih jelas.

Baik:

Makhluk hidup membutuhkan makan untuk…

4)      Usahakan agar dalam pertanyaan tidak terdapat petunjuk yang mungkin digunakan oleh subjek dalam jawaban item

Kurang baik:

Mesin uap dijalankan oleh mesin yang digerakkan oleh tenaga……..

Komentar: untuk mengetahui jawaban pertanyaan seperti demikian ini, seseorang yang tidak belajar dapat memanfaatkan kata-kata yang memberi petunjuk. Karena namanya mesin uap, tentu saja digerakkan oleh tenaga uap.

5)      Jangan menggunakan kata atau kalimat yang langsung dikutip dari buku.

Kurang baik:

Jumlah skor dibagi oleh banyak skor adalah…

Komentar: Kalimat di atas tidak lebih daripada kutipan batasan pengertian harga rata-rata atau mean. Pertanyaan demikian itu hanya mengungkap kemampuan menghafal dan tidak mengukur pengertian.

Lebih baik:

Lima orang siswa mempunyai 270 permen. Rata-rata permen yang dimiliki seorang siswa adalah…

  1. Kelemahan dan Kelebihan

1)      Kelebihan tes jawaban melengkapi

a)      Relatif mudah dikonstruksi apabila jawabannya sudah pasti.

b)      Lebih cocok untuk mengukur kemampuan mengingat fakta dan prinsip sederhana.

c)      Mampu menguji sebagian besar pokok bahasan dalam waktu relatif singkat.

d)     Cocok untuk mengukur kemampuan pemecahan masalah sederhana dalam bidang matematika.

e)      Peserta tes harus mengisi jawaban, bukan memilih jawaban.

2)      Kelemahan tes jawaban melengkapi

a)      Kurang dapat menguji semua tingkat kemampuan hasil belajar, karena keterbatasan jawaban satu kata, frasa, angka, atau formula.

b)      Lebih menekankan kemampuan mengingat.

c)      Relatif sulit dikonstruksi apabila jawabannya tidak pasti.

d)     Tidak dapat mengukur hasil belajar yang kompleks, baik dari segi domain maupun dari segi tingkat kesulitan, khususnya domain kognisi dan afeksi.

e)      Tidak dapat mengukur hasil belajar yang mengintegrasikan berbagai konsep atau ide dari berbagai sumber ke dalam satu pikiran utama.

f)       Tidak cocok mengukur hasil belajar yang mengungkapkan pikiran dalam bentuk tulis sesuai dengan gaya pikir dan gaya bahasa sendiri.

  1. Contoh soal
    1. Teori kritik sastra Arab klasik disebut …
    2. Teori strukturalisme genetik dikembangkan oleh …
    3. Karya agung Kahlil Gibran …
  1. G.    Penyusunan Kisi-kisi dan Butir Soal
    1. Penentuan dan Penyebaran Soal

Sebelum menyusun kisi-kisi dan butir soal perlu ditentukan jumlah soal setiap kompetensi dasar dan penyebaran soalnya. Untuk lebih jelasnya, perhatikan contoh penilaian akhir semester berikut ini.

Contoh penyebaran butir soal untuk penilaian akhir semester ganjil

No

Kompetensi

Dasar

Materi

Jumlah soal tes tulis

Jumlah soal

Praktik

PG

Uraian

1

1.1 …………

………..

6

2

1.2 …………

………..

3

1

3

1.3 …………

………..

4

1

4

2.1 …………

………..

5

1

5

2.2 …………

………..

8

1

6

3.1 …………

………..

6

1

7

3.2 ………..

………..

2

8

3.3 ……….

………..

8

Jumlah soal

40

5

2

  1. Penyusunan Kisi-kisi

Kisi-kisi (test blue-print atau table of specification) merupakan deskripsi kompetensi dan materi yang akan diujikan. Tujuan penyusunan kisi-kisi adalah untuk menentukan ruang lingkup dan sebagai petunjuk dalam menulis soal. Kisi-kisi dapat berbentuk format atau matriks seperti contoh berikut ini.

FORMAT KISI-KISI PENULISAN SOAL

 

Jenis sekolah      : ………………      Jumlah soal          :………………………

Mata pelajaran   : …………………      Bentuk soal/tes    : …………………………….

Alokasi waktu      :           ………………………

No.

Standar Kompetensi

Kompetensi Dasar

Kls/

smt

Materi

pokok

Indikator soal

Nomor

soal

Keterangan:

Isi pada kolom 2, 3. 4, dan 5 adalah harus sesuai dengan pernyataan yang ada di dalam silabus/kurikulum. Penulis kisi-kisi tidak diperkenankan mengarang sendiri, kecuali pada kolom 6.

Kisi-kisi yang baik harus memenuhi persyaratan berikut ini.

  1. Kisi-kisi harus dapat mewakili isi silabus/kurikulum atau materi yang telah diajarkan secara tepat dan proporsional.
  2. Komponen-komponennya diuraikan secara jelas dan mudah dipahami.
  3. Materi yang hendak ditanyakan dapat dibuatkan soalnya.
  1. H.    Analisis Tes

Analisis tes dilaksanakan untuk mengetahui baik-buruknya suatu tes, meliputi empat hal yakni:

  1. Analisis validitas tes.

Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes Tes yang valid (absah = sah) adalah tes benar-benar mengukur apa yang hendak diukur. Tes matematika kelas dua SMP, hendaknya benar-benar mengukur hasil belajar matematika siswa SMP kelas dua; bukan siswa SMP kelas tiga atau siswa SD kelas enam. Dan bukan mengukur hasil belajar dalam bidang studi lainnya. Tes yang disusun untuk mengukur hasil belajar mata pelajaran Bahasa Indonesia pada kelas tertentu, hendaknya tidak menyimpang sehingga mengukur hasil belajar matematika, IPS, atau Bahasa Indonesia pada tingkat/kelas lain.

Macam-macam validitas tes hasil belajar dan cara mengetahui /menghitung koefisien validitas tes.

  1. Validitas permukaan (face validity)

Tingkat validitas permukaan diketahui dengan melakukan Analisis rasional (semata-mata berdasarkan pertimbangan logis, bukan pada hitungan angka-angka empirik). Berbagai aspek berikut ini perlu dianalis/diperiksa kualitasnya.

1)      Apakah bahasa dan susunan kalimat (redaksi) tiap butir soal cukup jelas dan sesuai dengan kemampuan siswa ?

2)      Apakah isi jawaban yang diminta tidak membingungkan ?

3)      Apakah cara menjawab sudah dipahami siswa ?

4)      Jangan sampai siswa tahu isi jawabannya tetapi tidak tahu bagaimana cara menjawab soal bersangkutan.Apakah tes itu telah disusun berdasar kaidah/prinsip penulisan butir soal?

Tes yang tidak mengikuti kaidah penulisan butir soal akan tampaksemrawut sehingga membingungkan siswa. Setiap tes paling sedikit harus diperiksa melalui analisis validitas permukaan. Walaupun analisis ini tergolong paling lemah, namun lebih baik daripada tidak ada analisis sama sekali. Tentu saja akan lebih baik bila suatu tes dianalisis lebih lanjut.

  1. Validitas isi (content validity)

Tingkat validitas isi juga dapat diketahui dengan analisis rasional. Pada prinsipnya dilakukan pemeriksaan terhadap tiap butir soal, apakah sudah sesuai dengan TIK atau pokok bahasan yang akan diteskan. Pengujian validitas isi dilakukan dengan menjawab pertanyaan berikut.

1)      Apakah keseluruhan tes telah sesuai dengan kisi-kisi ?

Kisi-kisi adalah suatu bagan atau matrik yang menggambarkan penyebaran soal-soal sesuai dengan aspek atau pokok bahasan yang hendak diukur, tingkat kesukaran dan jenis soal. Kisi-kisi itu harus disusun sedemikian rupa sehingga mencakup seluruh bahan pelajaran yang akan diteskan.

2)      Apakah terdapat butir soal yang menyimpang, atau menuntut jawaban di luar bahan pelajaran bersangkutan ?

Penyimpangan yang tidak kentara perlu dihilangkan. Semakin banyak soal yang menyimpang, semakin rendah tingkat validitas isi.

  1. Validitas kriteria (criterion validity)

Validitas ini diketahui dengan cara empirik, yakni menghitung koefisien korelasi antara tes bersangkutan dengan tes lain sebagai kriterianya. Yang dapat digunakan sebagai kriteria adalah tes yang sudah dianggap valid; atau nilai mata pelajaran yang sama yang dipandang cukup obyektif. Sebagai contoh, skor tes Bahasa Inggris buatan guru dikorelasikan dengan skor tes Bahasa Inggris yang telah dibakukan. Skor tes Matematika akhir tahun dikorelasikan dengan nilai rata-rata Matematika selama satu tahun.

Dengan rumus korelasi Pearson’s Product Moment dan menggunakan kalkulator, perhitungan validitas kriteria tersebut tidak terlalu sulit. Lebih mudah lagi bila menggunakan komputer. Kesulitan utama dalam menentukan validitas kriteria ialah mencari skor tes yang akan dijadikan kriteria. Bila kriterianya buruk atau tidak valid, maka validitas tes yang diperoleh akan percuma saja.

  1. Validitas ramalan (predictive validity)

Validitas ini menunjukkan sejauh mana skor tes bersangkutan dapat digunakan meramal keberhasilan siswa di masa mendatang dalam bidang tertentu. Cara menghitungnya sama seperti validitas kriteria, dalam hal ini skor tes dikorelasikan dengan keberhasilan siswa di masa datang. Misalnya antara nilai UAN (Ujian Akhir Nasional) di SMP, dengan prestasi belajar di SMA dalam mata pelajaran yang sama.

Suatu tes yang baik biasanya memiliki angka validitas 0,50 atau lebih; tentu saja angka itu makin tinggi makin baik. Suatu tes dengan angka validitas kurang dari 0,50 belum tentu buruk. Mungkin kriterianya yang buruk atau keliru menentukan kriteria.

  1. Analisis reliabilitas tes.

Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg/konsisten (tidak berubah-ubah). Sebaliknya, tes yang tidak reliabel seperti karet untuk mengukur panjang, hasil pengukuran dengan karet dapat berubah-ubah (tidak konsisten).

Cara mengetahui reliabilitas tes Ada tiga cara mengetahui reliabilitas tes. Pada prinsipnya diperoleh dengan menghitung koefisien korelasi antara dua kelompok skor tes.

Tiga cara itu sebagai berikut.

a)      Test-retest method (metoda tes ulang).

Satu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan terhadap kelompok siswa tertentu dua kali dengan jangka waktu tertentu (misalnya satu semester atau satu catur wulan). Skor hasil pengetesan pertama dikorelasikan dengan skor hasil pengetesan kedua. Koefisien korelasi yang diperoleh menunjukkan koefisien reliabilitas tes tersebut.

b)      Paralel test method (metoda tes paralel)

Cara ini mengharuskan adanya dua tes yang paralel, yakni dua tes yang disusun dengan tujuan yang sama (hanya sedikit berbedaan redaksi, isi atau susunan kalimatnya). Dua tes tersebut diadministrasikan pada satu kelompok siswa dengan perbedaan waktu beberapa hari saja. Skor dari kedua macam tes tersebut dikorelasikan dengan teknik yang sama seperti pada metode testretest. Koefisien korelasi yang diperoleh menunjukkan tingkat reliabilitas tes.

c)      Split-half method (metode belah dua)

Cara ini paling mudah dan seyogyanya diterapkan oleh para guru pada semua tes yang diberikan kepada siswanya. Tidak perlu mengulangi pelaksanaan tes atau menyusun tes yang paralel. Cukup satu tes dan diadministrasikan satu kali kepada sekelompok siswa (minimal 30 siswa).

Pada saat penyekoran, tes dibelah menjadi dua sehingga tiap siswa memperoleh dua macam skor, yakni skor yang diperoleh dari soal-soal bernomor ganjil dan skor dari soal-soal bernomor genap. Skor total diperoleh dengan menjumlah skor ganjil dan genap. Selanjutnya skor-ganjil dikorelasikan dengan skor-genap, hasilnya adalah koefisien korelasi rgg, atau koefisien korelasi ganjil-genap.

Karena tes dibelah jadi dua, maka koefisien korelasi ganjil-genap tersebut dikoreksi sehingga menjadi koefisien reliabilitas. Rumusnya sebagai berikut:

rtt  =

Keterangan:

rtt = koefisien reliabilitas tes

rgg = koefisien korelasi ganjil-genap (separoh tes tes dengan separoh lainnya)

 

Harga-harga tersebut dimasukkan ke dalam rumus Pearson’s Product Moment sebagai berikut:

Kriteria:

0,800 – 1,00 : sangat tinggi

0,600 – 0,79 : tinggi

0,400 – 0,59 : cukup

0,200 – 0,39 : rendah

0,000 – 0,19 : sangat rendah

  1. Analisis butir soal yang meliputi:

Baik buruknya tes tergantung pada butir-butir soal yang ada di dalamnya. Oleh sebab itu untuk mendapatkan tes yang baik perlu dipilih butir-butir yang baik. Butir yang buruk harus dibuang, yang kurang baik perlu direvisi. Untuk mengetahui kualitas tiap butir soal perlu analisis satu persatu. Analisis meliputi perhitungan daya pembeda, tingkat kesukaran, homogenitas tes serta analisis distraktor/pengecoh pada tes pilihan ganda.

Daya pembeda menunjukkan sejauh mana tiap butir soal mampu membedakan antara siswa yang menguasai bahan dengan siswa yang tidak menguasai bahan. Butir soal yang daya pembedanya rendah, tidak ada manfaatnya, malahan dapat merugikan siswa yang belajar sunguh- sungguh.

Tingkat kesukaran menunjukkan apakah butir soal tergolong sukar, sedang atau mudah. Tes yang baik memuat kira-kira 25% soal mudah, 50% sedang dan 25% sukar. Butir soal yang terlalu sukar sehingga hampir tidak terjawab oleh semua siswa atau terlalu mudah sehingga dapat dijawab oleh hampir semua siswa, sebaiknya dibuang karena tidak bermanfaat.

Tingkat homogenitas soal menunjukkan apakah tiap butir soal mengukur aspek/pokok bahasan yang sama, atau sejauh mana tiap butir soal menyumbang skor total tiap siswa. Butir soal yang homogen adalah yang menunjang skor total. Sebaliknya, butir soal yang tidak seiring dengan skor-total dikatakan tidak homogen, dan lebih baik dibuang atau direvisi.

Pada tes pilihan ganda, tiap butir soal menggunakan beberapa pengecoh (distraktor / penyesat / option). Tiap pengecoh hendaknya bermanfaat atau berfungsi, yakni ada sejumlah siswa yang memilihnya. Pengecoh yang tidak dipilih sama sekali oleh siswa berarti tidak berfungsi mengecohkan siswa, sebaliknya pengecoh yang dipilih oleh hampir semua siswa berarti terlalu mirip dengan jawaban yang benar.

Langkah-Langkah Analisis Butir Soal

Butir soal tes pilihan ganda jumlahnya cukup besar, biasanya antara 50-100 butir, bahkan ada yang sampai 200 butir dengan ragam soal yang berbedabeda. Untuk keperluan analisis, lembar jawaban siswa merupakan dokumen utama yang harus ada. Analisis lengkap meliputi semua hal, sedang analisis singkat hanya meliputi: reliabilitas belah-dua, daya pembeda atau tingkat kesukaran. Langkah-langkah analisis butir soal adalah sebagai berikut.

  1. Memberi skor pada lembar jawaban.

1)      Berilah tanda silang pada lembar jawaban, mana butir soal yang dijawab benar dan mana yang salah. Yang benar diberi skor satu, yang salah diberi nol. Untuk pemberian nilai, boleh saja jawaban benar diskor 4 dan jawaban salah didenda 1.

2)      Skor tiap lembar jawaban (tiap siswa) dijumlahkan, dengan 3 macam skor: (1) jumlah skor soal bernomor ganjil, (2) jumlah skor soal bernomor genap, dan (3) skor total.

3)      Jumlah skor ganjil dan genap digunakan untuk menghitung reliabilitas. Lihat teknik analisis reliabilitas belah-dua. Sedang skor total digunakan untuk mengurutkan dan membuat kelompok Atas – Bawah (kelompok Unggul – Asor)

  1. Menghitung daya pembeda

1)      Berdasar skor total, susunlah nama atau nomor siswa dari tertinggi hingga terendah. Ambil 27% siswa yang skor-totalnya tinggi atau 27 % Kelompok Atas, dan 27% yang rendah (Kelompok Bawah).

2)      Buatlah tabel, khusus untuk siswa kelompok Atas dan kelompok Bawah. Jumlah kolom dalam tabel minimal sama dengan jumlah butir soal, sehingga memuat seluruh jawaban siswa. Tanda 1 artinya jawaban betul dan 0 artinya jawaban salah. Tabel ini digunakan untuk menghitung daya pembeda maupun tingkat kesukaran butir soal.

3)      Hitung jumlah jawaban yang benar (bertanda 1), baik pada Kelompok Atas maupun pada Kelompok Bawah. Lihat contoh.

4)      Daya pembeda dihitung dengan rumus:

DP = indeks daya pembeda butir soal tertentu (satu butir)

BA = jumlah jawaban benar pada Kelompok Atas

BB = jumlah jawaban benar pada Kelompok Bawah

NA = jumlah siswa pada salah satu kelompok A atau B

Kriteria daya pembeda sebagai berikut:

Negatif – 9% = sangat buruk, harus dibuang

10% – 19% = buruk, sebaiknya dibuang

20% – 29% = agak baik, kemungkinan perlu direvisi

30% – 49% = baik

50% ke atas = sangat baik

Pada prinsipnya, daya pembeda dihitung berdasar selisih jawaban benar pada Kelompok Atas dan Kelompok Bawah, dibagi dengan jumlah siswa pada salah satu kelompok tersebut. Dikalikan 100% agar diperoleh angka bulat (bukan pecahan, tetapi persen). Masih ada beberapa teknik dan rumus menghitung daya pembeda, namun cara di atas paling sederhana sehingga cocok untuk para guru.

  1. Menghitung tingkat kesukaran

Tabel skor yang digunakan disini sama dengan tabel skor untuk menghitung daya pembeda, tetapi menggunakan rumus:

TK = indeks tingkat kesukaran butir soal tertentu (satu butir)

BA = jumlah siswa yang menjawab benar pada kelompok A

BB = jumlah siswa yang menjawab benar pada kelompok B

NA = jumlah siswa pada kelompok A (atas/unggul)

NB = jumlah siswa pada kelompok B (bawah/asor)

Makin besar harga TK, makin mudah butir soal tersebut, sehingga dapat juga disebut ‘‘tingkat kemudahan”

Kriteria tingkat kesukaran (tingkat kemudahan) sebagai berikut:

0% – 15% = sangat sukar, sebaiknya dibuang.

16% – 30% = sukar

31% – 70% = sedang

71% – 85% = mudah

86% -100% = sangat mudah, sebaiknya dibuang.

Tingkat kesukaran tiap butir soal lebih baik bila dihitung berdasar jawaban seluruh siswa yang ikut tes (bukan hanya kelompok unggul dan asor yang berjumlah 54%). Tetapi hal ini sulit dilaksanakan, kecuali menggunakan komputer.

Rumus yang digunakan adalah:

TK = indeks tingkat kesukaran butir soal tertentu (satu butir soal)

nB = jumlah siswa yang menjawab benar pada butir itu

N = jumlah seluruh siswa yang mengikuti tes

  1. Menghitung homogenitas butir soal

Homogen tidaknya butir soal diketahui dengan menghitung koefisien korelasi antara skor tiap butir soal dengan skor total. Diperlukan perhitungan korelasi sebanyak butir soal dalam tes bersangkutan (bila ada 50 butir soal, maka Anda harus menghitung koefisien korelasi sebanyak 50 kali). Skor tiap butir soal adalah 1 atau 0, sedang skor total tiap siswa cukup bervariasi.

Teknik korelasi yang digunakan boleh dengan Pearson’s Product Moment, boleh juga dengan teknik Korelasi Point Biserial. Namun teknik Pearson lebih mudah bila langsung menggunakan kalkulator atau komputer. Hasil perhitungan korelasi tidak jauh berbeda walau dengan teknik apapun.

Butir soal yang homogen, koefisien korelasinya sama atau di atas batas signifikasi (batas kritis korelasi). Butir soal yang tidak/kurang homogen koefisien korelasinya negatif atau lebih kecil dari batas signifikansi. Butir soal tersebut mungkin mengukur aspek lain di luar bahan yang diajarkan (soal tidak sesuai dengan tujuan pengajaran), maka sebaiknya direvisis atau dibuang.

  1. Analisis distraktor/pengecoh.

Pada tes pilihan ganda ada beberapa option/alternatif jawaban yang sengaja dimasukkan sebagai pengecoh (distraktor).

Pengecoh dianggap baik bila jumlah siswa yang memilih pengecoh itu sama atau mendekati jumlah ideal.

Indeks pengecoh dihitung dengan rumus:

IPc = Indeks Pengecoh/Distraktor

nPc = Jumlah siswa yang memilih pengecoh itu

N = Jumlah seluruh subyek yang ikut tes

nB = Jumlah subyek yang menjawab benar pada butir soal itu

Alt = Banyak alternatif jawaban/option (3, 4, atau 5)

Catatan: Bila semua siswa menjawab benar pada butir soal tertentu (semua sesuai kunci), maka IPc = 0 artinya buruk (semua pengecoh tidak berfungsi).

Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal diketahui berapa siswa yang menjawab a, berapa yang menjawab b, berapa yang menjawab c, dan seterusnya. Tentu saja sangat memakan waktu dan tenaga. Bila diolah dengan komputer dan data sudah dimasukkan dalam disket, pengolahan ini hanya memerlukan waktu beberapa detik saja.

  1. Analisis teknis kegunaan tes.

Dengan melakukan analisis tes, guru dapat “menabung-soal” atau membuat “bank-soal” yakni kumpulan soal-soal yang sudah teruji kebaikannya. Manfaat terbesar dari kegiatan analisis tes ialah guru makin memahami bagaimana wujud tes yang baik, bagaimana butir soal yang baik. Sehingga pada akhirnya guru makin terampil menyusun tes dengan baik dan efisien. Kritik terhadap tes bentuk pilihan ganda yang dianggap lebih buruk dari tes bentuk uraian karena “makin membodohkan siswa”, sebenarnya bersumber pada tes pilihan ganda yang buruk.

BAB III

KESIMPULAN

  1. Tes merupakan suatu teknik atau cara yang digunakan dalam rangka melaksanakan kegiatan pengukuran, yang didalamnya terdapat berbagai pertanyaan, pernyatan atau serangkaian tugas yang harus dikerjakan atau dijawab oleh peserta didik untuk mengukur aspek perilaku peserta didik.
  2. Tes objektif adalah tes yang semua informasi yang diperlukan peserta tes untuk memberikan respon telah disediakan oleh penyusun tes, sehingga peserta tes tinggal memilihnya. Tes objektif yang sering digunakan adalah bentuk pilihan ganda, benar salah, menjodohkan, dan uraian objektif. 
  3. Secara umum, ada dua macam fungsi yang dimiliki oleh tes, yaitu:
  4. Sebagai alat pengukur terhadap peserta didik.
  5. Sebagai alat pengukur keberhasilan program pengajaran, sebab melalui tes tersebut akan dapat diketahui seberapa jauh program pengajaran yang telah ditentukan, telah dapat dicapai.
    1. Sebuah tes yang dapat dikatakan baik sebagai alat pengukur harus memenuhi persyaratan tes, yaitu memiliki: validitas, reliabilitas, dan obyektivitas
    2. Ada dua unsur penting dalam validitas ini. Pertama, validitas menunjukan suatu derajat, ada yang sempurna, ada yang sedang dan ada pula yang rendah. Kedua, validitas selalu dihubungkan dengan suatu putusan atau tujuan yang spesifik.
    3. Objektivitas dimaksud adalah bahan pelajaran yang telah diberikan dan diperintahkan untuk dipelajari oleh peserta didik itulah yang dijadikan acuan dalam pembuatan atau penyusunan tes hasil belajar tersebut.

DAFTAR PUSTAKA

 

Abad, F.J. et al. (2009). “The Multiple-Choice Model Some Solutions for Estimation of Parametes in The Presence of Omitted Responses”. Sage Publications. 33, (3), 200-221.

Azwar, Saifuddin. (2012). Tes Prestasi : Fungsi Pengembangan Pengukuran Prestasi Belajar. Yogyakarta : Pustaka Pelajar Offset.

Kim, Jee, Soen. dan Hanson, B.A. (2002). “Test Equating Under The Multiple Choice Model”. Sage Publications. 26, (3), 225-270.

Mardapi, Djemari. (2008). Teknik Penyusunan Instrumen Tes dan Non tes. Yogyakarta : Mitra Cendikia

Munthe Bermawi. (2009). Desain Pembelajaran : Yogyakarta : Pustaka Intan Madani.

Nitko, Anthony. (2007). Educational Assessment of Studies. New Jersey : Pearsom Education Inc.

Popham, W. James. (1995). Classroom Assessment. United Statesof America : Allyn and Bacon.

Putro, S, Eko. (2009). Evaluasi Program Pembelajaran. Yogyakarta : Pustaka Pelajar.

Rupp, A.A. et al (2006). ”How Assessing Reading Comprehension With Multiple Choice Questions Shapes The Construct : A Cognitive Processing Prespective. Sage Publications. 23, (4), 441-474.

Scharf, E.M. dan Baldwin, L.P. (2007). “Assessing Multiple Choice Question (MCQ)Tests – A Mathematical Perspective”. Sage Publications. 8, (1), 31-47.

Schochet, Peter. Z. (2009). “An Approach for Addressing the Multiple Testing Problem in Social Policy Impact Evaluations”. Sage Publications. 33, (6), 539-567.

Sukardi, M. (2009). Evaluasi Pendidikan. Jakarta Timur : Bumi Aksara.

Torre, J.D.L. (2009). “A Cognitive Diagnosis Model for Cognitively Base Multiple Choice Options”. Sage Publications. 33, (3), 163-183.

Zimmerman, D.W. dan Williams, R.H. (2009).  “A New Look at the Influence of Guessing on the Reliability of Multiple-Choice Tests”. Sage Publications. 27, (5), 357-371.

Leave a comment

Trending