Shobibah Rohmah: makalah analisis butir soal

BAB I
PENDAHULUAN

A. Latar Belakang
Dalam proses pembelajaran akan selalu terkandung unsur didalamnya penilaian. Yang mana sebelum dilakukan penilaian perlu adanya analisis soal dengan tujuan untuk memperoleh informasi dalam menentukan kesimpulan kualitas soal tes tersebut disertai dengan adanya validitas dan realibitas.
Dalam makalah ini penulis menyertakan bagaimana langkah-langkah dalam menganalisis soal, Juga kriteria suatu tes yang dianggap baik, sehingga soal-soal yang akan disajikan dalam bahan ajar dapat memenuhi kriteria dengan baik. Disertai dengan aplikasi untuk menghitung tes dengan mudah dan hasilnya pun akurat.
Oleh karena itu mengenai analisis butir soal bahasa dan sastra ini sangat dibutuhkan oleh seorang guru untuk mengetahui dan mengukur ke akuratan butir-butir soal yang akan diberikan kepada peserta didik sebelum diadakannnya tes lisan maupun tulisan.

B. Rumusan Masalah
Beradasarkan latar belakang diatas maka rumusan masalah penulisan makalah, sebagai berikut:
1. Bagaimana penjelasan analisis butir soal bahasa dan sastra ?
2. Bagaimana langkah- langkah dalam pengembangan tes?
3. Apa saja tes hasil belajara kognitif?
4. Bagaimana cara mengaplikasikan analisis soal dengan program ITEMAN?
C. Tujuan
1. Untuk mengetahui penjelasan analisis butir soal bahasa dan sastra ?
2. Untuk mengetahui langkah- langkah dalam pengembangan tes?
3. Untuk mengetahui tes hasil belajar kognitif?
4. Untuk mengetahui cara mengaplikasikan analisis soal dengan program ITEMAN
BAB II
PEMBAHASAN

A. Analisis Butir Soal Bahasa dan Sastra
Analisis adalah proses pencarian jalan keluar atau pemecahan masalah yang berangkat dari dugaan akan kebenarannya.
Analisis soal merupakan suatu kegiatan sistematis yang meliputi pengumpulan dan pengolahan data berupa tes atau soal yang dilakukan secara kualitatif dan kuantitatif guna memperoleh informasi untuk menentukan kesimpulan kualitas soal tersebut.
Surapranata (2005) menyatakan bahwa analisis kualitatif dinamakan validitas logis (logical validity) dan analisis kuantitatif dinamakan validitas empiris (empirical validity). Melalui validitas empiris akan diperoleh informasi butir soal yang meliputi tingkat kesukaran, daya pembeda dan efektivitas pengecoh. Dari penjelasan di atas dapat diketahui bahwa kualitas soal yang baik dapat dilihat dari validitas logis dan validitas empiris.
1. Validitas
Validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang seharusnya diukur.
a. Validitas logis, terdiri atas:
1) Validitas isi,
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan (menurut Arikunto). Sedangkan validitas isi (menurut Ary D et al) menunjuk pada sejauh mana instrumen tersebut mencerminkan isi yang dikehendaki.

2) Validitas konstruksi
Sebuah tes dikatakan memiliki validitas konstruksi jika butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang dirumuskan dalam indikator (menurut Arikunto).
b. Validitas empiris, terdiri atas:
1) Tingkat kesukaran,
Adalah pengukuran seberapa besar derajat kesukaran suatu soal. Jika suatu soal memiliki tingkat kesukaran seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut baik. Sebaiknya dalam penyusunan tes tidak terlalu sukar dan tidak pula terlalu mudah. Angka yang menunjukkan mengenai tingkat kesukaran dikenal dengan ”Difficulty Index” yang diberi lambang P (Proportion). Besarnya tingkat kesukaran antara 0,00 sampai dengan 1,0. Menurut Arikunto (2007) klasifikasi indeks kesukaran adalah sebagai berikut:
Soal dengan P antara 0,00 sampai 0,10 adalah soal sangat sukar 53
Soal dengan P antara 0,11 sampai 0,30 adalah soal sukar
Soal dengan P antara 0,31 sampai 0,70 adalah soal sedang
Soal dengan P antara 0,71 sampai 0,90 adalah soal mudah
Soal dengan P > 0,90 adalah soal sangat mudah
2) Daya pembeda, adalah pengukuran sejauhmana suatu butir soal mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koefisien daya pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peserta didik yang menguasai kompetensi dengan peserta didik yang kurang menguasai kompetensi. Seluruh peserta tes dikelompokkan menjadi 2 yaitu kelompok atas (upper) dan kelompok bawah (lower). Angka yang menunjukkan besarnya daya pembeda adalah disebut ”Discriminating Power” yang diberi lambang D. Besarnya daya pembeda berkisar antara 0,00 sampai 1,00. Menurut Arikunto (2007) klasifikasi daya pembeda soal adalah sebagai berikut.
D = 0,00 – 0,20 daya pembeda soal adalah jelek
D = 0,21 – 0,40 daya pembeda soal adalah cukup
D = 0,41 – 0,70 daya pembeda soal adalah baik
D = 0,71 – 1,00 daya pembeda soal adalah baik sekali
D = Negatif daya pembeda soal adalah sangat jelek
3) Analisis pengecoh, pada soal pilihan ganda terdapat alternative jawaban/option yang merupakan pengecoh (distraktor). Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap baik apabila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal. Menurut Surapranata (2005) suatu pengecoh dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% peserta tes.
2. Reliabilitas
Menurut Sudjana, Reliabilitas adalah ketetapan atau keajegan suatu alat evaluasi. Sedangkan Singarimbun dan Soffian E menyatakan bahwa reliabilitas merupakan indeks yang menunjukkan sejauh mana suatu alat pengukur dapat dipercaya dan dapat diandalkan. Suatu tes dikatakan memiliki ketetapan jika dapat dipercaya, konsisten/stabil dan produktif kapanpun tes tersebut digunakan. Terdapat tiga cara untuk mengetahui reliabilitas suatu tes, yaitu:
a. Dengan metode dua tes, dua tes yang paralel dan setaraf diberikan kepada sekelompok siswa, kemudian kedua hasilnya dicari korelasinya.
b. Dengan metode satu tes, sebuah tes diberikan dua kali kepada sekelompok siswa yang sama tapi dalam waktu yang berbeda. Kemudian kedua hasilnya dicari korelasinya.
c. Metode split-half, suatu tes dibagi menjadi dua bagian yang sama tingkat kesukarannya, sama isi dan bentuknya. Kemudian dilihat skor masing-masing bagian paruhan tes tersebut dan dicari korelasinya.
Nilai dari reliabilitas diberi lambang r yang dapat dicari besarnya dengan menggunakan rumus KR 20 atau Spearman-Brown. Menurut Arikunto harga r yang diperoleh dikonsultasikan dengan r Tabel product moment dengan taraf signifikan 5%. Jika harga r hitung > r Tabel , maka soal tersebut reliabel. Klasifikasi reliabilitas soal adalah sebagai berikut:
0,800 < r ≤ 1,000 : sangat tinggi
0,600 < r ≤ 0,800 : tinggi
0,400 < r ≤ 0,600 : cukup
0,200 < r ≤ 0,400 : rendah
0,000 < r ≤ 0,200 : sangat rendah

B. Langkah Pengembangan Tes
Sebelum soal diberikan pada siswa sebaiknya soal disusun sesuai dengan peruntukannya, artinya soal tersebut harus berkualitas. Menurut Suryabrata yang diacu dalam Purnomo menjelaskan bahwa soal-soal yang telah ditulis dengan hati-hati berdasarkan pertimbangan tidak begitu saja dapat dianggap sebagai soal yang baik karena harus diuji melalui penelaahan soal (penelaahan secara teoritis) dan pengujian secara empiris. Pengujian soal melalui penelaahan soal mempunyai tiga sasaran, yaitu: a) kesesuaian isi soal dengan hal yang akan diuji/validitas isi, b) kesesuaian soal dengan syarat-syarat psikometris, serta c) ketepatan dan kecermatan rumusan soal-soal tersebut. Oleh karena itu penelaahan soal perlu dilakukan sebelum soal diberikan kepada testee agar dapat memberikan hasil yang tepat.
Mardapi menyebutkan terdapat delapan langkah yang perlu ditempuh dalam mengembangkan tes hasil atau prestasi belajar meliputi:
1. Menyusun spesifikasi tes, yaitu berisi tentang uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes. Spesifikasi yang jelas akan mempermudah dalam menulis soal dan siapa saja yang menulis soal akan menghasilkan tingkat kesulitan yang relatif sama. Penyusunan spesifikasi tes yang mencakup :
a. menentukan tujuan, yang dirumuskan secara jelas dan tegas yang ditentukan sejak awal karena menjadi dasar untuk menentukan arah, ruang lingkup materi, jenis/model dan karakter alat penilaian.
b. menyusun kisi-kisi, merupakan Tabel matrik yang berisi spesifikasi soal-soal yang akan dibuat. Kisi-kisi ini sebagai acuan sehingga dapat menulis soal yang isi dan tingkat kesulitannya relatif proporsional.
c. menentukan bentuk tes, yang sering digunakan adalah bentuk pilihan ganda, benar salah, menjodohkan dan uraian obyektif. Pemilihan bentuk tes yang tepat ditentukan oleh tujuan tes, jumlah peserta tes, waktu yang tersedia, cakupan materi, dan karakteristik mata pelajaran.
d. menentukan panjang tes, berdasarkan pada cakupan materi. Pada`umumnya waktu yang dibutuhkan untuk mengerjakan soal pilihan ganda adalah 2 sampai 3 menit.
2. Menulis soal tes, merupakan langkah penjabaran indikator menjadi pertanyaanpertanyaan yang karakteristiknya sesuai dengan perincian pada kisi-kisi yang telah dibuat. Kualitas tes secara keseluruhan sangat berpengaruh dengan tingkat kebaikan dari masing-masing soal yang menyusunnya.
3. Menelaah soal tes, dilakukan untuk memperbaiki soal jika ternyata dalam pembuatannya masih ditemukan kekurangan atau kesalahan. Telaah soal ini sebaiknya dilakukan oleh orang lain, bukan si pembuat soal.
4. Melakukan uji coba tes, sebaiknya dilakukan untuk memperbaiki kualitas soal. Uji coba ini dapat digunakan sebagai sarana memperoleh data empirik tentang tingkat kebaikan soal yang telah disusun. Melalui uji coba soal dapat diperoleh data reliabilitas, validitas, tingkat kesukaran, efektifitas pengecoh, daya beda dan lain-lain.
5. Menganalisis butir soal, setelah dilakukan uji coba soal akan diketahui mengenai kualitas masing-masing butir soal yang meliputi: tingkat kesukaran, efektifitas pengecoh dan daya beda.
6. Memperbaiki tes, dilakukan tentang perbaikan bagian soal yang masih belum sesuai dengan yang diharapkan.
7. Merakit tes, setelah semua butir dianalisis dan diperbaiki langkah selanjutnya adalah merakit semua tes menjadi satu kesatuan tes. Keseluruhan butir perlu disusun secara hati-hati menjadi kesatuan soal yang terpadu.
8. Melaksanakan tes, yang diberikan kepada testee untuk diselesaikan.

C. Tes Sebagai Hasil Belajar Kognitif
Dalam menyusun tes, perlu diperhatikan tipe hasil belajar atau tingkat kemampuan berpikir mana saja yang akan diukur atau di nilai. Penentuan tipe hasil belajar atau tingkat kemampuan berpikir yang akan dinilai maka penyusunan tes dapat berpedoman pada indikator pembelajaran atau tujuan evaluasi itu sendiri. Sehingga pemilihan alat evaluasi dan penyusunan instrumen tes akan tepat sesuai dengan tingkat kemampuan berpikir peserta didik.
Bloom membagi tingkat kemampuan atau tipe hasil belajar yang termasuk aspek kognitif menjadi enam yaitu: Pengetahuan hafalan, pemahaman atau komperhensi, penerapan aplikasi, analisis, sintesis dan evaluasi. yaitu:
1. Pengetahuan hafalan (C1) atau knowledge ialah tingkat kemampuan yang hanya meminta responden atau testee untuk mengenal atau mengetahui adanya konsep, fakta, atau istilah-istilah tanpa harus mengerti atau dapat menilai atau dapat menggunakannya. Dalam hal ini biasanya testee hanya dituntut untuk menyebutkan kembali (recall) atau menghafal saja.
2. Pemahaman atau komprehensif (C2) adalah tingkat kemampuan yang mengharapkan testee mampu memahami arti atau konsep, situasi serta fakta yang diketahuinya. Dalam hal ini testee tidak hanya hafal secara verbal akan tetapi juga memahami konsep dari masalah atau fakta yang ditanyakan
3. Aplikasi atau penerapan (C3) adalah penggunaan abstraksi pada situasi konkret atau situasi khusus. Testee dituntut kemampuannya untuk menerapkan atau menggunakan apa yang telah diketahuinya dalam situasi baru baginya (diabstrakkan). Abstraksi ini dapat berupa ide, teori, atau petunjuk praktis.
4. Kemampuan analisis dan sintesis (C4) adalah kemampuan yang mengukur testee untuk menganalisis atau menguraikan suatu integritas atau situasi tertentu ke dalam komponen-komponen atau unsur-unsur pembentuknya. Diharapkan siswa dapat memahami dan sekaligus mampu memilah-milahnya menjadi bagian-bagian, termasuk juga menguraikan bagaimana proses terjadinya sesuatu, cara bekerjanya sesuatu, atau mungkin juga sistematikanya. Sedangkan kemampuan sintesis adalah penyatuan unsur-unsur atau bagianbagian ke dalam suatu bentuk yang menyeluruh. Diharapkan testee mampu menemukan hubungan kausal atau urutan tertentu atau menemukan abstraksinya yang berupa integritas.
5. Kemampuan evaluasi (C5) adalah kemampuan testee untuk membuat suatu penilaian tentang suatu pernyataan, konsep, situasi, dan sebagainyaberdasarkan suatu kriteria tertentu. Kegiatan penilaian dapat dilihat dari segi tujuannya, gagasannya, cara bekerjanya, cara pemecahannya, metodenya, materinya atau lainnya.
6. Kemampuan berkreasi/berkreativitas (C6) adalah tingkat kemampuan untuk merancang, membangun, merencanakan, memproduksi, menemukan, membaharui, menyempurnakan, memperkuat dan menggubah sesuatu menjadi baru.

D. Analisis Soal dengan Program ITEMAN
ITEMAN merupakan perangkat/program untuk menganalisis butir soal dan tes. Program ini didasarkan pada teori tes klasik. Menurut Rudyatmi dan Anni analisis soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori klasik. Melalui data empiris butir soal yang ditampilkan dapat menjelaskan kualitas soal tersebut. Menurut Abidin terdapat kelemahan utama dari program ini yaitu sangat dipengaruhi oleh kemampuan responden. Artinya jika soal diujikan pada anak berkemampuan tinggi dengan anak berkemampuan rendah maka akan terjadi perbedaan hasil analisis. Untuk mengantisipasi hal tersebut maka biasanya analisis soal dengan menggunakan ITEMAN dilakukan secara sampling. Semakin besar sampling dan semakin baik teknik samplingnya maka semakin baik kualitas hasil analisis. Azwar yang diacu dalam Kustriyono menyatakan bahwa pada analisis butir menggunakan teori tes klasik tipe objektif, kualitas butir dilihat dari paling tidak dua parameter yaitu tingkat kesukaran dan daya pembeda. Selain itu juga menguji efektifitas distraktor-distraktor pada setiap butir untuk menentukan apakah distraktor tersebut berfungsi atau belum.
Program ini termasuk satu paket dalam MicroCat yang dikembangkan oleh Assessment System Corporation mulai tahun 1982 dan mengalami revisi pada tahun 1984, 1986, 1988, dan 1993: mulai dari versi 2.00 sampai dengan versi 3.50. Menurut Rudyatmi dan Anni adapun fungsi dari program ITEMAN adalah:
a. Untuk menganalisis data file (format ASCII) jawaban butir soal yang dihasilkan manual melalui manual entry data atau dari mesin scanner
b. Menskor dan menganalisis data soal pilihan ganda untuk 30.000 siswa dan 250 butir soal
c. Menganalisis sebuah tes yang terdiri dari 10 skala (subtes) dan memberikan
informasi tentang validitas setiap butir (daya pembeda, tingkat kesukaran, proporsi jawaban pada setiap option), reliabilitas (KR-20/Alpha), standar error measurement, mean, variance, standar deviasi, skew, kurtosis untuk jumlah skor pada jawaban benar, skor minimum dan maksimum, skor median dan frekuensi distribusi skor.
Menurut Abidin (2008) program ITEMAN juga memberikan hasil skor untuk setiap peserta tes yang menunjukkan jumlah benar dari seluruh jawaban. Sebelum menggunakan program ITEMAN perlu diketahui bahwa terdapat 5 baris utama yang harus dientrykan. Data yang akan dianalisis diketik melalui notepad atau Microsoft Office Word dengan jenis font Courier New. File data yang akan dientrykan ke program ITEMAN terdiri atas 5 baris yaitu:
a. Baris pertama adalah baris pengontrol yang mendeskripsikan data
b. Baris kedua adalah daftar kunci jawaban setiap butir soal
c. Baris ketiga adalah daftar jumlah option untuk setiap butir soal
d. Baris keempat adalah daftar butir soal yang akan dianalisis (jika butir yang akan dianalisis diberi tanda Y, jika tidak diikutkan dalam analisis diberi tanda N)
e. Baris kelima dan seterusnya adalah data siswa dan jawaban pilihan siswa
Setiap pilihan jawaban siswa (untuk soal pilihan ganda) diketik dengan menggunakan huruf, misal ABCD atau 1234 untuk 4 pilihan jawaban, sedangkan untuk 5 pilihan jawaban yaitu ABCDE atau 12345.
Adapun langkah-langkah melakukan analisis soal dengan ITEMAN:
a. Membuat File Data
1) Contoh File data (file data ditulis dengan notepad atau Microsoft Office Word dengan jenis font Courier New).
2) Keterangan Pengisian File Data.
b. Baris Pertama:
Kolom 1-3 : jumlah butir soal (contoh: 020)
4 : Spasi
5 : jawaban kosong (omit), ditulis 0
6 : Spasi
7 : soal yang belum dikerjakan, ditulis n
8 : spasi
9-10 : jumlah identitas data siswa (contoh: 10)
Tambahan keterangan:
Kolom 1-3, Untuk menuliskan jumlah soal: Kolom 1 ratusan, kolom 2 puluhan, kolom 3 satuan
Kolom 5 : butir soal yang tidak dijawab
Kolom 7 : butir soal yang belum sempat dikerjakan
Kolom 9-10: panjang karakter untuk identitas siswa.
1) Baris kedua : kunci jawaban
2) Baris ketiga :jumlah jawaban
3) Baris Keempat : „Y‟ butir soal yang dianalisis, „N‟ butir soal yang tidak dianalisis
4) Baris kelima dan seterusnya : berisi jawaban siswa
c. Menjalankan Program Iteman
1) Double klik file program ITEMAN
2) Tulislah file data: contoh TIK.TXT, kemudian tekan enter
3) Ketik nama file hasil analisis, contoh HSL.TXT, kemudian tekan enter
4) Ketik „Y‟, kemudian tekan enter
5) Ketik file untuk total skor siswa, contoh SKOR.TXT, kemudian tekan enter.
6) Analisis selesai
d. Interpretasi hasil Analisis
Hasil analisis dengan ITEMAN dapat dibedakan menjadi 2 bagian, yaitu statistik butir soal dan hasil analisis statistik tes/skala.
a) Statistik butir soal
adalah untuk tes yang terdiri dari butir-butir soal yang bersifat dikotomi misalnya pilihan ganda. Statistik berikut adalah output dari setiap butir soal yang dianalisis:
1) Seq.N : adalah nomor urut butir soal dalam file data
2) Scala item : nomor urut butir soal dalam tes
3) Prop.Correc : proporsi siswa yang menjawab benar butir tes (indeks tingkat kesukaran soal secara klasikal). Nilai ekstrim (mendekati nol atau satu) menunjukkan bahwa butir soal tersebut terlalu sukar atau terlalu mudah untuk peserta tes. Indeks ini disebut juga indeks tingkat kesukaran soal secara klasikal.
4) Biser : indeks daya pembeda soal dengan menggunakan koefisien korelasi biserial. Nilai positif artinya peserta tes yang menjawab benar butir soal mempunyai skor relatif tinggi dalam tes tersebut. Sebaliknya nilai negatif menunjukkan bahwa peserta tes yang menjawab benar butir tes memperoleh skor tes yang relatif lebih rendah dalam tes. Untuk statistik pilihan jawaban korelasi biserial negatif sangat tidak dikehendaki untuk kunci jawaban (alternatif) dan sangat dikehendaki untuk pilihan jawaban yang lain (pengecoh).
5) Point biserial : juga indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan menggunakan koefisien point biserial. Penafsirannya sama dengan statistik biserial. Statistik pilihan jawaban (alternatif) memberikan informasi yang sama dengan statistik butir soal. Perbedaannya adalah bahwa statistik pilihan jawaban dihitung secara terpisah. Untuk setiap pilihan jawaban dan didasarkan pada pilihan tidaknya alternatif tersebut, bukan pada jawabannya. Tanda bintang yang muncul di sebelah kanan hasil analisis menunjukkan kunci jawaban.

b) Statistik tes
1) N of Items : jumlah butir soal dalam tes yang dianalisis.
2) N of Examines: Jumlah peserta tes
3) Mean : Skor atau rerata peserta tes
4) Variance : varian dari distribusi skor peserta tes yang memberikan gambaran tentang sebaran skor peserta tes.
5) Std.Deviasi : Deviasi standar dari distribusi skor tes (akar dari varians)
6) Skew : kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk distribusi skor peserta tes. Kemiringan negative menunjukkan bahwa sebagian besar skor berada pada bagian atas (skor tinggi) dari distribusi skor. Sebaliknya, kemiringan positif menunjukkan bahwa sebagian besar skor pada bagian bawah (skor rendah) dari distribusi skor. Kemiringan nol menunjukkan bahwa skor berdistribusi secara simetris di sekitar skor rata-rata.
7) Kurtosis : puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding dengan distribusi normal. Nilai positif menunjukkan distribusi yang lebih lancip (memuncak) dan nilai negative menunjukkan distribusi yang lebih landai (merata). Kurtosis untuk distribusi normal adalah nol.
8) Minimum : skor terendah peserta tes
9) Maximum : skor tertinggi peserta tes.
10) Median : skor tengah dimana 50% berada pada atau lebih rendah dari skor tersebut.
11) Alpha : koefisien reliabilitas alpha untuk tes atau skala tersebut yang merupakan indeks homogenitas tes atau skala. Koefisien alpha bergerak dari 0,0 sampai 1,0. Koefisien alpha hanya cocok digunakan untuk tes yang bukan mengukur kecepatan dan yang hanya mengukur satu dimensi. Semakin tinggi koefisien alpha menandakan semakin reliabel suatu soal.
12) SEM : kesalahan pengukuran standar untuk setiap tes atau skala. SEM merupakan estimasi dari deviasi standar kesalahan pengukuran dalam skor tes.
13) Mean P : rerata tingkat kesukaran semua butir soal dalam tes secara klasikal dihitung dengan cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam tes.
14) Mean item tot : nilai rata-rata indeks daya pembeda dari semua soal dalam tes yang diperoleh dengan menghitung nilai rata-rata point biseral dari semua soal dalam tes.
15) Mean biserial : nilai rata-rata indek daya pembeda yang diperoleh dengan menghitung nilai rata-rata korelasi biserial dari semua butir

BAB III
PENUTUP

Kesimpulan
Analisis soal merupakan suatu kegiatan sistematis yang meliputi pengumpulan dan pengolahan data berupa tes atau soal yang dilakukan secara kualitatif dan kuantitatif guna memperoleh informasi untuk menentukan kesimpulan kualitas soal tersebut.
Dalam analisis butir soal harus adanya validitas dan realibitas,. Dalam validitas mencakup: validitas logis dan validitas empiris. Sedangkan realibitas merupakan indeks yang menunjukkan sejauh mana suatu alat pengukur dapat dipercaya dan dapat diandalkan, sehingga butir soal yang akan dibereikan kepada peserta tes yang berupa tes tulis maupun lisan dapat dibuktikan keakuratannya.
Sebelum soal diberikan pada siswa sebaiknya soal disusun sesuai dengan peruntukannya, artinya soal tersebut harus berkualitas. Menurut Suryabrata yang diacu dalam Purnomo menjelaskan bahwa soal-soal yang telah ditulis dengan hati-hati berdasarkan pertimbangan tidak begitu saja dapat dianggap sebagai soal yang baik karena harus diuji melalui penelaahan soal. Oleh karena itu perlu adanya langkah-langkah pengembangan tes. Disertakan dengan pemahaman mengenai aplikasi ITEMAN untuk mempermudah dalam pelaksanaan perhitungan hasil tes.

DAFTAR PUSTAKA
Mulyasa. Analisis, Validitas, Realibilitas, dan Interprestasi Hasil tes. (Bandung: PT. Remaja Rosdakarya).
Ngalim Purwanto. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. (Bandung: Remaja Rosdakarya).
Supriyadi. 2013. Modul Evaluasi Pembelajaran Bahasa dan Sastra. (Gorontalo: UNG Press Gorotalo).
Tim Prima Pena. Kamus Besar Bahasa Indonesia (...: Gitamedia press).

Shobibah Rohmah

Rabu, 16 Desember 2015

makalah analisis butir soal

Tidak ada komentar:

Posting Komentar