Rabu, 16 Desember 2015

makalah analisis butir soal

BAB I
PENDAHULUAN

A. Latar Belakang
Dalam proses pembelajaran akan selalu terkandung unsur didalamnya penilaian. Yang mana sebelum dilakukan penilaian  perlu adanya analisis soal dengan tujuan untuk memperoleh informasi dalam  menentukan kesimpulan kualitas soal tes tersebut disertai dengan adanya validitas dan realibitas.
Dalam makalah ini penulis menyertakan bagaimana langkah-langkah dalam menganalisis soal,  Juga kriteria suatu tes yang dianggap baik,  sehingga soal-soal yang akan disajikan dalam bahan ajar dapat memenuhi kriteria dengan baik. Disertai dengan aplikasi untuk menghitung tes dengan mudah dan  hasilnya pun akurat.
Oleh karena itu mengenai analisis butir soal bahasa dan sastra ini sangat dibutuhkan oleh seorang guru untuk mengetahui dan mengukur ke akuratan butir-butir soal yang akan diberikan kepada peserta didik sebelum diadakannnya tes lisan maupun tulisan.

B. Rumusan Masalah
Beradasarkan  latar  belakang  diatas  maka  rumusan  masalah  penulisan makalah, sebagai  berikut:
1. Bagaimana penjelasan analisis butir soal bahasa dan sastra ?
2. Bagaimana langkah- langkah dalam  pengembangan tes?
3. Apa saja tes hasil belajara kognitif?
4. Bagaimana cara mengaplikasikan analisis soal dengan program ITEMAN?
C. Tujuan
1. Untuk mengetahui penjelasan analisis butir soal bahasa dan sastra ?
2. Untuk mengetahui  langkah- langkah dalam  pengembangan  tes?
3. Untuk mengetahui  tes hasil belajar  kognitif?
4. Untuk mengetahui  cara mengaplikasikan analisis soal dengan program ITEMAN
BAB II
PEMBAHASAN

A. Analisis Butir Soal Bahasa dan Sastra
Analisis adalah proses pencarian jalan  keluar atau pemecahan masalah yang berangkat dari dugaan akan kebenarannya.
Analisis soal merupakan suatu kegiatan sistematis yang meliputi pengumpulan dan pengolahan data berupa tes atau soal yang dilakukan secara kualitatif dan kuantitatif guna memperoleh informasi untuk menentukan kesimpulan kualitas soal tersebut.
Surapranata (2005) menyatakan bahwa analisis kualitatif dinamakan validitas logis (logical validity) dan analisis kuantitatif dinamakan validitas empiris (empirical validity). Melalui validitas empiris akan diperoleh informasi butir soal yang meliputi tingkat kesukaran, daya pembeda dan efektivitas pengecoh. Dari penjelasan di atas dapat diketahui bahwa kualitas soal yang baik dapat dilihat dari validitas logis dan validitas empiris.
1. Validitas
Validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang seharusnya diukur.
a. Validitas logis, terdiri atas:
1) Validitas isi,
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan (menurut Arikunto). Sedangkan validitas isi (menurut Ary D et al) menunjuk pada sejauh mana instrumen tersebut mencerminkan isi yang dikehendaki.

2) Validitas konstruksi
Sebuah tes dikatakan memiliki validitas konstruksi jika butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang dirumuskan dalam indikator (menurut Arikunto).
b. Validitas empiris, terdiri atas:
1) Tingkat kesukaran,
Adalah pengukuran seberapa besar derajat kesukaran suatu soal. Jika suatu soal memiliki tingkat kesukaran seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut baik. Sebaiknya dalam penyusunan tes tidak terlalu sukar dan tidak pula terlalu mudah. Angka yang menunjukkan mengenai tingkat kesukaran dikenal dengan ”Difficulty Index” yang diberi lambang P (Proportion). Besarnya tingkat kesukaran antara 0,00 sampai dengan 1,0. Menurut Arikunto (2007) klasifikasi indeks kesukaran adalah sebagai berikut:
Soal dengan P antara 0,00 sampai 0,10 adalah soal sangat sukar 53
Soal dengan P antara 0,11 sampai 0,30 adalah soal sukar
Soal dengan P antara 0,31 sampai 0,70 adalah soal sedang
Soal dengan P antara 0,71 sampai 0,90 adalah soal mudah
Soal dengan P > 0,90 adalah soal sangat mudah
2) Daya pembeda, adalah pengukuran sejauhmana suatu butir soal mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koefisien daya pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peserta didik yang menguasai kompetensi dengan peserta didik yang kurang menguasai kompetensi. Seluruh peserta tes dikelompokkan menjadi 2 yaitu kelompok atas (upper) dan kelompok bawah (lower). Angka yang menunjukkan besarnya daya pembeda adalah disebut ”Discriminating Power” yang diberi lambang D. Besarnya daya pembeda berkisar antara 0,00 sampai 1,00. Menurut Arikunto (2007) klasifikasi daya pembeda soal adalah sebagai berikut.
D = 0,00 – 0,20 daya pembeda soal adalah jelek
D = 0,21 – 0,40 daya pembeda soal adalah cukup
D = 0,41 – 0,70 daya pembeda soal adalah baik
D = 0,71 – 1,00 daya pembeda soal adalah baik sekali
D = Negatif daya pembeda soal adalah sangat jelek
3) Analisis pengecoh, pada soal pilihan ganda terdapat alternative jawaban/option yang merupakan pengecoh (distraktor). Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap baik apabila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal. Menurut Surapranata (2005) suatu pengecoh dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% peserta tes.
2. Reliabilitas
Menurut Sudjana, Reliabilitas adalah ketetapan atau keajegan suatu alat evaluasi. Sedangkan Singarimbun dan Soffian E menyatakan bahwa reliabilitas merupakan indeks  yang menunjukkan sejauh mana suatu alat pengukur dapat dipercaya dan dapat diandalkan. Suatu tes dikatakan memiliki ketetapan jika dapat  dipercaya,  konsisten/stabil  dan  produktif  kapanpun  tes  tersebut digunakan. Terdapat tiga cara untuk mengetahui reliabilitas suatu tes, yaitu:
a. Dengan  metode  dua  tes,  dua  tes  yang  paralel  dan  setaraf  diberikan  kepada sekelompok siswa, kemudian kedua hasilnya dicari korelasinya.
b. Dengan  metode  satu  tes,  sebuah  tes  diberikan  dua  kali  kepada  sekelompok siswa  yang sama tapi dalam waktu  yang berbeda. Kemudian kedua hasilnya dicari korelasinya.
c. Metode  split-half,  suatu  tes  dibagi  menjadi  dua  bagian  yang  sama  tingkat kesukarannya, sama isi dan bentuknya. Kemudian dilihat skor masing-masing bagian paruhan tes tersebut dan dicari korelasinya.
Nilai  dari  reliabilitas  diberi  lambang  r  yang  dapat  dicari  besarnya  dengan menggunakan rumus KR 20 atau Spearman-Brown. Menurut Arikunto harga  r  yang  diperoleh  dikonsultasikan  dengan  r  Tabel  product  moment dengan taraf signifikan 5%. Jika harga r hitung > r Tabel , maka soal tersebut reliabel. Klasifikasi reliabilitas soal adalah sebagai berikut:
0,800 < r ≤ 1,000 : sangat tinggi
0,600 < r ≤ 0,800 : tinggi
0,400 < r ≤ 0,600 : cukup
0,200 < r ≤ 0,400 : rendah
0,000 < r ≤ 0,200 : sangat rendah

B. Langkah Pengembangan Tes
Sebelum soal diberikan pada siswa sebaiknya soal disusun sesuai dengan peruntukannya, artinya soal tersebut harus berkualitas. Menurut Suryabrata yang diacu dalam Purnomo menjelaskan bahwa soal-soal yang telah ditulis dengan hati-hati berdasarkan pertimbangan tidak begitu saja dapat dianggap sebagai soal yang baik karena harus diuji melalui penelaahan soal (penelaahan secara teoritis) dan pengujian secara empiris. Pengujian soal melalui penelaahan soal mempunyai tiga sasaran, yaitu: a) kesesuaian isi soal dengan hal yang akan diuji/validitas isi, b) kesesuaian soal dengan syarat-syarat psikometris, serta c) ketepatan dan kecermatan rumusan soal-soal tersebut. Oleh karena itu penelaahan soal perlu dilakukan sebelum soal diberikan kepada testee agar dapat memberikan hasil yang tepat.
Mardapi menyebutkan terdapat delapan langkah yang perlu ditempuh dalam mengembangkan tes hasil atau prestasi belajar meliputi:
1. Menyusun spesifikasi tes, yaitu berisi tentang uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes. Spesifikasi yang jelas akan mempermudah dalam menulis soal dan siapa saja yang menulis soal akan menghasilkan tingkat kesulitan yang relatif sama. Penyusunan spesifikasi tes yang mencakup :
a. menentukan tujuan, yang dirumuskan secara jelas dan tegas yang ditentukan sejak awal karena menjadi dasar untuk menentukan arah, ruang lingkup materi, jenis/model dan karakter alat penilaian.
b. menyusun kisi-kisi, merupakan Tabel matrik yang berisi spesifikasi soal-soal yang akan dibuat. Kisi-kisi ini sebagai acuan sehingga dapat menulis soal yang isi dan tingkat kesulitannya relatif proporsional.
c. menentukan bentuk tes, yang sering digunakan adalah bentuk pilihan ganda, benar salah, menjodohkan dan uraian obyektif. Pemilihan bentuk tes yang tepat ditentukan oleh tujuan tes, jumlah peserta tes, waktu yang tersedia, cakupan materi, dan karakteristik mata pelajaran.
d. menentukan panjang tes, berdasarkan pada cakupan materi. Pada`umumnya waktu yang dibutuhkan untuk mengerjakan soal pilihan ganda adalah 2 sampai 3 menit.
2. Menulis soal tes, merupakan langkah penjabaran indikator menjadi pertanyaanpertanyaan yang karakteristiknya sesuai dengan perincian pada kisi-kisi yang telah dibuat. Kualitas tes secara keseluruhan sangat berpengaruh dengan tingkat kebaikan dari masing-masing soal yang menyusunnya.
3. Menelaah soal tes, dilakukan untuk memperbaiki soal jika ternyata dalam pembuatannya masih ditemukan kekurangan atau kesalahan. Telaah soal ini sebaiknya dilakukan oleh orang lain, bukan si pembuat soal.
4. Melakukan uji coba tes, sebaiknya dilakukan untuk memperbaiki kualitas soal. Uji coba ini dapat digunakan sebagai sarana memperoleh data empirik tentang tingkat kebaikan soal yang telah disusun. Melalui uji coba soal dapat diperoleh data reliabilitas, validitas, tingkat kesukaran, efektifitas pengecoh, daya beda dan lain-lain.
5. Menganalisis butir soal, setelah dilakukan uji coba soal akan diketahui mengenai kualitas masing-masing butir soal yang meliputi: tingkat kesukaran, efektifitas pengecoh dan daya beda.
6. Memperbaiki tes, dilakukan tentang perbaikan bagian soal yang masih belum sesuai dengan yang diharapkan.
7. Merakit tes, setelah semua butir dianalisis dan diperbaiki langkah selanjutnya adalah merakit semua tes menjadi satu kesatuan tes. Keseluruhan butir perlu disusun secara hati-hati menjadi kesatuan soal yang terpadu.
8. Melaksanakan tes, yang diberikan kepada testee untuk diselesaikan.

C. Tes Sebagai Hasil Belajar Kognitif
Dalam menyusun tes, perlu diperhatikan tipe hasil belajar atau tingkat kemampuan berpikir mana saja yang akan diukur atau di nilai. Penentuan tipe hasil belajar atau tingkat kemampuan berpikir yang akan dinilai maka penyusunan tes dapat berpedoman pada indikator pembelajaran atau tujuan evaluasi itu sendiri. Sehingga pemilihan alat evaluasi dan penyusunan instrumen tes akan tepat sesuai dengan tingkat kemampuan berpikir peserta didik.
Bloom membagi tingkat kemampuan atau tipe hasil belajar yang termasuk aspek kognitif menjadi enam yaitu: Pengetahuan hafalan, pemahaman atau komperhensi, penerapan aplikasi, analisis, sintesis dan evaluasi. yaitu:
1. Pengetahuan hafalan (C1) atau knowledge ialah tingkat kemampuan yang hanya meminta responden atau testee untuk mengenal atau mengetahui adanya konsep, fakta, atau istilah-istilah tanpa harus mengerti atau dapat menilai atau dapat menggunakannya. Dalam hal ini biasanya testee hanya dituntut untuk menyebutkan kembali (recall) atau menghafal saja.
2. Pemahaman atau komprehensif (C2) adalah tingkat kemampuan yang mengharapkan testee mampu memahami arti atau konsep, situasi serta fakta yang diketahuinya. Dalam hal ini testee tidak hanya hafal secara verbal akan tetapi juga memahami konsep dari masalah atau fakta yang ditanyakan
3. Aplikasi atau penerapan (C3) adalah penggunaan abstraksi pada situasi konkret atau situasi khusus. Testee dituntut kemampuannya untuk menerapkan atau menggunakan apa yang telah diketahuinya dalam situasi baru baginya (diabstrakkan). Abstraksi ini dapat berupa ide, teori, atau petunjuk praktis.
4. Kemampuan analisis dan sintesis (C4) adalah kemampuan yang mengukur testee untuk menganalisis atau menguraikan suatu integritas atau situasi tertentu ke dalam komponen-komponen atau unsur-unsur pembentuknya. Diharapkan siswa dapat memahami dan sekaligus mampu memilah-milahnya menjadi bagian-bagian, termasuk juga menguraikan bagaimana proses terjadinya sesuatu, cara bekerjanya sesuatu, atau mungkin juga sistematikanya. Sedangkan kemampuan sintesis adalah penyatuan unsur-unsur atau bagianbagian ke dalam suatu bentuk yang menyeluruh. Diharapkan testee mampu menemukan hubungan kausal atau urutan tertentu atau menemukan abstraksinya yang berupa integritas.
5. Kemampuan evaluasi (C5) adalah kemampuan testee untuk membuat suatu penilaian tentang suatu pernyataan, konsep, situasi, dan sebagainyaberdasarkan suatu kriteria tertentu. Kegiatan penilaian dapat dilihat dari segi tujuannya, gagasannya, cara bekerjanya, cara pemecahannya, metodenya, materinya atau lainnya.
6. Kemampuan berkreasi/berkreativitas (C6) adalah tingkat kemampuan untuk merancang, membangun, merencanakan, memproduksi, menemukan, membaharui, menyempurnakan, memperkuat dan menggubah sesuatu menjadi baru.



D. Analisis Soal dengan Program ITEMAN
ITEMAN  merupakan  perangkat/program  untuk  menganalisis  butir  soal  dan tes. Program ini didasarkan pada teori tes klasik. Menurut Rudyatmi dan Anni    analisis  soal  secara  klasik  adalah  proses  penelaahan  butir  soal  melalui  informasi  dari  jawaban  peserta  didik  guna  meningkatkan  mutu  butir  soal  yang  bersangkutan  dengan  menggunakan  teori  klasik.  Melalui  data  empiris  butir  soal  yang  ditampilkan  dapat  menjelaskan  kualitas  soal  tersebut.  Menurut  Abidin  terdapat kelemahan utama dari program ini yaitu sangat dipengaruhi oleh  kemampuan  responden.  Artinya  jika  soal  diujikan  pada  anak  berkemampuan  tinggi  dengan  anak  berkemampuan  rendah  maka  akan  terjadi  perbedaan  hasil analisis.  Untuk  mengantisipasi  hal  tersebut  maka  biasanya  analisis  soal  dengan menggunakan ITEMAN dilakukan secara sampling. Semakin besar sampling dan  semakin baik teknik samplingnya maka semakin baik kualitas hasil analisis. Azwar  yang  diacu  dalam  Kustriyono  menyatakan  bahwa  pada  analisis butir menggunakan teori tes klasik tipe objektif, kualitas butir dilihat dari paling tidak dua parameter yaitu tingkat kesukaran dan daya pembeda. Selain itu juga menguji efektifitas distraktor-distraktor pada setiap butir untuk menentukan apakah distraktor tersebut berfungsi atau belum.
Program ini termasuk satu paket dalam MicroCat yang dikembangkan oleh Assessment  System  Corporation  mulai  tahun  1982  dan  mengalami  revisi  pada  tahun  1984,  1986,  1988,  dan  1993:  mulai  dari  versi  2.00  sampai  dengan  versi  3.50. Menurut Rudyatmi dan Anni  adapun fungsi dari program ITEMAN adalah:
a. Untuk  menganalisis  data  file  (format  ASCII)  jawaban  butir  soal  yang  dihasilkan manual melalui manual entry data atau dari mesin scanner
b. Menskor  dan  menganalisis  data  soal  pilihan  ganda  untuk  30.000  siswa  dan  250 butir soal
c. Menganalisis sebuah tes  yang terdiri dari 10 skala (subtes) dan memberikan
informasi  tentang  validitas  setiap  butir  (daya  pembeda,  tingkat  kesukaran, proporsi jawaban pada setiap option), reliabilitas (KR-20/Alpha), standar error measurement,  mean,  variance,  standar  deviasi,  skew,  kurtosis  untuk  jumlah  skor  pada  jawaban  benar,  skor  minimum  dan  maksimum,  skor  median  dan  frekuensi distribusi skor.
Menurut  Abidin  (2008)  program  ITEMAN  juga  memberikan  hasil  skor  untuk  setiap  peserta  tes  yang  menunjukkan  jumlah  benar  dari  seluruh  jawaban.  Sebelum menggunakan program ITEMAN perlu diketahui bahwa terdapat 5 baris  utama yang harus dientrykan. Data yang akan dianalisis diketik melalui  notepad  atau  Microsoft Office Word  dengan jenis font  Courier New. File data yang akan  dientrykan ke program ITEMAN terdiri atas 5 baris yaitu:
a. Baris pertama adalah baris pengontrol yang mendeskripsikan data
b. Baris kedua adalah daftar kunci jawaban setiap butir soal
c. Baris ketiga adalah daftar jumlah option untuk setiap butir soal
d. Baris  keempat  adalah  daftar  butir  soal  yang  akan  dianalisis  (jika  butir  yang akan dianalisis diberi tanda Y, jika tidak diikutkan dalam analisis diberi tanda N)
e. Baris kelima dan seterusnya adalah data siswa dan jawaban pilihan siswa
Setiap  pilihan  jawaban  siswa  (untuk  soal  pilihan  ganda)  diketik  dengan  menggunakan huruf, misal ABCD atau 1234 untuk 4 pilihan jawaban, sedangkan  untuk 5 pilihan jawaban yaitu ABCDE atau 12345.
Adapun langkah-langkah melakukan analisis soal dengan ITEMAN:
a. Membuat File Data
1) Contoh File data (file data ditulis dengan notepad  atau Microsoft Office Word dengan jenis font Courier New).
2) Keterangan Pengisian File Data.
b. Baris Pertama:
Kolom 1-3 : jumlah butir soal (contoh: 020)
4 : Spasi
5 : jawaban kosong (omit), ditulis 0
6 : Spasi
7 : soal yang belum dikerjakan, ditulis n
8 : spasi
9-10 : jumlah identitas data siswa (contoh: 10)
Tambahan keterangan:
Kolom  1-3,  Untuk  menuliskan  jumlah  soal:  Kolom  1  ratusan,  kolom  2  puluhan, kolom 3 satuan
Kolom 5 : butir soal yang tidak dijawab
Kolom 7 : butir soal yang belum sempat dikerjakan
Kolom 9-10: panjang karakter untuk identitas siswa.
1)  Baris kedua : kunci jawaban
2)  Baris ketiga :jumlah jawaban
3)  Baris  Keempat  :  „Y‟  butir  soal  yang  dianalisis,  „N‟  butir  soal  yang  tidak dianalisis
4)  Baris kelima dan seterusnya : berisi jawaban siswa
c. Menjalankan Program Iteman
1)  Double klik file program ITEMAN
2)  Tulislah file data: contoh TIK.TXT, kemudian tekan enter
3)  Ketik nama file hasil analisis, contoh HSL.TXT, kemudian tekan enter
4)  Ketik „Y‟, kemudian tekan enter
5)  Ketik file untuk total skor siswa, contoh SKOR.TXT, kemudian tekan enter.
6)  Analisis selesai
d. Interpretasi hasil Analisis
Hasil analisis dengan  ITEMAN dapat dibedakan menjadi 2 bagian,  yaitu  statistik butir soal dan hasil analisis statistik tes/skala.
a) Statistik  butir  soal
adalah  untuk  tes  yang  terdiri  dari  butir-butir  soal  yang bersifat dikotomi misalnya pilihan ganda. Statistik berikut adalah output dari  setiap butir soal yang dianalisis:
1) Seq.N : adalah nomor urut butir soal dalam file data
2) Scala item : nomor urut butir soal dalam tes
3) Prop.Correc  : proporsi siswa  yang menjawab benar butir tes (indeks tingkat  kesukaran  soal  secara  klasikal).  Nilai  ekstrim  (mendekati  nol  atau  satu) menunjukkan bahwa butir soal tersebut terlalu sukar atau terlalu mudah untuk peserta  tes.  Indeks  ini  disebut  juga  indeks  tingkat  kesukaran  soal  secara klasikal.
4) Biser  :  indeks  daya  pembeda  soal  dengan  menggunakan  koefisien korelasi biserial.  Nilai  positif  artinya  peserta  tes  yang  menjawab  benar  butir  soal mempunyai  skor  relatif  tinggi  dalam  tes  tersebut.  Sebaliknya  nilai  negatif  menunjukkan bahwa peserta tes  yang menjawab  benar butir tes memperoleh skor  tes  yang  relatif  lebih  rendah  dalam  tes.  Untuk  statistik  pilihan  jawaban korelasi  biserial  negatif  sangat  tidak  dikehendaki  untuk  kunci  jawaban  (alternatif)  dan  sangat  dikehendaki  untuk  pilihan  jawaban  yang  lain  (pengecoh).
5) Point biserial : juga indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan  menggunakan  koefisien  point  biserial.  Penafsirannya  sama  dengan statistik  biserial.  Statistik  pilihan  jawaban  (alternatif)  memberikan  informasi yang  sama  dengan  statistik  butir  soal.  Perbedaannya  adalah  bahwa  statistik pilihan  jawaban  dihitung  secara  terpisah.  Untuk  setiap  pilihan  jawaban  dan didasarkan pada pilihan tidaknya alternatif tersebut, bukan pada jawabannya. Tanda  bintang  yang  muncul  di  sebelah  kanan  hasil  analisis  menunjukkan kunci jawaban.

b) Statistik tes
1) N of Items : jumlah butir soal dalam tes yang dianalisis.
2) N of Examines: Jumlah peserta tes
3) Mean : Skor atau rerata peserta tes
4) Variance  : varian dari distribusi skor peserta tes yang memberikan gambaran   tentang sebaran skor peserta tes.
5) Std.Deviasi : Deviasi standar dari distribusi skor tes (akar dari varians)
6) Skew  :  kemiringan  distribusi  skor  peserta  tes  yang  memberikan  gambaran tentang bentuk distribusi skor peserta tes. Kemiringan negative menunjukkan  bahwa sebagian besar skor berada pada bagian atas (skor tinggi) dari distribusi  skor. Sebaliknya, kemiringan positif menunjukkan bahwa sebagian besar skor  pada  bagian  bawah  (skor  rendah)  dari  distribusi  skor.  Kemiringan  nol menunjukkan bahwa skor berdistribusi secara simetris di sekitar skor rata-rata.
7) Kurtosis :  puncak distribusi skor  yang menggambarkan kelandaian distribusi  skor dibanding dengan distribusi normal. Nilai positif menunjukkan distribusi yang lebih lancip (memuncak) dan nilai negative menunjukkan distribusi yang lebih landai (merata). Kurtosis untuk distribusi normal adalah nol.
8) Minimum : skor terendah peserta tes
9) Maximum : skor tertinggi peserta tes.
10) Median  :  skor  tengah  dimana  50%  berada  pada  atau  lebih  rendah  dari  skor  tersebut.
11) Alpha  :  koefisien  reliabilitas  alpha  untuk  tes  atau  skala  tersebut  yang  merupakan indeks homogenitas tes atau skala. Koefisien alpha bergerak dari  0,0 sampai 1,0. Koefisien alpha hanya cocok digunakan untuk tes yang bukan  mengukur kecepatan dan yang hanya mengukur satu dimensi. Semakin tinggi  koefisien alpha menandakan semakin reliabel suatu soal.
12) SEM  :  kesalahan  pengukuran  standar  untuk  setiap  tes  atau  skala.  SEM merupakan estimasi dari deviasi standar kesalahan pengukuran dalam skor tes.
13) Mean P  : rerata tingkat kesukaran semua butir soal dalam tes secara klasikal  dihitung  dengan  cara  mencari  rata-rata  proporsi  peserta  tes  yang  menjawab benar untuk semua butir soal dalam tes.
14) Mean item tot : nilai rata-rata indeks daya pembeda dari semua soal dalam tes yang diperoleh dengan menghitung nilai rata-rata point biseral dari semua soal dalam tes.
15) Mean  biserial  :  nilai  rata-rata  indek  daya  pembeda  yang  diperoleh  dengan menghitung nilai rata-rata korelasi biserial dari semua butir



BAB III
PENUTUP

Kesimpulan
Analisis soal merupakan suatu kegiatan sistematis yang meliputi pengumpulan dan pengolahan data berupa tes atau soal yang dilakukan secara kualitatif dan kuantitatif guna memperoleh informasi untuk menentukan kesimpulan kualitas soal tersebut.
 Dalam analisis butir soal  harus adanya validitas dan realibitas,. Dalam validitas mencakup: validitas logis dan validitas empiris. Sedangkan realibitas merupakan  indeks  yang menunjukkan sejauh mana suatu alat pengukur dapat dipercaya dan dapat diandalkan, sehingga butir soal yang akan dibereikan kepada peserta tes yang berupa tes tulis maupun lisan dapat dibuktikan keakuratannya.
Sebelum soal diberikan pada siswa sebaiknya soal disusun sesuai dengan peruntukannya, artinya soal tersebut harus berkualitas. Menurut Suryabrata yang diacu dalam Purnomo menjelaskan bahwa soal-soal yang telah ditulis dengan hati-hati berdasarkan pertimbangan tidak begitu saja dapat dianggap sebagai soal yang baik karena harus diuji melalui penelaahan soal. Oleh karena itu perlu adanya langkah-langkah pengembangan tes. Disertakan dengan pemahaman mengenai aplikasi ITEMAN untuk mempermudah dalam pelaksanaan perhitungan hasil tes.











DAFTAR PUSTAKA
Mulyasa. Analisis, Validitas, Realibilitas, dan Interprestasi Hasil tes. (Bandung: PT. Remaja Rosdakarya).
Ngalim Purwanto. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. (Bandung: Remaja Rosdakarya).
Supriyadi. 2013. Modul Evaluasi Pembelajaran Bahasa dan Sastra. (Gorontalo: UNG Press Gorotalo).
Tim Prima Pena. Kamus Besar Bahasa Indonesia (...: Gitamedia press).





Tidak ada komentar:

Posting Komentar