Pertemuan 11 Analisis instrumen test secara kuantitatif Tingkat kesulitan dan daya pembeda butir soal. Panjang soal 20, memiliki 20 butir soal. Panjang soal=ukuran soal berdasar banyaknya soal/test lang. Butir soal itu sebuah tugas dari sebuah soal. Reliabilitas itu reliabilitas instrumen/angket/tes, berlaku pada sebuah perangkat instrumen. reliabilitas perangkat tes bukan reliabilitas butir kecuali prosedur untuk memperoleh butir mana koef rendah sehingga dapat dibuang sehingga untuk meningkatkan reliabilitas tes/instrumen. Analisis item tergantung apakah referennya itu criterion referen atau norm referen. Analisis instrumen test secara kuantitatif. Jika yang dianalisis adalah tes untuk mengetahui validitas tes dan reliabilitas tes. Kalau analisis instrumen item tes yang dianalisis validitas dan reliabilitas item test bukan sebagai tujuan akhir itu suatu langkah yg reliabilitasnya rendah dikeluarkan dari perangkat tes agar reliabiliatasnya meningkat menjadi tinggi. Validitas item jika ada item-itemnya tidak valid tidak dipakai harus disusun kembali dibenahi tidak dibuang. Instrumen sudah disusun untuk mengukur kemampuan tertentu. Hasil belajar, kompetensi, kalau dibuang tidak akan mengukur apa yang diukur jadi harus dibenahi harus dibetulkan. Kalau berdasarkan validitas dibenahi. Reliabel item dibuang. Ahli pengukuran terkait reliabilitas setiap instrumen harus dibuat itemnya 20, dibuat 40. Reliabel tinggi dipilih tetap kembali ke kisi-kisi. Dengan kata lain hukum bahwa item-item /item perangkat instrumen tes yang valid pasti reliabel. Jadi kalau ada item2 jelek dibenahi reliabel naik. Instumen valid pasti reliabel. Uji validitas itemnya. Diulang sampai valid. Jika tidak mempunyai instrumen standar untuk menyelidiki validitas standar metodenya criterion referen. Analisis item tidak punya item yang baku. Jiika ada item baku korelasikan dengan item baku. Validitas item memperhatikan 2 unsur, salah satu dari hal itu, untuk mengukur hasil belajar atau bukan untuk hasil belajar. Hasil belajar dalam rangka anak yang belum belajar dan sudah belajar indeks maka dihitung indeks sensitivitas item. Instrumen tes, tes seleksi harus memuat : TPA tentu ada kriterianya. Kemampuan kuantitatif, silogisme, ada 3 komponen TPA. Item mana yang daya pembeda tinggi. Item/butir soal/item tes/butir tes. Tes seleksi dari bank soal. Lembaga independent=lembaga pengembangan tes. Tes seleksi CPNS untuk menyusun perangkat tes, apakah sudah dijamin validitasnya? Apakah punya bank soalnya yang mengelola fakultas psikologi. Analisis item. Item untuk apa? Hasil belajar/seleksi. Indek sensitivasnya. Indeks pembeda atau kesukaran. ASIIN daya serap/kesukaran/diperbaiki. Item yang sulit, UAS, tujuan tes hasil belajar/UAS/UTS=mengetahui kemampuan peserta didik. Soalnya sukar, belum optimal. Instruksi dosen perbaiki pembelajaran tahun depan. Credit point. PP 57 th 2021. Soalnya karena terlalu sulit tidak tahu kompetensi yang mau diukur. Kompetensi yang ditargetkan terlalu tinggi. Dosen tidak paham kompetensi. Soalnya salah. Dosen tidak bisa memilih pembelajan yang tepat. Hasil belajar koefisien kapa. Stark norm referen. 2 kalinya. Skor item dengan skor total dari tes itu sendiri. Korelasinya rendah dibuang. Daya pembeda diserial. Rendah koef di drop. Korelasi point biserial. Item dengan total skor. Point biserial. Klasik, indek kesukaran 0,1 berapa anak yang yang bisa mengerjakan 10 %. Soalnya sukar. 0,9, 90 %. Semakin tinggi indeks kesukaran semakin mudah. Analisis item menurut tes klasik CTT. IRT kemampuan anak x indek kesukaran x=koef ability dan deficulty. Sekamin positif semakin sukar semakin sedikit yang bisa mengerjakan. Quest. 1. Penyelidikan secara empiris tingkat ins, butir ins. 2. Validitas baku dan ins baku concarren related validity. Hasil belajar itu tidak pakai IRT. 1. Penyelidikan secara empiris ada tingkat instrumen ada tingkat butir instrumen. 2. Tingkat instrumen apakah itu tes atau non tes:angket. kalau validitas HARUS dikorelasikan dengan tes baku/instrumen baku. Disebut dengan concurrent releted validity. Namun jika Instrumen baku tidak tersedia maka dilakukan analisis item dengan norm reference atau criterion reference. Criterion reference analisisnya dengan indek sensitivitas item. Untuk norm reference menggunakan daya pembeda dan indeks kesukaran. 3. Item yang jelek harus diperbaiki. Kalau untuk tes seleksi buat itemnya more than one of each aspek/sub aspek. Kalau kisi-kisi direvisi. Hasil belajar tidak bisa dibuang. Reliablitas seleksi=dihitung, belah dua, pretetes, analisis itemnya item mana yg terhaadap skor toal rendah, point biserial rendah dibuang. Hasil belajar koleksi di bang soal sensitivitas item.