Pengembangan tes

PENGEMBANGAN TES
1. Bagaimana Anda merencanakan
tes?
2. Mengapa Anda menyelenggarakan
tes?
3. Apa saja yang Anda perhatikan
untuk mengetahui kualitas tes?
1
Clasroom Testing
Tidak standar
Dibuat oleh guru
Untuk skala kecil
Clasroom Assessment
Pengembangan tes dan penskoran
dilakukan oleh guru
Mengkomunikasikan kekuatan dan
kelemahan siswa
Memonitor progress siswa
Mengevaluasi keefektifan
pembelajaran
Standardize Testing
Ilmiah
Dipandu dengan standar profesional
Dikembangkan oleh ahli psikometri
Untuk skala luas
Isi seragam
Kondisi/administrasi seragam
Penskoran seragam
Tes standar bukan berarti:
Tes MC
Kemampuan dasar atau kemampuan
berpikir tingkat rendah
Tidak melibatkan performance
assessmen
Tes yang bias
Secara otomatis dapat digunakan
kembali
Langkah Pengembangan Tes
Menentukan tujuan
Mendefinisikan konstruk yang
hendak diukur
Mengembangkan spesifikasi isi tes
Memilih format tes yang akan
digunakan
Mengembangkan butir soal
berdasarkan spesifikasi isi
Langkah Pengembangan Tes (Cont)
Mereview isi dan alat ukur (tes)
Mengembangkan rubrik penskoran
Merakit soal menjadi tes untuk
ujicoba
Sensitivity review
Mengujicoba tes
Menganalisis hasil ujicoba
Langkah Pengembangan Tes (Cont)
Menyeleksi dan merevisi soal
Merakit soal menjadi tes final
(termasuk petunjuk mengerjakan)
Menstandarkan tes (necessary)
Mengembangkan petunjuk/manual
Melakukan validasi
Menyusun ulang, merevisi tes dan
manual.
Three Components in the
Educational Process:
Curriculum
Instruction
Testing
9
1. Menentukan Tujuan Tes
- Mengapa diperlukan tes?
- Informasi apa yang akan diperoleh
dari skor tes?
- Skor tes cocok digunakan untuk
apa?
Contoh pernyataan tujuan tes
Tujuan dari tes ini adalah untuk
mengukur pemahaman mahasiswa
terhadap kualitas soal, reliabilitas
tes, dan validitas tes, serta
mengetahui kemampuan mahasiswa
dalam menggunakan konsep
tersebut dalam penelitian
Example purpose statements
(2) Intro Stats 1 Midterm (continued)
Students’ grades on the midterm will
constitute 30% of their final grade in
this course.
12
2. Pendefinisian Konstruk
Pernyataan secara umum
Spesifikasi tes
Objektifitas tes
Standar tampilan
Pendefinisian Konstruk
a. Pernyataan umum
The SAT Reasoning Test measures
verbal and mathematical reasoning
skills students need to be
successful academically.
b. Spsifikasi Tes
Tabel spesifikasi:
content area vs cognitive levels
14
Tes Kemampuan IPA
Cognitive Area
Content Area
Knowledge &
Comprehension
Application
Analysis,
Synthesis,
Evaluation
Fisika
Biologi
Kimia
15
Dimensi Content
Daftar content yang akan diukur
termasuk subpokok bahasan
Contoh:
Fisika: mekanika, gelombang, bunyi,
listrik, dll
Biologi: tumbuhan, hewan, dll
16
Mendefinisikan content area
Lihat
- bab pada buku
- standar kompetensi nasional
- silabus
17
Dimensi Kognitif
 Blooms Taxonomy (1956)
–
–
–
–
–
–
Knowledge (C1)
Comprehension (C2)
Application (C3)
Analysis (C4)
Synthesis (C5)
Evaluation (C6)
 “Lower-level” vs. “Higher-level” thinking
skills
18
Taksonimi Kognitif yang lain
(“Reasoning Frameworks”)
Stiggins (1997)
– Knowledge
– Reasoning
– Skills
– Products
Norris & Ennis (1989)
Marzano (1992)
Quellmalz (1987)
19
Bloom’s is most popular method
for defining cognitive dimension
Performance at a higher level implies ability to also
perform at lower levels.
20
Bloom’s: A pyramid or a “T?”
Synthesis
Evaluation
Analysis
Application
Comprehension
Knowledge
21
Bloom’s cognitive taxonomy
I.
Knowledge: kemampuan
menyatakan kembali apa yang
telah dipelajari (mis: prinsip,
konsep, fakta, definisi)
Kk operasional: menyebutkan, menunjukkan, mendefinisikan
Contoh:
Satuan daya listrik adalah …
a.
b.
c.
d.
Volt
Ampere
Watt
joule
22
Bloom’s cog. taxonomy (cont.)
II.
Comprehension: Kemampuan memahami
sesuatu
KK Operasional: menjelaskan, menginterpretasikan, mendemonstrasikan,
menyajikan, memberikan contoh, memperkirakan, menentukan
Contoh:
1. Seterika listrik makin lama makin panas karena …
a.
arus listrik yang mengalir dalam seterika semakin besar
b.
tegangan listrik dalam seterika semakin besar
c.
Arus listrik yang mengalir dalam seterika makin lama
d.
Daya listrik dalam seterika semakin besar
2. What was the main idea of the passage?
23
Bloom’s cog. taxonomy (cont.)
III.
Application: kemampuan menggunakan
prinsip, teori, hukum, dll pada situasi
baru/nyata
KK Operasional: menggunakan, menerapkan, menggeneralisasikan,
menghubungkan, memilih, menghitung, menemukan,
mengembangkan, menyusun, menunjukkan,
mengklasifikasikan, mengubah
Contoh:
Adi hendak membuat kompor listrik yang dapat
menghasilkan daya 450 watt pada tegangan 225 volt. Jika
hambatan jenis kawat yang digunakan adalah 25 ohm/m,
maka panjang kawat yang digunakan adalah …
a. 2,0 m
b. 4,5 m
c. 9,0 m
d. 13,5 m
24
Bloom’s cog. taxonomy (cont.)
IV. Analysis: kemampuan memilah
suatu integritas menjadi unsur-unsur
atau bagian
KK Operasional: menganalisis, membedakan, menemukan,
mengklasifikasikan, membandingkan
Contoh:
25
Bloom’s cog. taxonomy (cont.)
V.
Synthesis: kemampuan untuk
mengintegrasikan bagian-bagian yang
teroisah menjadi satu kesatuan
KK Operasional: mensintesis, menghubungkan, menghasilkan, merumuskan,
mengubah, merencanakan, menggabungkan, mengorganisasikan,
mengklasifikasikan, menyimpulkan
Contoh:
Banyaknya energi yang yang dihasilkan oleh sumber listrik sebanding dengan
…
1. Kuadrat kuat arus 2. besar hambatan yang dilaluinya
3. lama arus listrik mengalir 4. tegangan sumber listrik
Pilihlah: a. Jika 1, 2, 3 benar
b. Jika 1 dan 2 benar
c. Jika 2 dan 4 benar
d. Jika hanya 4 yang benar
e. Jika semua benar
26
Bloom’s cog. taxonomy (cont.)
VI.
Evaluation: kemampuan membuat
keputusan tentang nilai sesuatu yang
mungkin dilihat dari segi tujuan,
gagasan, cara kerja, metode, dan
kriteria tertentu
KK Operasional: menilai menafsirkan, menentukan, mempertimbangkan,
membandingkan, menaksir, melakukan, memutuskan
27
Linn & Gronlund (2000, p. 60)
Simpler framework
– Knowledge
– Understanding
– Application
Helps move from assessing factual
information (testing lower skills) to
assessment of more complex learning
outcomes.
28
Popham (2002, p. 101)
Even simpler taxonomy
– Knowledge
– Anything higher than knowledge
Popham (1992)
– Give very general specifications with
lots of examples of good items
29
MA ABE Math Tests: Level 2
Cognitive Area
Knowledge &
Comprehension
Application
Anal.
Synt,
Eval
Number Sense
15%
15%
5%
35%
Patterns, Func,Alg.
6%
6%
3%
15%
Stat & Prob.
10%
10%
5%
25%
Geom/Measuremt.
10%
10%
5%
25%
41%
41%
18%
100
%
Content Strand
30
MCAS Math Content Distribution
31
MCAS Cognitive Distribution
32
MCAS 2001 Grade 4 Math
Content Strand
Number Sense,
Operations
Patterns, Relations,
Algebra
Geometry,Measure
ment
Data analysis, stat.,
probability
Total
Score Points % of Total
19
35
11
20
13
25
11
20
54
100
33
MCAS Purpose
34
What did we learn today?
Resources
 Crocker & Algina, Introduction to Classical &
Modern Test Theory
 Anastasi, Psychological Testing
– Available in Bahasa Indonesia
Presentation contributed by Stephen G. Sireci
36