Instrumentasi Tes: Tes-Tes Kelompok
A.
Tes kelompok versus tes individual
Tes Individu pada dasarnya memiliki beberapa jenis – jenis tes yang
mencakup pada individual, dianatara lain tes kepribadian, tes intelegensi, tes
kemampuan, dan lain-lain. Semua tes menggambarkan karakteristik seseorang dalam
berbagai aspek yang diukur melalui tes yang dinginkan dari salah satu jenis tes
individual (Anastasi dan Urbina, 1997).
Tes individu disebut juga
dengan tes yang diberikan perorangan yaitu tester berhadapan dengan orang yang
di tes (testee). Tes Kelompok adalah tes yang digunakan terutama dalam bidang
pendidikan, pegawai negeri, industri, dan dinas militer.
Tidak ada pendekatan tunggal dalam pengukuran. Perbedaan teori
dapat menyebabkan pula perbedaan objek ukur dikarenakan perilaku manusia yang
tidak terbatas, permasalahan pengambilan sampel perilaku, adanya unsur eror
dalam pengukuran, permasalahan konsistensi dan ketepatan pengukuran, satuan
dalam pengukuran, permasalahan interpretasi hasil pengukuran, hubungan dengan
konstrak lain dan hasil pengukuran dikaitkan dengan fenomena lain yang dapat
diamati.
Perbedaan antara tes individu dan kelompok
diantaranya :
1. Dalam hal bentuk maupun susunan butir soal
(item).
2. Pertanyaan-pertanyaan terbuka (open-ended)
yang mengundang tanggapan bebas dapat digunakan, dan digunakan dalam tes-tes kelompok awal, dewasa ini tes khusus menggunakan butir soal
multi pilihan.
3. Perubahan ini dituntut demi keseragamaan
dan obyektivitas skoring.
4. Kontrol atas kesulitan soal.
5. Pemberian skor objektif dengan menggunakan
program.
Beberapa keuntungan dan kerugian tes
Individu diantaranya:
a. Keuntungan tes Individu
1. Tester dapat melakukan observasi yang
mendalam terhadap testee.
2. Lebih mendalam mengetahui karakter spesifik
individu.
3. Isi atau konten pertanyaan lebih spesifik
dan mendalam.
b. Kerugian tes Individu
1. Memerlukan waktu yang lebih banyak
dibandingkan tes kelompok.
2. Hasil tes bersifat spesifik pada individu
tertentu dan tidak bisa digeneralisasikan kepada individu lain.
Beberapa keuntungan dan kerugian tes
kelompok adalah:
a. Keuntungan Tes Kelompok
1. Alat ini dirancang untuk testing massal.
2. Diselenggarakan secara simultan bagi banyak
mungkin orang yang benar-benar bisa disesuaikan dengan ruang yang tersedia dan
jangkauan suara mikrofon.
3. Soal-soal yang dicetak dan jawaban-jawaban
sederhana yang dapat direkam pada sebuah brosur tes atau lembaran jawaban, atau
pada sebuah komputer, hubungan orang perorang antara penguji dan peserta tes
bisa diabaikan.
4. Waktu testing yang tersedia dapat digunakan
lebih efektif jika setiap peserta tes berkonsentrasi kepada soal-soal yang
sesuai kemampuannya.
b. Kerugian Tes Kelompok
1. Penguji memiliki peluang yang jauh lebih
kecil untuk behubungan, bekerjasama, dan mempertahankan minat peserta tes.
2. Kondisi peserta sakit, lelah, riasu, cemas
yang bis mempengaruhi kinerja tes kurang didektesi dalm testing kelompok dibandingkan
testing individual.
3. Tes
diselenggarakan karena keterbatasan-keterbatasan yang diberikan pada jawaban-
jawaban peserta.
4. Observasi kurang mendalam kepada setiap
individu.
Jenis-jenis tes yang termasuk
dalam tes individu:
1.
Tes Inteligensi
a.
Stanford Binet
Digunakan
untuk anak-anak yang berusia 2 tahun sampai dengan orang dewasa yang berusia 85
tahun keatas. Tes-tes dalam
skala ini dikelompokkan menurut berbagai level usia mulai dari Usia-II sampai
dengan Usia Dewasa-Superior. Diantara Usia-II dan Usia-V, tesnya meningkat
dengan interval setengah tahunan, sedangkan diantara Usia-V dan Usia-XIV, level
usia mengingkat dengan interval satu tahunan. Level-level selanjutnya
dimaksudkan sebagai level Dewasa-Rata-rata dan level Dewasa-Superior I, II, dan
III.
Setiap
level usia dalam skala ini berisi enam tes, kecuali untuk level
Dewasa-Rata-rata yang berisi delapan tes. Dalam masing-masing tes untuk setiap
level usia terisi soal-soal dengan taraf kesukaran yang tidak jauh berbeda.
Berdasarkan perbedaan taraf kesukaran yang kecil itulah disusun urutan soal
dari yang paling mudah sampai yang paling sukar.
Skala
Stanford-Binet dilaksanakan secara individual dan soal-soalnya diberikan secara
lisan oleh pemberi tes. Penyajian tesnya sendiri mengandung kerumitan yang
spesifik bagi masing-masing individu yang dites. Tidak ada individu yang
dikenai semua soal dalam tes karena setiap subjek hanya diberikan soal dalam
tes yang berada dalam cakupan level usia yang sesuai dengan level
intelektualnya masing-masing.
Untuk
memperoleh angka IQ skor pada skala Stanford-binet diubah atau dikonversikan
dengan bantuan suatu tabel konversi. IQ yang dihasilkan oleh skala ini
merupakan IQ-deviasi yang mempunyai rata-rata (mean) sebesar 100 dan deviasi SD
sebesar 16. Versi terbaru skala Stanford-Binet diterbitkan pada tahun 1986.
Terbitan terbaru Stanford-Binet: edisi kelima (SB5) menggarisbawahi pemisahan
intelegensi menjadi lima faktor dan dua bidang (verbal dan non verbal) sehingga
menghasilkan 10 subtes. Kelima faktor tersebut adalah: Fluid Reasoning,
Pengetahuan, Penalaran Kuantitatif (tes kuantitatif, rangkaian angka),
Penalaran Visual-Spasial (melipat kertas, mengkopi), Working Memory (memori
kalimat, memori sajian urutan benda).
b.
Skala Kaufman
Terdapat
2 jenis yaitu:
1.
Kaufman Assessment Battery for Children (K-ABC)
Tes
ini diciptakan oleh Alan S. Kaufman dan Nadeen L. Kaufman dari the University
of Alabama.
Skala-skala
inteligensi dalam baterai (rangkaian) ini adalah Sequal Processing Scale dan
Simulation Processing Scale. Sequal Processing Scale yaitu skala yang
mengungkap abilitas atau kemampuan untuk memecahkan permasalahan secara
bertahap dengan penekanan pada hubungan serial atau hubungan temporal diantara
stimulus. Stimulus ini, baik verbal maupun visual harus ditangni secara
berurutan agar tercapai performansi yang optimal. Dalam K-ABC kemampuan ini
diungkap antara lain oleh subtes Word Order dimana subjek harus menunjuk pada
bayangan gambar dalam urutan sama dengan urutan nama yang disebut oleh penguji.
Simulation
Processing Scale yaitu skala yang bertujuan mengungkap kemampuan anak dalam
memecahkan permasalahan dengan cara mengorganisasikan dan memadukan banyak
stimuli sekaligus dalam waktu yang sama. Permasalahan yang diajukan sering kali
bersifat analogi atau mengandung aspek spasial. Baik berwujud perseptual maupun
berujud konseptual, stimulusnya menghendaki pengerahan daya sintesis simultan
agar tercapai penyelesaian yang benar. Dalam K-ABC, stimulus bentuk ini
mencakup tugas pengenalan bercak tinta yang disajikan separuh selesai (Gestalt
Completion) dan analogi visual yang umumnya abstrak (Matrix Analogies). Baterai
(rangkaian) dalam skala ini juga menyajikan kombinasi Sequantial dan
Simultaneous Processing yang masing-masing disebut Mental Processing Composite
Scale, Achievement Scale, dan non-Verbal Scale. Skor pada kesemua skala dalam
K-ABC memiliki mean 100 dan unit SD sebesar 15 agar dapat dibandingkan langsung
satu sama lain dan dengan ukuran inteligensi lain.
Tes
ini dilaksanakan secara individual untuk anak-anak dan remaja untuk usia 3-18.
tujuannya yaitu untuk mengurangi perbedaan skor antara anak-anak dari kelompok
etnis dan budaya yang berbeda.
2.
Kaufman Brief Intelligence (K-BIT)
Tes
penyaringan intelegensi umum standar yang baru-baru ini dipublikasikan dalam
bentuk edisi kedua yaitu KBIT-2 yang terdiri dari
·
skala Crystallized atau verbal yang memiliki dua jenis soal
(pengetahuan verbal dan teka-teki)
·
skala non verbal atau Fluid yang mencakup soal-soal matriks.
KBIT-2 dilaksanakan untuk peserta berusia 4-90 tahun dan dalam
waktu kurang lebih 20 menit.
c.
Wechsler Adult Intellegence Scale (WAIS)
Skala
Weschler pertama kali diterbitkan pada tahun 1939 dengan nama Weschler-Bellevue
(W-B). Sasaran utama test ini adalah untuk menyediakan test intelegensi bagi
orang dewasa. Test ini dirancang untuk anak-anak sekolah dan diadaptasikan
untuk orang dewasa dengan menambahkan beberapa soal yang lebih sulit.
WAIS
telah mengalami revisi, dan diberi nama Weschler Adult Scale-Revised (WAIS-R)
yang mencakup jangkauan umur 16 sampai 74 tahun. Sebagaimana versi WAIS
sebelumnya, WAIS-R terdiri dari skala Verbal dan skala Performansi. Kedua skala
tersebtu masing-masing menghasilkan IQ-verbal dan IQ-performansi, sedangkan
kombinasi keduanya menjadi dasar untuk perhitungan IQ deviasi sebagai IQ
keseluruhan. Masing-masing test memiliki minimal 5 subtes dan maksimal 7
subtes. Secara lebih terperinci, isi masing-masing subtes dalam skala Verbal,
yaitu subtes Informasi, berisi 29 pertanyaan mengenai pengetahuan umum yang
dianggap dapat diperoleh oleh setiap orang dimana ia berada.
Soal-soal
dalam setiap subtes dirancang sesuai dengan tujuan penggunaan skala ini, yaitu
sebagia ukuran inteligensi orang dewasa yang dimaksudkan untuk digunakan pada
subjek yang berusia antara 16 sampai dengan 64 tahun. Dalam memberikan skor
untuk subtes Hitungan, Simbol Perakitan Angka, Rancangan Balok, Susunan Gambar,
dan Perakitan Objek, kebenaran jawaban dan kecepatan menjawab sangat
diperhitungkan. Jawaban yang benar akan tetapi diberikan setelah batas waktu
yang dibolehkan tidak akan mendapat skor. Semakin cepat penyelesaian diberikan,
skornya akan semakin tinggi.
d. Wechsler Intellegence Scale for Children (WISC)
Revisi
skala WISC yang dinamai WISC-R diterbitkan tahun 1974 dan dimaksudkan untuk
mengukur inteligensi anak-anak usia 6 sampai dengan 16 tahun. WISC-R terdiri
atas 12 subtes yang dua diantaranya digunakan hanya sebagai persediaan apabila
diperlukan penggantian subtes. Keduabelas subtes tersebut dikelompokkan menjadi
dua golongan, yaitu skala Verbal (verbal) yang terdiri dari information
(informasi), comprehension (pemahaman), arithmetic (hitungan), similiarites
(kesamaan), vocabulary (kosakata), dan digit span (rentang angka). Golongan
kedua adalah skala performansi (performance) yang terdiri dari picture
completion (kelengkapan gambar), picture arrangement (susunan gambar), block
design (rancangan balok), object assembly (perakitan objek), coding (sandi),
mazes (taman sesat).
Melalui
prosedur pemberian skor yang telah ditentukan, setiap subjek akan memperoleh
skor pada masing-masing subtes. Skor tersebut kemudian diterjemahkan ke dalam
bentuk angka standar melalui tabel norma sehingga akhirnya diperoleh suatu
angka IQ –deviasi untuk skala verbal, satu angka IQ-deviasi untuk skala verbal
dan satu angka IQ-deviasi untuk skala performansi, dan satu angka IQ-deviasi
untuk keseluruhan skala.
2.
Tes Inventori
a. Rorschach
Dalam
tes ini, klien diperlihatkan sepuluh kartu dengan bentuk ambigu hasil dari
cipratan tinta yang hampir simetris. 5 kartu berwarna hitam, putih dan abu-abu
yang berbayang, sedangkan 5 kartu lainnya memiliki warna. Tes ini mengevaluasi
emosi-emosi yang dialami klien dalam hidupnya, tingkat intelektual dan membantu
menjelaskan komponen-komponen kepribadian seseorang.
Dasar
Pemikiran Tes Rorschach:
·
Asumsi, ada hubungan
antara persepsi dengan kepribadian.
·
Bercak tinta, ambigous dan
unstructure, yaitu persepsi personal, spontan dan tidak dipelajari.
·
Tujuan utama, mendeskripsikan
kepribadian seseorang secara keseluruhan (Gestalt).
b.
Hematic Apperception Test (TAT)
TAT didasarkan
pada teori kebutuhan Murray yang melihat bahwa perilaku manusia didorong oleh
motivasi internal dan eksternal, sedangkan lingkungan dipandang sebagai press
(tekanan) yang mempengaruhi dorongan tersebut. Keduanya akan membentuk suatu
interaksi antara kebutuhan dan lingkungan yang disebut sebagai tema. Kesatuan
tema merupakan kesatuan interaksi itu yang terbentuk sejak jaman kanak-kanak
tanpa disadari, dan ini merupakan kunci dari suatu perilaku unik (khas)
seseorang.
Dikenal
sebagai teknik interpretasi gambar karena menggunakan rangkaian standar
provokatif berupa gambar yang ambigu dan klien yang harus menceritakan sebuah
cerita dari gambar yang tertera. Tugas klien adalah menceritakan apa yang
sedang terjadi saat ini, sebelumnya (situasi apa yang menimbulkan peristiwa
saat ini), bagaimana pikiran dan perasaan tokoh-tokoh yang ada dalam cerita,
dan bagaimana akhir dari cerita yang dibuat klien.
Metode
dengan menggunakan kartu bergambar seukuran 4 X 6 inchi. Diberikan masing –
masing, pria dan wanita, 5 jenis kartu yang berbeda dan 1 kartu kosong.
Manfaat
TAT: TAT berguna dalam mempelajari secara keseluruhan kepribadian
seseorang, sehingga dapat menginterpretasi tingkah laku abnormal, penyakit
psikosomatis, neurose. Manfaat khusus TAT, Sebagai pendahuluan interview
therapi dan merupakan langkah pertama dalam psikoanalisa.
Tes
Kelompok
Dilakukan
pada banyak orang sekaligus pada satu waktu atau waktu yang sama, fokusnya
lebih sempit, yaitu untuk memprediksi kinerja akademik atau profesi, skor tes sangat
tergantung pada kemampuan membaca testee, validitasnya lebih tinggi, lebih
sering digunakan untuk proses screening (pendidikan atau pekerjaan).
Jenis-jenis
tes yang termsuk dalam tes kelompok:
1. Tes Inteligensi
a.
Intelligenz Struktur Test (IST)
Tes
ini terdiri dari bagian-bagian yang saling berhubungan secara struktur, dimana
dari struktur tersebut menggambarkan pola kerja tertentu. Tes ini cocok untuk
digunakan dalam memahami diri dan pengembangan pribadi, merencanakan pendidikan
dan karir serta membantu dalam pengambilan keputusan hidup seseorang.
Terdiri
dari 9 subtes yang keseluruhannya berjumlah 176 item. Masing-masing subtes
memiliki batas waktu yang berbeda-beda dan diadministrasikan dengan menggunakan
manual (Polhaupessy, dalam Diktat Kuliah IST UNPAD, 2009).
Setelah
didapatkan Standardized Score, maka tahap interpretasi dapat dilakukan.
Kesembilan subtes saling berkaitan, sehingga harus dilakukan semuanya dan
interpretasinya harus dilakukan secara keseluruhan (Amthauer dalam Diktat
Kuliah IST UNPAD, 2009).
b.
Culture Fair Intellegence Test (CFIT)
Tes
yang dikembangkan oleh R.B. Cattel pada tahun 1920, pernah melakukan beberapa
kali revisi untuk meningkatkan validitas. Pada tahun 1949, skala yang digunakan
tes ini mengalami perubahan. Sejak itu skala tes yang ada dipakai hingga
sekarang.
CFIT
mengukur inteligensi individu dalam suatu cara yang direncanakan untuk mengurangi
pengaruh kecakapan verbal, iklim kebudayaan dan tingkat pendidikan (Cattell
dalam Kumara, 1989). Alasannya yaitu perbedaan kebudayaan dapat mempengaruhi
performance test (hasil), sehingga dikembangkan tes yang adil budaya (culture
fair) antara lain CFIT.
c.
Multidimensional Aptitude Battery II (MAB-II)
MAB
dirancang setara WAIS-R dan untuk menghasilkan skor-skor IQ dengan sifat-sifat
psikometrik yang sama dengan yang terdapat pada WAIS-R. Untuk
peserta tes usia 16-74 tahun. MAB-II menghasilkan 10 skor subtes, serta IQ
verbal, kinerja, dan skala penuh.
d.
Tes Kemampuan Kognitif (CogAT – Cognitive Abilitiy Test)
CogAT
merupakan salah satu tes kombinasi terbaik berbasis sekolah yang digunakan saat
ini (Lohman & Hagen, 2001). Sembilan
subtes CogAT mencakup Tes Kombinasi Verbal, Tes Kombinasi Kuantitatif, dan Tes
Kombinasi Nonverbal.
e.
Matriks Progresif Raven (RPM)
Merupakan
tes nonverbal penalaran induktif yang di dasarkan pada stimuli ber-gambar. RPM
bermanfaat sebagai pengujian tambahan untuk orang-orang yang memiliki kelemahan
pendengaran, bahasa, dan fisik.
2. Tes Inventory
a. The Personality Preference Inventory (PAPI)
Tes
PAPI Kostik di buat oleh Guru Besar Psikologi Industri asal Massachusetts,
Amerika, Dr. Max Martin Kostick, pada awal tahun 1960. PAPI Kostick mengukur
dinamika kepribadian (psychodynamics) dengan memperhatikan keterkaitan dunia
sekitarnya(environment) termasuk perilaku dan nilai perusahaan(values) yang
diterapkan dalam suatu perusahaan atau situasi kerja dalam bentuk motif (need)
dan standar gaya perilaku menurut persepsi kandidat (role) yang terekam saat
psikotest. Secara singkat, PAPI Kostick
merupakan laporan inventori kepribadian (self report inventory), terdiri atas
90 pasangan pernyataan pendek berhubungan dalam situasi kerja, yang menyangkut
20 aspek keribadian yang dikelompokkan dalam 7 bidang: kepemimpinan
(leadership), arah kerja (work direction), aktivitas kerja (activity), relasi
social (social nature), gaya bekerja (work style), sifat temperamen
(temperament), dan posisi atasan-bawahan (followership).
b. Dominant, Influencing, Streadiness
Conscientiousness (DISC)
Sebuah
alat untuk memahami tipe-tipe perilaku dan gaya kepribadian, pertama kali
dikembangkan oleh William Moulton Marston. Dalam penerapannya di dunia bisnis
dan usaha, alat ini telah membuka wawasan dan pemikiran, baik secara
profesional maupun secara personal.
Seperti
umumnya alat-alat tes sejenis (termasuk IQ tes), DISC pertama kali digunakan
untuk kepentingan militer dan secara luas digunakan sebagai bagian dalam proses
penerimaan tentara AS pada tahun-tahun menjelang Perang Dunia II. Setelah
keandalannya terbukti, kemudian DISC secara bertahap dipakai untuk kepentingan
rekrutmen yang lebih umum.
Sistem
DISC
DISC
personality system merupakan bahasa universal mengenai perilaku. Penelitian
mengelompokkan karakteristik perilaku dalam empat bagian utama yang disebut
sebagai gaya kepribadian. Orang dengan gaya yang serupa cenderung menampilkan
ciri perilaku yang mirip. Setiap individu memiliki keempat gaya ini, akan
tetapi bervariasi menurut intensitasnya. DISC merupakan akronim 4 tipe
kepribadian yang berarti Dominant (D), Influencing (I), Steadiness (S), Conscientiousness
(C).
c. EPPS
Tes
EPPS (Edward Personality Preference Schedule) merupakan tes kepribadian yang
mengukur tingkat kepribadian seseorang. Tes ini dikembangkan menurut teori
kepribadian H. A Murray, yang mencakup 15 kebutuhan yang harus dimiliki manusia.
EPPS
umumnya dikategorikan sebagai power tes yaitu tes yang tidak dibatasi waktu
dalam pengerjaannya. Jadi, penekanannya pada penyelesaian tugas bukan waktunya.
Dalam mengerjakan tes EPPS semua item harus dijawab, apabila ada satu item saja
yang terlewatkan maka interpretasi secara akurat tidak dapat dilakukan.
Tes
EPPS dapat diberikan secara individual maupun klasikal. Latar belakang awalnya
adalah untuk konseling dan orientasinya adalah untuk orang-orang yang normal
(Karmiyati & Suryaningrum, 2005).
Tes EPPS
bertujuan untuk mengungkap 15 need yang ada pada diri seseorang. Bentuk tes
EPPS berupa pasangan-pasangan pernyataan berjumlah 225 pasang.
Tugas
subyek adalah memilih satu pernyataan dari pasangan-pasangan pernyataan yang
disajikan yang cocok atau sesuai dengan dirinya. Dari 225 pasang pernyataan ada
15 pasang yang sama. Tujuannya adalah untuk mengetahui kesungguhan atau
konsistensi subyek dalam mengerjakan tes. Apabila konsisten dapat dikatakan
bahwa subyek bersungguh-sungguh dalam mengerjakan tes dan menjadi valid untuk
diskor. Standar konsistensi pengerjaan EPPS adalah 14, namun di Indonesia
konsistensi 9 sudah dapat dikatakan valid untuk diskor (Karmiyati &
Suryaningrum, 2005).
B. Penerapan Computer Adaptive Testing (CAT) dalam Pengadministrasian
Tes
Perkembangan teknologi komputer berdampak pada
semakin berkembangnya metode pengadministrasian tes. Jika dulu tes hanya
disajikan dengan paper and pencil, sekarang penggunaan komputer untuk
melakukan tes sudah umum dilakukan. Hal ini tentu saja lebih menghemat sumber
daya kertas dan juga waktu skoring. Selama ini kita mungkin familiar dengan
istilah Computer Based Test (CBT) atau tes berbasis komputer.
Secara umum, CBT merupakan versi komputerisasi dari tes dengan metode paper
and pencil, jadi hanya memindahkan media yang sebelumnya mengerjakan di
lembar jawaban ke komputer. Pengadministrasian dan skoring dilakukan
dengan komputer, baik secara online maupun secara offline, sehingga dapat lebih
cepat dan dapat langsung dilihat hasilnya. Karena dilakukan dengan komputer,
soal yang disajikan atau distraktornya pun bisa diacak sesuai dengan keinginan
penyedia tes. Namun, penyajian tes dan skoring masih sama seperti model paper
and pencil test.
Model lain
pengadministrasian tes yang memanfaatkan teknologi komputer adalah Computer
Adaptive Testing (CAT). CAT merupakan prosedur pengadministrasian tes
dengan komputer yang adaptif karena butir soal yang disajikan dapat
menyesuaikan dengan tujuan pengetesan dan abilitas subjek. Penggunaan CAT
memungkinkan pembuat tes untuk membuat tes yang lebih efisien dalam mengukur
kemampuan subjek dari berbagai tingkat kemampuan. Tes yang menggunakan media
CAT terdiri dari butir soal yang dipilih secara acak oleh komputer dari bank
soal berdasarkan dari tingkat kesulitannya. Butir-butir soal yang dipilih
sesuai estimasi terhadap tingkat kemampuan subjek.
Bank soal yang
dipakai dalam CAT telah teruji dan terkalibrasi dengan optimal untuk populasi
tertentu sehingga kesalahan standar pengukuran (SEM) panjang tes mengalami
penurunan tanpa mengurangi presisi dan kehandalan (Gershon, 2005).
Pelaksanaan tes antara satu subjek dengan
subjek lainnya berbeda-beda karena tes baru akan berhenti jika telah diperoleh
keseimbangan antara abilitas subjek dengan tingkat kesulitan butir, hingga
diperoleh suatu presisi. Setiap soal memiliki tingkat kesulitan yang berbeda,
selain itu setiap subjek juga memiliki tingkat abilitas yang berbeda-beda.
Dengan menggunakan teknik analisis tertentu,
tingkat kemampuan subjek dan tingkat kesulitan butir dapat berada pada kontinum
atau metrik yang sama. Oleh karena itu, sebuah butir soal dapat dikatakan tidak
sesuai dengan tingkat kemampuan subjek jika tingkat kesulitan butir lebih
tinggi atau lebih rendah dibanding dengan kemampuan subjek. Jika seorang subjek
berhasil mengerjakan satu butir soal maka dia akan disajikan butir soal yang
memiliki tingkat kesulitan lebih tinggi. Namun jika subjek salah dalam menjawab
soal pertama maka pada soal kedua subjek akan diberikan soal yang memiliki
tingkat kesulitan lebih rendah. Proses ini akan berlangsung terus-menerus
hingga tingkat kesulitan butir soal yang diberikan sesuai dengan tingkat
kemampuan subjek. Tes akan berhenti ketika akurasi estimasi terhadap kemampuan
subjek cukup tinggi.
Teori psikometri yang digunakan dalam prosedur
CAT ini adalah analisis butir dengan menggunakan Model Rasch atau Teori
Respons Butir (IRT). Model Rasch/IRT juga dapat digunakan untuk
mengevaluasi seberapa jauh butir memberikan informasi mengenai abilitas
seseorang. Butir yang sesuai dengan kemampuan subjek akan memberikan informasi
yang optimal dibanding dengan butir yang tidak tepat dengan abilitas yang
diukur. Berkaitan dengan hal ini Rasch/IRT salah satu statistik yang dipakai
untuk menjelaskan besarnya informasi yang didapatkan dari pemberian soal adalah
indeks informasi butir. Karena harga indeks ini berlaku berbeda antara satu
level abilitas dengan level abilitas lainnya, maka seringkali indeks ini
diwujudkan dalam bentuk fungsi yang dinamakan dengan fungsi informasi butir (item
informatif function/IIF). Jika indeks ini dikaitkan dengan properti pada
level tes, maka dinamakan dengan fungsi informasi tes (Test informatif
function/TIF). Dua properti statistik inilah yang dipakai untuk perakitan
butir (test assembly) yang sangat berguna dalam pengadministrasian CAT.
Menurut Bjorner dik. (2007) IRT
memberikan beberapa keuntungan antara lain:
- Relevansi dan presisi tes dapat
dioptimalkan untuk beban responden diberikan.
- Presisi tes dapat disesuaikan dengan
kebutuhan yang spesifik. Jika seorang pengguna tes tidak memerlukan
presisi tinggi, pengetesan tes dapat dihentikan lebih awal untuk
mengurangi beban responden. Namun jika diharapkan tes akan memberikan
presisi yang tinggi, maka perlu diberikan butir tambahan untuk pengukuran
lebih lanjut.
- Skor yang dihasilkan dari butir soal
tertentu ditempatkan pada metrik yang sama dengan butir soal lain yang
mengukur atribut yang sama dan tingkat abilitas yang sama terlepas dari
bank soal mana yang digunakan.
- Bank soal dapat dikembangkan secara bertahap
dengan pengawasan dan evaluasi kualitas butir yang berkelanjutan.
- Proses subjek dalam menjawab dapat
dipantau secara langsung (real time) untuk memastikan tingginya
kualitas penilaian. Selain itu pola-pola jawaban yang tidak konsisten
tetap dieksplorasi untuk mendeteksi adanya kemungkinan soal yang bocor
atau subjek yang menyontek.
Salah satu poin penting dalam pengembangan CAT
adalah adanya bank soal yang memadahi. Istilah bank soal secara umum
digunakan untuk menunjukkan koleksi butir dalam jumlah yang sangat besar. Butir
yang bisa disimpan dalam bank soal dapat diambil oleh berbagai aspek, misalnya
jenis mata pelajaran, tujuan pengukuran jenis instruksional, sifat pengukuran.
Properti psikometris yang disertakan dalam bank soal dapat berupa tingkat kesulitan
atau daya diskriminasi butir. Pengembangan bank soal juga harus memudahkan
program komputer untuk mengakses dan memberikan butir kepada subjek tes. Agar
program komputer dapat mengakses dan memilih butir dengan baik, pengembang tes
harus (a) menyediakan bank soal yang mampu menjangkau semua tingkat abilitas
subjek di dalam populasi, (b) memiliki cadangan butir soal alternatif untuk
setiap tingkatan abilitas yang diukur. Teori analisis tes modern, misalnya
Rasch/IRT merupakan komponen yang penting dalam pemilihan butir soal untuk
mengonstruksi bank soal.
C. Kumpulan Tes Multilevel
Tujuan. Berbeda dari skala individu utama dan tes tes adaptif
terkomputerisasi, tes-tes dalam kelompok tradisional menyajikan butir-butir
soal yang sama kepada peserta tes, lepas dari jawaban mereka masing-masing.
Karena alasan ini, tes kelompok apa saja harus meliputi tentang kesulitan yang
relatif terbatas, cocok untuk usia, atau tingkatan kemampuan tertentu karena
memang dirancang untuk itu. Setiap individu hanya diuji pada level yang cocok
dengannya, namun level lain dapat digunakan untuk menguji kembali orang yang
sama dalam beberapa tahun kemudian, atau untuk membuat evaluasi comparative
dari kelompok usia berbeda. Kecocokan antara kesulitan soal dan kemampuan
peserta tes yang disajikan oleh kumpulan tes multilevel adalah hampir yang
terbaik. Kecocokan lebih didasari pada pengetahuan sebelumnya tentang peserta
tes, seperti usia atau tingkat sekolah mereka, dan bukan hanya pada jawaban tes
mereka. Kebanyakan kumpulan tes menghasilkan skor standar total, yang
berhubungan dengan "IQ" tradisional dalam tes-tes individu. Berbagai
kumpulan tes menyediakan beberapa jenis norma, termasuk persentil, stanine,
atau ekuivalen-ekuivalen tingkatan,juga skor-skor standar. Nama atau istilah
dari kumpulan tes. Istilah-istilah seperti "intelegensi", "kemampuan
umum", "kemampuan mental", "kemampuan akademik",
"kemampuan bersekolah", digunakan untuk menetapkan secara hakiki
Jenis tes yang sama. Kumpulan tes multilevel menganggapnya sebagai bagian dari
keterampilan intelektual utama yang dianggap sebagai prasyarat untuk memasuki
dunia sekolah. Fungsi utamanya adalah menilai kesiapan individu untuk belajar
di sekolah pada setiap tahap dalam proses pendidikan.
Kumpulan Tes yang Representatif. Kumpulan-kumpulan tes ini dipilih berdasarkan resensi dari revisi
terakhir mereka, dan ukuran serta kerepresentatifan sampel bagu mereka. Masih
ada sifat lain yang bernilai dari kumpulan tes ini, yaitu masing-masing
dibukukan secara bersamaan dengan 1 atau 2 kumpulan tes multilevel dari tes-tes
prestasi pendidikan atau tingkatan yang sama. Dengan menjalankan kedua
instrumen pada sampel-sampel baku yang sama, tentu saja mungkin untuk
menetapkan hubungan antara kedua perangkat skor. Akibatnya, 2 instrumen dapat
digunakan secara patungan untuk menjelaskan perkembangan pendidikan siswa dan
kondisi yang mempengaruhinya. Baik kendala maupun validitas kumpulan-kumpulan
tas ini diselidiki secara ekstensif oleh prosedur prosedur yang tepat.
Penyelidikan tentang keandalan yang dilakukan oleh Kuber-Richard dari baik skor
total maupun skor-skor pada 2 atau 3 kumpulan tes isi "content" yang
terpisah, semua dihitung dalam level tahapan tunggal, kebanyakan pada level
0,90-an. Korelasi rtas memang tinggi, menunjukkan stabilitas yang memuaskan.
Korelasi dengan tingkatan sekolah dan dengan tes tes prestasi menunjukkan
validitas prediktif yang baik. Interkorelasi antar skor-skor bagian, juga
analisis faktorial, menyingkapkan 1 faktor umum yang luas melalui masing-masing
kumpulan tes total.
Isi
tes yang umum pada level uang berbeda, usia paling
muda yang dianggap sudah layak untuk menggunakan tes kelomok adalah level taman
kanak-kanak, dan kelas satu. Pada usia prasekolah, pengetesan secara individu
untuk membuat dan mengelola rapor, demikian pula penyelenggaraan tes dengan
soal soal tipe : oral dan kinerja sesuai untuk anak-anak seusia itu. Namun,
pada usia 5-6 tahun, telah imungkinkan untuk menyelenggarakan tes tercetak pada
kelompok-kelompok kecil dengan jumlah anak 10 atau 15 orang. Dalam pengetesan
tersebut, penguji masih harus memberikan perhatian individu yang besar terhadap
anak-anak untuk memastikan bahwa mereka masih mengikuti instruksi tes, dan
halaman-halaman lembar tes dibalik secara tepat, dan mengawasi rincian-rincian
procedural lainnya. Dengan satu atau dua asisten penguji, bisa dilakukan tes
atas kelompok yang lebih besar kalau memang perlu.
|
Kumpulan Tes |
Rentang Tingkatan |
Jumlah Level |
Dinormakan bersama
dengan |
|
Otis-Lennon School Test (OLSAT, 7th
ed.) |
K-12 |
7 |
Standford
Achievement Test (9th ed.) |
|
Cognitif Ability Test (CogAT, Form 5) |
K-13 |
2 8 |
lowa
Test Basic of Skills (Kelas TK-9) Test
of Achievement and Proficiency (Kelas 9-12) Lowa
Test of Educational Development (Kelas 9-12) |
|
Test of Cognitive Skills (2nd
ed, TCS/2) |
2-12 |
6 |
California
Achievement Test (5th ed.) Omprehensive Test of Basic Skills (4th
ed.) |
Tes-tes
kelompok untuk level pertama umumnya meliputi taman kanak-kanak dan kelas satu
atau dua sekolah dasar. Dalam tes-tes tersebut, masing-masing anak diberikan
satu brosur dimana tercetak
gambar-gambar dan diagram yang menetapkan butir-butir soal tes. Semua instruksi
diberikan secara lisan dan biasanya disertai dengan demonstrasi.
Latihan-latihan praktiser sering meliputi, misalnya anak-anak harus mencoba sau
atau dua butir sampel dan penguji atau pengawas memeriksa jawaban-jawaban untuk
memastikan bawhwa instruksi-instruksi dipahami secara tepat. Anak-anak menandai
jawaban-jawaban mereka pada brosur tes dengan krayon atau pensil yang
lembut. Kebanyakan tes hanya menuntut
penandaan gambar yang tepat dari satu perangkat. Beberapa tes menuntut
koordinasi motor (gerakan) yang sederhana, seperti dalam menggambar garis-garis
yang menghubungkan dua titik. Jelas, tes-tes untuk level pertama tidak menuntut
peserta tes untuk menulis atau membaca.
Tes-tes
untuk level sekolah dasar, dari kelas tiga atau empat ke atas, mempunyai banyak
hal yang sama, baik dalam isi (content)
maupun dalam rancangan umum. Karena pada level-level ini sudah dipersayaratkan
melek huruf secara fungsional, tes-tes tersebut biasanya bermuatan verbal.
Kebanyakan juga mencakup masalah aritmatik atau tes-tes numerik lainnya. Selain
itu, beberapa kumpulan tes memberkan tes nonbaca yang dirancang untuk menilai
kemampuan penalaran abstrak yang sama dalam diri anak-anak dengan latar
belakang Bahasa asing, anak-anak yang tidak mampu membaca, atau yang mengalami
hambatan pendidikan lainnya.
Level
lebih tinggi dari kumpulan tes multilevel, cocok untuk pelajar sekolah
menengah, pada dasarnya tidak berbeda dari yang dirancang untuk tingkat-tingkat
sekolah dasar kecuali dalam hal derajat kesulitan. Level-level ini juga cocok
untuk mengetes kelompok-kelompok dewasa umum yang belum terseleksi untuk
berbagai tujuan. Isi dari tes-tes pada level ini dapat diilustrasikan oleh
butir-butir soal level paling tinggi dari
Tes Keterampilan Kognitif (Test of
Cognitif Skils : TCS/2).
·
Urutan
(Sekuen)—memahami dan mengaplikasikan aturan atau prinsip dalam sebuah pola
atau urutan bentuk, huruf, atau nomor.
·
Analogi—mengidentifikasikan
hubungan dalam satu pasangan gambar dan melengkapi pasangan kedua yang
menununjukan hubungan yang sama; meliputi gambar pemandangan, orang, binatang,
objek, atau symbol grafik.
·
Penalaran
Verbal— dites dengan keanekaragaman jenis soal, mencakup identifikasi atau
unsur-unsur pokok dari objek atau konsep, mengklarifikasi objek menurut
atribut-atribut umum, menyimpulkan hubungan antara perangkat kata, atau
menggambarkan konklusi logis dari bagian-bagian atau alinea yang singkat.
·
Memori
(ingatan) — definisi-definisi dari seperangkat kata-kata artifisak (suku kata
tanpa arti) disajikan untuk dipelajari dan ingatan mereka dites sesudah
kira-kira 25 menit; tes-tes lain tetap diadakan selama 25 menit itu.
Ada
juga satu tes praktis yang harus diselenggarakan satu atau dua hari sebelum
sesi pengetesan aktual. Dalam kumpulan tes ini jenis soal yang sama dari tes
urutan (sekuensi), analogy dan penalaran verbal digunakan dari kelas 4 sampai
kelas 12.; dan butir-butir soal sampel yang sama tercakup pada semua level ini.
Dua level yang lebih diatas, berhubungan dengan kelas-kelas sekolah menengah,
diedakan berdasarkan tingkat kesulitan butir-butir soal mereka yang secara
empiris ditetapkan lebih tinggi.
Pengenalan atas Multibakat. Ada suatu kecenderungan besar untuk menjembatani kesenjangan awal
antara pengetesan secara keseluruhan, kemampuan umum dan pengukuran terhadap
bakat-bakat terpisah yang relatif independen. Dalam kasus sekarang,
kumpulan-kumpulan tes multi level pertama dirancang sebagai sebuah versi kelompok
dari tes-tes intelegensi individu. Walaupun kumpulan-kumpulan tes itu biasanya
memiliki tujuan yang ditetapkan secara lebih sempit, yakni untuk menilai bakat
bersekolah, atau kesiapan untuk level pendidikan berikutnya. Perlahan-lahan,
menjadi jelas bahwa skor tunggal keseluruhan dapat dilampirkan pada skor-skor
yang agak lebih sempit dengan lebih menguntungkan. Dalam OLSAT (1996 ed.), di
tunjuk bahwa skor total sendiri terbatas pada sekelompok bakat
"pendidikan-verbal", kumpulan tes tidak ditunjukkan untuk mengukur
segmen "praktik-mekanik" dari intelegensi umum. Ada ketentuan untuk
mengidentifikasi skor-skor suplementer yang lebih sempit dalam skor-skor verbal
dan nonverbal. Pembedaan ini berfokus untuk tidak menuntut penggunaan bahasa dalam
jawaban tes. Kelompok ini mencakup komprehensi verbal, penalaran verbal,
penalaran gambar, penalaran bentuk, dan penalaran kuantitatif. Buku pegangan
(manual) mengamati bahwa sebuah perbandingan dari kinerja relatif individu
dalam kelompok ini bisa membantu untuk mengidentifikasikan kekuatan dan
kelemahan siswa (OLSAT, 7th ed., Preliminary Technical Manual, sedang dicetak).
Buku manual memfokuskan pada nilai dari profil grafik batangan yang meramalkan
prestasi akademik. Instruksi untuk menginterpretasi skor mengulangi rujukan
pada arti praktis dalam mempertimbangkan profil skor individu. Norma-norma yang
tersedia tidak hanya untuk skor-skor total pada kumpulan tes, melainkan juga
untuk masing-masing dari 4 subtes dan untuk sebuah total "nonverbal"
(Subtes urutan (sekuen) dan Analogi). Kumpulan tes itu sendiri dikembangkan
untuk menilai tiga ciri kognitif yang luas yang sudah diidentifikasi melalui
riset analitik faktor, yakni, Penalaran Verbal, Penalaran Nonverbal, dan
Memori.
D. Mengukur Multibakat
Differential Aptitude Test (DAT)
Seri test multiple bakat Differential Aptitude Test (DAT), yang
dalam Bahasa Indonesia dapat dipakai istilah Tes Perbedaan Bakat, merupakan
salah satu seri tes multiple bakat yang paling banyak dipakai dalam bidang
pendidikan dan kerja. DAT pertama kali terbit tahun 1947, dan telah direvisi
pada tahun 1963. Penyusun DAT adalah G. Bennett, H.G.Seashore, dan A.G.Wesman
dari USA. DAT memakai teori kelompok faktor kecerdasan model PMA atau Kemampuan
Mental (KMP) dari Thurstone. Adapun maksud dan tujuan DAT antara lain:
a. Sebagai sarana akademik untuk mendapatkan prosedur peni laian yang ilmiah, terintegrasi, dan standart bagi murid–murid.
b. Dirancang untuk bimbingan pendidikan dan vokasional (peker
jaan).
c. Dapat dipakai dalam bidang industri untuk penempatan kar yawan
dan promosi jabatan selanjutnya (perkembangan pembinaan karyawan pabrik).
d. DAT terdiri dari 8 tes, masing-masing berdiri sendiri, sehingga
dapat digunakan secara terpisah, untuk seleksi dalam bidang industri pada jenis
pekerjaan tertentu.
Kemungkinan
hanya membutuhkan beberapa tes saja dari baterai tes ini. Dalam bidang
pendidikan akan lebih baik jika semua tes digunakan secara bersamaan ke delapan
tes tersebut jika dikelompokkan maka akan terdiri dari 2 kelompok besar, yaitu:
a. Kelompok Tes Verbal, meliputi: Verbal Reasoning, Numerical
Ability, Clerical Speed Accuracy, Language Usage.
b. Kelompok Tes Non Verbal, meliputi: Abstract Reasoning,
Mechanical Reasoning, Space Relation.
Adapun
deskripsi ke-delapan sub test tersebut adalah:
a) Verbal Reasoning (VR)/Test Penalaran Verbal. Dirancang untuk
mengukur kemampuan berpikir abstrak, ge
ne ralisasi, dan konstruktif
memahami konsep verbal.
Per ben da
haraan kata yang digunakan dalam test ini meliputi perb end aharaan kata
yang biasa digunakan dalam berbagai bidang, diantaranya sejarah, geografi ,
sastra, dan sains.
Materi test ini berupa analogi sederhana, yang biasa digunakan
dalam test intelegensi umum, walaupun ana logi sederhana ini telah mendasarkan
pada asosiasi daripada ber pikir. Hasil pengukuran test VR ini diharapkan untuk
prediksi kesuk sesan dalam bidang yang me mentingkan pemahaman konsep verbal.
Contoh pertanyaan tes verbal reasoning: Pilihlah pasangan kata – kata yang
benar untuk melengkapi kalimat dibawah ini ! ..…bisa dipakai dalam resepsi,dan
pakaian seragam SD dipakai di...
a. Baju kerudung – wisata
b. Pecis dan sarung – mesjid
c. Setelan jas – sekolah
d. Kain kebaya – kondangan
e. Jas dasi – rumah.
Pilihan yang tepat adalah C.
b) Numerical Ability (NA) /
Kemampuan Aritmatik. Dirancang untuk mengukur kemampuan memahami hu bung an numerik dan memecahkan masalah
yang ber hubunga n den gan konsep numerik. Test ini lebih mengukur kemampuan
komputasi daripada penalaran numerik. Test ini sangat penting untuk prediksi
dalam bidang matematika, fi sika, kimia, teknik, dan bidang lain yang
membutuhkan kemampuan berpikir sec ara kuantitatif. Prediksi dalam bidang
pekerjaan seperti akuntansi, statistik, dan asisten laboratorium. NA bersama
dengan VR di gunakan untuk estimasi kemampuan General Learning. Contoh
pertanyaan tes numerical ability: 79 + 48
....
a. 125
b. 157
c. 126
d. 127
e. 137
Pilihan yang
tepat adalah D.
c) Abstract Reasoning (AR)
/ Penalaran Abstrak Dirancang untuk mengukur penalaran non verbal. Dalam set
iap butir test ini menuntut pemahaman logis tentang prinsip–prinsip yang
digunakan untuk mengubah diagram dan ke mam puan mem bedakan perbedaan yang
kecil pada garis, da erah, maupun bentuk. AR merupakan suplemen VR + NA, guna
estimasi intelegensi. AR digunakan untuk pred iksi dalam bidang pendidikan dan
profesi yang me nuntut pemahaman relasi antara benda atau objek. Skor AR dapat
dipakai sebagai bahan pertimbangan untuk me mahami penalaran seseorang jika
seseorang mengalami kes ukaran bahasa dan mendapatkan skor rendah pada test VR.
d) Relation (SR) /
Hubungan Spasial atau ruang. Mengukur kemampuan visualisasi terhadap konstruksi
objek tiga dimensi yang dibangun dari pola dua dimensi dan kemampuan
membayangkan berbagai cara yang dig
un akan untuk memutar ob jek tersebut sehingga mempunyai bangun an
seperti yang tampak dalam gambar. Test ini dirancang untuk memprediksi
kesuksesan dalam bidang pe rencanaan tata ruang, desainer, arsitektur, seni,
dan dek orasi.
e) Mechanical Reasoning
(MR) / Penalaran Mekanikal Test ini merupakan bentuk baru dari test bakat
Spatial Mechanical Comprehension. Setiap butir dari test ini menyajikan gambar
si tuasi mekanik disertai pertanyaan dalam kata– kata sederhana. Test ini men
gukur pemahaman prinsip– prinsip mekanik dan fi sika dalam situasi familiar.
Skor test ini akan dipengaruhi oleh pengalaman in dividu, walaupun hanya meningkatkan beberapa
point saja. Hasil ini diguna kan untuk
prediksi kesuksesan da lam belajar dan pekerja an yang menuntut pemahaman prin
sip-prinsip umum dari fi sika. Prediksi dalam pekerjaan seperti bidang mekanik,
perakitan, pertukangan kayu. Perlu diketahui testee yang mendapat skor ting gi
pada tes ini akan dengan mudah mempelajari prinsip–prinsip kerja dan reparasi
alat yang bersifat kompleks.
f) Clerical Speed Accuracy
(CSA)/Kecepatan dan Keakuratan klerikal. Tes ini dirancang untuk mengukur
kecepatan dan ketelitian resp on dalam
tugas–tugas yang membutuhkan persepsi sederh ana. Tugas testee adalah memilih
kombinasi angka atau huruf yang sama dengan kombinasi yang telah diberi garis
bawah pada buku soal, dengan cara memberi garis bawah pada kom binasi
pilihannya. Butir tes ini merupakan elemen yang sering digunakan pada berbagai
tugas admin istrasi.
Hasil tes ini unt uk prediksi kemampuan mengerjakan hal-hal penting
rutin adm inistrasi seperti mengatur
arsip. Manfaat untuk bidang pe n di
dikan dapat dika ta kan relatif kecil, tetapi skor rendah menunjukkan bahwa
testee mengalami kesulitan dalam hal ke berhasilan, ketepatan, kecepatan dalam
mengerjakan tugas.
g) Language Usage, bagian
I Perbendaharaan kata dalam tes ini
merupakan hasil seleksi dari Gate’s Spelling Differential in 3876 Words, dan
merupa kan perbendaharaan kata yang sering digunakan dalam kehidupan
sehari-hari. Skor yang rendah pada subtes ini menunjukkan kesulitan dalam
Spelling.
h) Language Usage, bagian II Test ini dirancang untuk mengukur kemampuan membeda kan tata bahasa yang baik dengan yang jelek ,memahami pemberian tan da baca yang tepat dan penggunaan kata yang tepat dalam ba hasa inggris. Kemampuan tersebut banyak digunakan dalam bidang jurnalistik, korespodensi bisnis. Perlu diketahui tes ini lebih menyerupai tes prestasi jika dibandingkan dengan tes yang lain.
Daftar Pustaka
Nur’aeni.2012.Tes Psikologi : Tes Intelegensi dan Tes Bakat. Purwokerto : UM Purwekerto Press.
https://www.semestapsikometrika.com/2017/12/penerapan-computer-adaptive-testing-cat.html?m=1
http://fadilah=psikogiagnistik-ke1.blogspot.com/2016/05/tes-kelompok-dan-individu.html?m=1
Komentar
Posting Komentar