Instrumentasi Tes: Tes-Tes Kelompok

 

A.    Tes kelompok versus tes individual

Tes Individu pada dasarnya memiliki beberapa jenis – jenis tes yang mencakup pada individual, dianatara lain tes kepribadian, tes intelegensi, tes kemampuan, dan lain-lain. Semua tes menggambarkan karakteristik seseorang dalam berbagai aspek yang diukur melalui tes yang dinginkan dari salah satu jenis tes individual (Anastasi dan Urbina, 1997).

Tes individu  disebut juga dengan tes yang diberikan perorangan yaitu tester berhadapan dengan orang yang di tes (testee). Tes Kelompok adalah tes yang digunakan terutama dalam bidang pendidikan, pegawai negeri, industri, dan dinas militer.

Tidak ada pendekatan tunggal dalam pengukuran. Perbedaan teori dapat menyebabkan pula perbedaan objek ukur dikarenakan perilaku manusia yang tidak terbatas, permasalahan pengambilan sampel perilaku, adanya unsur eror dalam pengukuran, permasalahan konsistensi dan ketepatan pengukuran, satuan dalam pengukuran, permasalahan interpretasi hasil pengukuran, hubungan dengan konstrak lain dan hasil pengukuran dikaitkan dengan fenomena lain yang dapat diamati.

 

Perbedaan antara tes individu dan kelompok diantaranya :

1.      Dalam hal bentuk maupun susunan butir soal (item).

2.      Pertanyaan-pertanyaan terbuka (open-ended) yang mengundang tanggapan bebas dapat digunakan, dan digunakan  dalam tes-tes kelompok awal,  dewasa ini tes khusus menggunakan butir soal multi pilihan.

3.      Perubahan ini dituntut demi keseragamaan dan obyektivitas skoring.

4.      Kontrol atas kesulitan soal.

5.      Pemberian skor objektif dengan menggunakan program.

 

Beberapa keuntungan dan kerugian tes Individu diantaranya:

a.       Keuntungan tes Individu

1.      Tester dapat melakukan observasi yang mendalam terhadap testee.

2.      Lebih mendalam mengetahui karakter spesifik individu.

3.      Isi atau konten pertanyaan lebih spesifik dan mendalam.

b.      Kerugian tes Individu

1.      Memerlukan waktu yang lebih banyak dibandingkan tes kelompok.

2.      Hasil tes bersifat spesifik pada individu tertentu dan tidak bisa digeneralisasikan kepada individu lain.

 

Beberapa keuntungan dan kerugian tes kelompok adalah:

a.       Keuntungan Tes Kelompok

1.      Alat ini dirancang untuk testing massal.

2.      Diselenggarakan secara simultan bagi banyak mungkin orang yang benar-benar bisa disesuaikan dengan ruang yang tersedia dan jangkauan suara mikrofon.

3.      Soal-soal yang dicetak dan jawaban-jawaban sederhana yang dapat direkam pada sebuah brosur tes atau lembaran jawaban, atau pada sebuah komputer, hubungan orang perorang antara penguji dan peserta tes bisa diabaikan.

4.      Waktu testing yang tersedia dapat digunakan lebih efektif jika setiap peserta tes berkonsentrasi kepada soal-soal yang sesuai kemampuannya.

 

b.      Kerugian Tes Kelompok

1.      Penguji memiliki peluang yang jauh lebih kecil untuk behubungan, bekerjasama, dan mempertahankan minat peserta tes.

2.      Kondisi peserta sakit, lelah, riasu, cemas yang bis mempengaruhi kinerja tes kurang didektesi dalm testing kelompok dibandingkan testing individual.

3.       Tes diselenggarakan karena keterbatasan-keterbatasan yang diberikan pada jawaban- jawaban peserta.

4.       Observasi kurang mendalam kepada setiap individu.

 

Jenis-jenis tes yang termasuk dalam tes individu:

1.            Tes Inteligensi

a.       Stanford Binet

Digunakan untuk anak-anak yang berusia 2 tahun sampai dengan orang dewasa yang berusia 85 tahun keatas. Tes-tes dalam skala ini dikelompokkan menurut berbagai level usia mulai dari Usia-II sampai dengan Usia Dewasa-Superior. Diantara Usia-II dan Usia-V, tesnya meningkat dengan interval setengah tahunan, sedangkan diantara Usia-V dan Usia-XIV, level usia mengingkat dengan interval satu tahunan. Level-level selanjutnya dimaksudkan sebagai level Dewasa-Rata-rata dan level Dewasa-Superior I, II, dan III.

Setiap level usia dalam skala ini berisi enam tes, kecuali untuk level Dewasa-Rata-rata yang berisi delapan tes. Dalam masing-masing tes untuk setiap level usia terisi soal-soal dengan taraf kesukaran yang tidak jauh berbeda. Berdasarkan perbedaan taraf kesukaran yang kecil itulah disusun urutan soal dari yang paling mudah sampai yang paling sukar.

Skala Stanford-Binet dilaksanakan secara individual dan soal-soalnya diberikan secara lisan oleh pemberi tes. Penyajian tesnya sendiri mengandung kerumitan yang spesifik bagi masing-masing individu yang dites. Tidak ada individu yang dikenai semua soal dalam tes karena setiap subjek hanya diberikan soal dalam tes yang berada dalam cakupan level usia yang sesuai dengan level intelektualnya masing-masing.

Untuk memperoleh angka IQ skor pada skala Stanford-binet diubah atau dikonversikan dengan bantuan suatu tabel konversi. IQ yang dihasilkan oleh skala ini merupakan IQ-deviasi yang mempunyai rata-rata (mean) sebesar 100 dan deviasi SD sebesar 16. Versi terbaru skala Stanford-Binet diterbitkan pada tahun 1986. Terbitan terbaru Stanford-Binet: edisi kelima (SB5) menggarisbawahi pemisahan intelegensi menjadi lima faktor dan dua bidang (verbal dan non verbal) sehingga menghasilkan 10 subtes. Kelima faktor tersebut adalah: Fluid Reasoning, Pengetahuan, Penalaran Kuantitatif (tes kuantitatif, rangkaian angka), Penalaran Visual-Spasial (melipat kertas, mengkopi), Working Memory (memori kalimat, memori sajian urutan benda).

 

b.      Skala Kaufman

Terdapat 2 jenis yaitu:

1.      Kaufman Assessment Battery for Children (K-ABC)

Tes ini diciptakan oleh Alan S. Kaufman dan Nadeen L. Kaufman dari the University of Alabama.

Skala-skala inteligensi dalam baterai (rangkaian) ini adalah Sequal Processing Scale dan Simulation Processing Scale. Sequal Processing Scale yaitu skala yang mengungkap abilitas atau kemampuan untuk memecahkan permasalahan secara bertahap dengan penekanan pada hubungan serial atau hubungan temporal diantara stimulus. Stimulus ini, baik verbal maupun visual harus ditangni secara berurutan agar tercapai performansi yang optimal. Dalam K-ABC kemampuan ini diungkap antara lain oleh subtes Word Order dimana subjek harus menunjuk pada bayangan gambar dalam urutan sama dengan urutan nama yang disebut oleh penguji.

Simulation Processing Scale yaitu skala yang bertujuan mengungkap kemampuan anak dalam memecahkan permasalahan dengan cara mengorganisasikan dan memadukan banyak stimuli sekaligus dalam waktu yang sama. Permasalahan yang diajukan sering kali bersifat analogi atau mengandung aspek spasial. Baik berwujud perseptual maupun berujud konseptual, stimulusnya menghendaki pengerahan daya sintesis simultan agar tercapai penyelesaian yang benar. Dalam K-ABC, stimulus bentuk ini mencakup tugas pengenalan bercak tinta yang disajikan separuh selesai (Gestalt Completion) dan analogi visual yang umumnya abstrak (Matrix Analogies). Baterai (rangkaian) dalam skala ini juga menyajikan kombinasi Sequantial dan Simultaneous Processing yang masing-masing disebut Mental Processing Composite Scale, Achievement Scale, dan non-Verbal Scale. Skor pada kesemua skala dalam K-ABC memiliki mean 100 dan unit SD sebesar 15 agar dapat dibandingkan langsung satu sama lain dan dengan ukuran inteligensi lain.

Tes ini dilaksanakan secara individual untuk anak-anak dan remaja untuk usia 3-18. tujuannya yaitu untuk mengurangi perbedaan skor antara anak-anak dari kelompok etnis dan budaya yang berbeda.

2.      Kaufman Brief Intelligence (K-BIT)

Tes penyaringan intelegensi umum standar yang baru-baru ini dipublikasikan dalam bentuk edisi kedua yaitu KBIT-2 yang terdiri dari

·         skala Crystallized atau verbal yang memiliki dua jenis soal (pengetahuan verbal dan teka-teki)

·         skala non verbal atau Fluid yang mencakup soal-soal matriks.

KBIT-2 dilaksanakan untuk peserta berusia 4-90 tahun dan dalam waktu kurang lebih 20 menit.

 

c.       Wechsler Adult Intellegence Scale (WAIS)

Skala Weschler pertama kali diterbitkan pada tahun 1939 dengan nama Weschler-Bellevue (W-B). Sasaran utama test ini adalah untuk menyediakan test intelegensi bagi orang dewasa. Test ini dirancang untuk anak-anak sekolah dan diadaptasikan untuk orang dewasa dengan menambahkan beberapa soal yang lebih sulit.

WAIS telah mengalami revisi, dan diberi nama Weschler Adult Scale-Revised (WAIS-R) yang mencakup jangkauan umur 16 sampai 74 tahun. Sebagaimana versi WAIS sebelumnya, WAIS-R terdiri dari skala Verbal dan skala Performansi. Kedua skala tersebtu masing-masing menghasilkan IQ-verbal dan IQ-performansi, sedangkan kombinasi keduanya menjadi dasar untuk perhitungan IQ deviasi sebagai IQ keseluruhan. Masing-masing test memiliki minimal 5 subtes dan maksimal 7 subtes. Secara lebih terperinci, isi masing-masing subtes dalam skala Verbal, yaitu subtes Informasi, berisi 29 pertanyaan mengenai pengetahuan umum yang dianggap dapat diperoleh oleh setiap orang dimana ia berada.

Soal-soal dalam setiap subtes dirancang sesuai dengan tujuan penggunaan skala ini, yaitu sebagia ukuran inteligensi orang dewasa yang dimaksudkan untuk digunakan pada subjek yang berusia antara 16 sampai dengan 64 tahun. Dalam memberikan skor untuk subtes Hitungan, Simbol Perakitan Angka, Rancangan Balok, Susunan Gambar, dan Perakitan Objek, kebenaran jawaban dan kecepatan menjawab sangat diperhitungkan. Jawaban yang benar akan tetapi diberikan setelah batas waktu yang dibolehkan tidak akan mendapat skor. Semakin cepat penyelesaian diberikan, skornya akan semakin tinggi.

d.      Wechsler Intellegence Scale for Children (WISC)

Revisi skala WISC yang dinamai WISC-R diterbitkan tahun 1974 dan dimaksudkan untuk mengukur inteligensi anak-anak usia 6 sampai dengan 16 tahun. WISC-R terdiri atas 12 subtes yang dua diantaranya digunakan hanya sebagai persediaan apabila diperlukan penggantian subtes. Keduabelas subtes tersebut dikelompokkan menjadi dua golongan, yaitu skala Verbal (verbal) yang terdiri dari information (informasi), comprehension (pemahaman), arithmetic (hitungan), similiarites (kesamaan), vocabulary (kosakata), dan digit span (rentang angka). Golongan kedua adalah skala performansi (performance) yang terdiri dari picture completion (kelengkapan gambar), picture arrangement (susunan gambar), block design (rancangan balok), object assembly (perakitan objek), coding (sandi), mazes (taman sesat).

Melalui prosedur pemberian skor yang telah ditentukan, setiap subjek akan memperoleh skor pada masing-masing subtes. Skor tersebut kemudian diterjemahkan ke dalam bentuk angka standar melalui tabel norma sehingga akhirnya diperoleh suatu angka IQ –deviasi untuk skala verbal, satu angka IQ-deviasi untuk skala verbal dan satu angka IQ-deviasi untuk skala performansi, dan satu angka IQ-deviasi untuk keseluruhan skala.

 

2.            Tes Inventori

a.       Rorschach

Dalam tes ini, klien diperlihatkan sepuluh kartu dengan bentuk ambigu hasil dari cipratan tinta yang hampir simetris. 5 kartu berwarna hitam, putih dan abu-abu yang berbayang, sedangkan 5 kartu lainnya memiliki warna. Tes ini mengevaluasi emosi-emosi yang dialami klien dalam hidupnya, tingkat intelektual dan membantu menjelaskan komponen-komponen kepribadian seseorang.

Dasar Pemikiran Tes Rorschach:

·         Asumsi, ada hubungan antara persepsi dengan kepribadian.

·         Bercak tinta, ambigous dan unstructure, yaitu persepsi personal, spontan dan tidak dipelajari.

·         Tujuan utama, mendeskripsikan kepribadian seseorang secara keseluruhan (Gestalt).

 

b.      Hematic Apperception Test (TAT)

TAT didasarkan pada teori kebutuhan Murray yang melihat bahwa perilaku manusia didorong oleh motivasi internal dan eksternal, sedangkan lingkungan dipandang sebagai press (tekanan) yang mempengaruhi dorongan tersebut. Keduanya akan membentuk suatu interaksi antara kebutuhan dan lingkungan yang disebut sebagai tema. Kesatuan tema merupakan kesatuan interaksi itu yang terbentuk sejak jaman kanak-kanak tanpa disadari, dan ini merupakan kunci dari suatu perilaku unik (khas) seseorang.

Dikenal sebagai teknik interpretasi gambar karena menggunakan rangkaian standar provokatif berupa gambar yang ambigu dan klien yang harus menceritakan sebuah cerita dari gambar yang tertera. Tugas klien adalah menceritakan apa yang sedang terjadi saat ini, sebelumnya (situasi apa yang menimbulkan peristiwa saat ini), bagaimana pikiran dan perasaan tokoh-tokoh yang ada dalam cerita, dan bagaimana akhir dari cerita yang dibuat klien.

Metode dengan menggunakan kartu bergambar seukuran 4 X 6 inchi. Diberikan masing – masing, pria dan wanita, 5 jenis kartu yang berbeda dan 1 kartu kosong.

Manfaat TAT: TAT berguna dalam mempelajari secara keseluruhan kepribadian seseorang, sehingga dapat menginterpretasi tingkah laku abnormal, penyakit psikosomatis, neurose. Manfaat khusus TAT, Sebagai pendahuluan interview therapi dan merupakan langkah pertama dalam psikoanalisa.

 

Tes Kelompok

 

Dilakukan pada banyak orang sekaligus pada satu waktu atau waktu yang sama, fokusnya lebih sempit, yaitu untuk memprediksi kinerja akademik atau profesi, skor tes sangat tergantung pada kemampuan membaca testee, validitasnya lebih tinggi, lebih sering digunakan untuk proses screening (pendidikan atau pekerjaan).

 

Jenis-jenis tes yang termsuk dalam tes kelompok:

1.      Tes Inteligensi

a.       Intelligenz Struktur Test (IST)

Tes ini terdiri dari bagian-bagian yang saling berhubungan secara struktur, dimana dari struktur tersebut menggambarkan pola kerja tertentu. Tes ini cocok untuk digunakan dalam memahami diri dan pengembangan pribadi, merencanakan pendidikan dan karir serta membantu dalam pengambilan keputusan hidup seseorang.

Terdiri dari 9 subtes yang keseluruhannya berjumlah 176 item. Masing-masing subtes memiliki batas waktu yang berbeda-beda dan diadministrasikan dengan menggunakan manual (Polhaupessy, dalam Diktat Kuliah IST UNPAD, 2009).

Setelah didapatkan Standardized Score, maka tahap interpretasi dapat dilakukan. Kesembilan subtes saling berkaitan, sehingga harus dilakukan semuanya dan interpretasinya harus dilakukan secara keseluruhan (Amthauer dalam Diktat Kuliah IST UNPAD, 2009).

b.      Culture Fair Intellegence Test (CFIT)

Tes yang dikembangkan oleh R.B. Cattel pada tahun 1920, pernah melakukan beberapa kali revisi untuk meningkatkan validitas. Pada tahun 1949, skala yang digunakan tes ini mengalami perubahan. Sejak itu skala tes yang ada dipakai hingga sekarang.

CFIT mengukur inteligensi individu dalam suatu cara yang direncanakan untuk mengurangi pengaruh kecakapan verbal, iklim kebudayaan dan tingkat pendidikan (Cattell dalam Kumara, 1989). Alasannya yaitu perbedaan kebudayaan dapat mempengaruhi performance test (hasil), sehingga dikembangkan tes yang adil budaya (culture fair) antara lain CFIT.

c.       Multidimensional Aptitude Battery II (MAB-II)

MAB dirancang setara WAIS-R dan untuk menghasilkan skor-skor IQ dengan sifat-sifat psikometrik yang sama dengan yang terdapat pada WAIS-R. Untuk peserta tes usia 16-74 tahun. MAB-II menghasilkan 10 skor subtes, serta IQ verbal, kinerja, dan skala penuh.

d.      Tes Kemampuan Kognitif (CogAT – Cognitive Abilitiy Test)

CogAT merupakan salah satu tes kombinasi terbaik berbasis sekolah yang digunakan saat ini (Lohman & Hagen, 2001). Sembilan subtes CogAT mencakup Tes Kombinasi Verbal, Tes Kombinasi Kuantitatif, dan Tes Kombinasi Nonverbal.

e.       Matriks Progresif Raven (RPM)

Merupakan tes nonverbal penalaran induktif yang di dasarkan pada stimuli ber-gambar. RPM bermanfaat sebagai pengujian tambahan untuk orang-orang yang memiliki kelemahan pendengaran, bahasa, dan fisik.

 

2.      Tes Inventory

a.       The Personality Preference Inventory (PAPI)

Tes PAPI Kostik di buat oleh Guru Besar Psikologi Industri asal Massachusetts, Amerika, Dr. Max Martin Kostick, pada awal tahun 1960. PAPI Kostick mengukur dinamika kepribadian (psychodynamics) dengan memperhatikan keterkaitan dunia sekitarnya(environment) termasuk perilaku dan nilai perusahaan(values) yang diterapkan dalam suatu perusahaan atau situasi kerja dalam bentuk motif (need) dan standar gaya perilaku menurut persepsi kandidat (role) yang terekam saat psikotest.  Secara singkat, PAPI Kostick merupakan laporan inventori kepribadian (self report inventory), terdiri atas 90 pasangan pernyataan pendek berhubungan dalam situasi kerja, yang menyangkut 20 aspek keribadian yang dikelompokkan dalam 7 bidang: kepemimpinan (leadership), arah kerja (work direction), aktivitas kerja (activity), relasi social (social nature), gaya bekerja (work style), sifat temperamen (temperament), dan posisi atasan-bawahan (followership).

b.      Dominant, Influencing, Streadiness Conscientiousness (DISC)

Sebuah alat untuk memahami tipe-tipe perilaku dan gaya kepribadian, pertama kali dikembangkan oleh William Moulton Marston. Dalam penerapannya di dunia bisnis dan usaha, alat ini telah membuka wawasan dan pemikiran, baik secara profesional maupun secara personal.

Seperti umumnya alat-alat tes sejenis (termasuk IQ tes), DISC pertama kali digunakan untuk kepentingan militer dan secara luas digunakan sebagai bagian dalam proses penerimaan tentara AS pada tahun-tahun menjelang Perang Dunia II. Setelah keandalannya terbukti, kemudian DISC secara bertahap dipakai untuk kepentingan rekrutmen yang lebih umum.

 

Sistem DISC

DISC personality system merupakan bahasa universal mengenai perilaku. Penelitian mengelompokkan karakteristik perilaku dalam empat bagian utama yang disebut sebagai gaya kepribadian. Orang dengan gaya yang serupa cenderung menampilkan ciri perilaku yang mirip. Setiap individu memiliki keempat gaya ini, akan tetapi bervariasi menurut intensitasnya. DISC merupakan akronim 4 tipe kepribadian yang berarti Dominant (D), Influencing (I), Steadiness (S), Conscientiousness (C).

c.       EPPS

Tes EPPS (Edward Personality Preference Schedule) merupakan tes kepribadian yang mengukur tingkat kepribadian seseorang. Tes ini dikembangkan menurut teori kepribadian H. A Murray, yang mencakup 15 kebutuhan yang harus dimiliki manusia.

EPPS umumnya dikategorikan sebagai power tes yaitu tes yang tidak dibatasi waktu dalam pengerjaannya. Jadi, penekanannya pada penyelesaian tugas bukan waktunya. Dalam mengerjakan tes EPPS semua item harus dijawab, apabila ada satu item saja yang terlewatkan maka interpretasi secara akurat tidak dapat dilakukan.

Tes EPPS dapat diberikan secara individual maupun klasikal. Latar belakang awalnya adalah untuk konseling dan orientasinya adalah untuk orang-orang yang normal (Karmiyati & Suryaningrum, 2005).

Tes EPPS bertujuan untuk mengungkap 15 need yang ada pada diri seseorang. Bentuk tes EPPS berupa pasangan-pasangan pernyataan berjumlah 225 pasang.

Tugas subyek adalah memilih satu pernyataan dari pasangan-pasangan pernyataan yang disajikan yang cocok atau sesuai dengan dirinya. Dari 225 pasang pernyataan ada 15 pasang yang sama. Tujuannya adalah untuk mengetahui kesungguhan atau konsistensi subyek dalam mengerjakan tes. Apabila konsisten dapat dikatakan bahwa subyek bersungguh-sungguh dalam mengerjakan tes dan menjadi valid untuk diskor. Standar konsistensi pengerjaan EPPS adalah 14, namun di Indonesia konsistensi 9 sudah dapat dikatakan valid untuk diskor (Karmiyati & Suryaningrum, 2005).

 

B.     Penerapan Computer Adaptive Testing (CAT) dalam Pengadministrasian Tes

Perkembangan teknologi komputer berdampak pada semakin berkembangnya metode pengadministrasian tes. Jika dulu tes hanya disajikan dengan paper and pencil, sekarang penggunaan komputer untuk melakukan tes sudah umum dilakukan. Hal ini tentu saja lebih menghemat sumber daya kertas dan juga waktu skoring. Selama ini kita mungkin familiar dengan istilah Computer Based Test (CBT) atau tes berbasis komputer. Secara umum, CBT merupakan versi komputerisasi dari tes dengan metode paper and pencil, jadi hanya memindahkan media yang sebelumnya mengerjakan di lembar jawaban ke komputer. Pengadministrasian dan skoring dilakukan dengan komputer, baik secara online maupun secara offline, sehingga dapat lebih cepat dan dapat langsung dilihat hasilnya. Karena dilakukan dengan komputer, soal yang disajikan atau distraktornya pun bisa diacak sesuai dengan keinginan penyedia tes. Namun, penyajian tes dan skoring masih sama seperti model paper and pencil test.

 

Model lain pengadministrasian tes yang memanfaatkan teknologi komputer adalah Computer Adaptive Testing (CAT). CAT merupakan prosedur pengadministrasian tes dengan komputer yang adaptif karena butir soal yang disajikan dapat menyesuaikan dengan tujuan pengetesan dan abilitas subjek. Penggunaan CAT memungkinkan pembuat tes untuk membuat tes yang lebih efisien dalam mengukur kemampuan subjek dari berbagai tingkat kemampuan. Tes yang menggunakan media CAT terdiri dari butir soal yang dipilih secara acak oleh komputer dari bank soal berdasarkan dari tingkat kesulitannya. Butir-butir soal yang dipilih sesuai estimasi terhadap tingkat kemampuan subjek.

Bank soal yang dipakai dalam CAT telah teruji dan terkalibrasi dengan optimal untuk populasi tertentu sehingga kesalahan standar pengukuran (SEM) panjang tes mengalami penurunan tanpa mengurangi presisi dan kehandalan (Gershon, 2005).

Pelaksanaan tes antara satu subjek dengan subjek lainnya berbeda-beda karena tes baru akan berhenti jika telah diperoleh keseimbangan antara abilitas subjek dengan tingkat kesulitan butir, hingga diperoleh suatu presisi. Setiap soal memiliki tingkat kesulitan yang berbeda, selain itu setiap subjek juga memiliki tingkat abilitas yang berbeda-beda.

Dengan menggunakan teknik analisis tertentu, tingkat kemampuan subjek dan tingkat kesulitan butir dapat berada pada kontinum atau metrik yang sama. Oleh karena itu, sebuah butir soal dapat dikatakan tidak sesuai dengan tingkat kemampuan subjek jika tingkat kesulitan butir lebih tinggi atau lebih rendah dibanding dengan kemampuan subjek. Jika seorang subjek berhasil mengerjakan satu butir soal maka dia akan disajikan butir soal yang memiliki tingkat kesulitan lebih tinggi. Namun jika subjek salah dalam menjawab soal pertama maka pada soal kedua subjek akan diberikan soal yang memiliki tingkat kesulitan lebih rendah. Proses ini akan berlangsung terus-menerus hingga tingkat kesulitan butir soal yang diberikan sesuai dengan tingkat kemampuan subjek. Tes akan berhenti ketika akurasi estimasi terhadap kemampuan subjek cukup tinggi.

Teori psikometri yang digunakan dalam prosedur CAT ini adalah analisis butir dengan menggunakan Model Rasch atau Teori Respons Butir (IRT). Model Rasch/IRT juga dapat digunakan untuk mengevaluasi seberapa jauh butir memberikan informasi mengenai abilitas seseorang. Butir yang sesuai dengan kemampuan subjek akan memberikan informasi yang optimal dibanding dengan butir yang tidak tepat dengan abilitas yang diukur. Berkaitan dengan hal ini Rasch/IRT salah satu statistik yang dipakai untuk menjelaskan besarnya informasi yang didapatkan dari pemberian soal adalah indeks informasi butir. Karena harga indeks ini berlaku berbeda antara satu level abilitas dengan level abilitas lainnya, maka seringkali indeks ini diwujudkan dalam bentuk fungsi yang dinamakan dengan fungsi informasi butir (item informatif function/IIF). Jika indeks ini dikaitkan dengan properti pada level tes, maka dinamakan dengan fungsi informasi tes (Test informatif function/TIF). Dua properti statistik inilah yang dipakai untuk perakitan butir (test assembly) yang sangat berguna dalam pengadministrasian CAT.

 

Menurut Bjorner  dik. (2007) IRT memberikan beberapa keuntungan antara lain:

  1. Relevansi dan presisi tes dapat dioptimalkan untuk beban responden diberikan.
  2. Presisi tes dapat disesuaikan dengan kebutuhan yang spesifik. Jika seorang pengguna tes tidak memerlukan presisi tinggi, pengetesan tes dapat dihentikan lebih awal untuk mengurangi beban responden. Namun jika diharapkan tes akan memberikan presisi yang tinggi, maka perlu diberikan butir tambahan untuk pengukuran lebih lanjut.
  3. Skor yang dihasilkan dari butir soal tertentu ditempatkan pada metrik yang sama dengan butir soal lain yang mengukur atribut yang sama dan tingkat abilitas yang sama terlepas dari bank soal mana yang digunakan.
  4. Bank soal dapat dikembangkan secara bertahap dengan pengawasan dan evaluasi kualitas butir yang berkelanjutan.
  5. Proses subjek dalam menjawab dapat dipantau secara langsung (real time) untuk memastikan tingginya kualitas penilaian. Selain itu pola-pola jawaban yang tidak konsisten tetap dieksplorasi untuk mendeteksi adanya kemungkinan soal yang bocor atau subjek yang menyontek.

Salah satu poin penting dalam pengembangan CAT adalah adanya bank soal yang memadahi. Istilah bank soal secara umum digunakan untuk menunjukkan koleksi butir dalam jumlah yang sangat besar. Butir yang bisa disimpan dalam bank soal dapat diambil oleh berbagai aspek, misalnya jenis mata pelajaran, tujuan pengukuran jenis instruksional, sifat pengukuran. Properti psikometris yang disertakan dalam bank soal dapat berupa tingkat kesulitan atau daya diskriminasi butir. Pengembangan bank soal juga harus memudahkan program komputer untuk mengakses dan memberikan butir kepada subjek tes. Agar program komputer dapat mengakses dan memilih butir dengan baik, pengembang tes harus (a) menyediakan bank soal yang mampu menjangkau semua tingkat abilitas subjek di dalam populasi, (b) memiliki cadangan butir soal alternatif untuk setiap tingkatan abilitas yang diukur. Teori analisis tes modern, misalnya Rasch/IRT merupakan komponen yang penting dalam pemilihan butir soal untuk mengonstruksi bank soal.

 

C.    Kumpulan Tes Multilevel

Tujuan. Berbeda dari skala individu utama dan tes tes adaptif terkomputerisasi, tes-tes dalam kelompok tradisional menyajikan butir-butir soal yang sama kepada peserta tes, lepas dari jawaban mereka masing-masing. Karena alasan ini, tes kelompok apa saja harus meliputi tentang kesulitan yang relatif terbatas, cocok untuk usia, atau tingkatan kemampuan tertentu karena memang dirancang untuk itu. Setiap individu hanya diuji pada level yang cocok dengannya, namun level lain dapat digunakan untuk menguji kembali orang yang sama dalam beberapa tahun kemudian, atau untuk membuat evaluasi comparative dari kelompok usia berbeda. Kecocokan antara kesulitan soal dan kemampuan peserta tes yang disajikan oleh kumpulan tes multilevel adalah hampir yang terbaik. Kecocokan lebih didasari pada pengetahuan sebelumnya tentang peserta tes, seperti usia atau tingkat sekolah mereka, dan bukan hanya pada jawaban tes mereka. Kebanyakan kumpulan tes menghasilkan skor standar total, yang berhubungan dengan "IQ" tradisional dalam tes-tes individu. Berbagai kumpulan tes menyediakan beberapa jenis norma, termasuk persentil, stanine, atau ekuivalen-ekuivalen tingkatan,juga skor-skor standar. Nama atau istilah dari kumpulan tes. Istilah-istilah seperti "intelegensi", "kemampuan umum", "kemampuan mental", "kemampuan akademik", "kemampuan bersekolah", digunakan untuk menetapkan secara hakiki Jenis tes yang sama. Kumpulan tes multilevel menganggapnya sebagai bagian dari keterampilan intelektual utama yang dianggap sebagai prasyarat untuk memasuki dunia sekolah. Fungsi utamanya adalah menilai kesiapan individu untuk belajar di sekolah pada setiap tahap dalam proses pendidikan.

 

Kumpulan Tes yang Representatif. Kumpulan-kumpulan tes ini dipilih berdasarkan resensi dari revisi terakhir mereka, dan ukuran serta kerepresentatifan sampel bagu mereka. Masih ada sifat lain yang bernilai dari kumpulan tes ini, yaitu masing-masing dibukukan secara bersamaan dengan 1 atau 2 kumpulan tes multilevel dari tes-tes prestasi pendidikan atau tingkatan yang sama. Dengan menjalankan kedua instrumen pada sampel-sampel baku yang sama, tentu saja mungkin untuk menetapkan hubungan antara kedua perangkat skor. Akibatnya, 2 instrumen dapat digunakan secara patungan untuk menjelaskan perkembangan pendidikan siswa dan kondisi yang mempengaruhinya. Baik kendala maupun validitas kumpulan-kumpulan tas ini diselidiki secara ekstensif oleh prosedur prosedur yang tepat. Penyelidikan tentang keandalan yang dilakukan oleh Kuber-Richard dari baik skor total maupun skor-skor pada 2 atau 3 kumpulan tes isi "content" yang terpisah, semua dihitung dalam level tahapan tunggal, kebanyakan pada level 0,90-an. Korelasi rtas memang tinggi, menunjukkan stabilitas yang memuaskan. Korelasi dengan tingkatan sekolah dan dengan tes tes prestasi menunjukkan validitas prediktif yang baik. Interkorelasi antar skor-skor bagian, juga analisis faktorial, menyingkapkan 1 faktor umum yang luas melalui masing-masing kumpulan tes total.

 

Isi tes yang umum pada level uang berbeda, usia paling muda yang dianggap sudah layak untuk menggunakan tes kelomok adalah level taman kanak-kanak, dan kelas satu. Pada usia prasekolah, pengetesan secara individu untuk membuat dan mengelola rapor, demikian pula penyelenggaraan tes dengan soal soal tipe : oral dan kinerja sesuai untuk anak-anak seusia itu. Namun, pada usia 5-6 tahun, telah imungkinkan untuk menyelenggarakan tes tercetak pada kelompok-kelompok kecil dengan jumlah anak 10 atau 15 orang. Dalam pengetesan tersebut, penguji masih harus memberikan perhatian individu yang besar terhadap anak-anak untuk memastikan bahwa mereka masih mengikuti instruksi tes, dan halaman-halaman lembar tes dibalik secara tepat, dan mengawasi rincian-rincian procedural lainnya. Dengan satu atau dua asisten penguji, bisa dilakukan tes atas kelompok yang lebih besar kalau memang perlu.

 

Kumpulan Tes

Rentang Tingkatan

Jumlah Level

Dinormakan bersama dengan

Otis-Lennon School Test (OLSAT, 7th ed.)

K-12

7

Standford Achievement Test (9th ed.)

Cognitif Ability Test (CogAT, Form 5)

K-13
3-12

2

8

lowa Test Basic of Skills (Kelas TK-9)

Test of Achievement and Proficiency (Kelas 9-12)

Lowa Test of Educational Development (Kelas 9-12)

Test of Cognitive Skills (2nd ed, TCS/2)

2-12

6

California Achievement Test (5th ed.)

Omprehensive Test of Basic Skills (4th ed.)

 

Tes-tes kelompok untuk level pertama umumnya meliputi taman kanak-kanak dan kelas satu atau dua sekolah dasar. Dalam tes-tes tersebut, masing-masing anak diberikan satu brosur dimana  tercetak gambar-gambar dan diagram yang menetapkan butir-butir soal tes. Semua instruksi diberikan secara lisan dan biasanya disertai dengan demonstrasi. Latihan-latihan praktiser sering meliputi, misalnya anak-anak harus mencoba sau atau dua butir sampel dan penguji atau pengawas memeriksa jawaban-jawaban untuk memastikan bawhwa instruksi-instruksi dipahami secara tepat. Anak-anak menandai jawaban-jawaban mereka pada brosur tes dengan krayon atau pensil yang lembut.  Kebanyakan tes hanya menuntut penandaan gambar yang tepat dari satu perangkat. Beberapa tes menuntut koordinasi motor (gerakan) yang sederhana, seperti dalam menggambar garis-garis yang menghubungkan dua titik. Jelas, tes-tes untuk level pertama tidak menuntut peserta tes untuk menulis atau membaca.

Tes-tes untuk level sekolah dasar, dari kelas tiga atau empat ke atas, mempunyai banyak hal yang sama, baik dalam isi (content) maupun dalam rancangan umum. Karena pada level-level ini sudah dipersayaratkan melek huruf secara fungsional, tes-tes tersebut biasanya bermuatan verbal. Kebanyakan juga mencakup masalah aritmatik atau tes-tes numerik lainnya. Selain itu, beberapa kumpulan tes memberkan tes nonbaca yang dirancang untuk menilai kemampuan penalaran abstrak yang sama dalam diri anak-anak dengan latar belakang Bahasa asing, anak-anak yang tidak mampu membaca, atau yang mengalami hambatan pendidikan lainnya.

Level lebih tinggi dari kumpulan tes multilevel, cocok untuk pelajar sekolah menengah, pada dasarnya tidak berbeda dari yang dirancang untuk tingkat-tingkat sekolah dasar kecuali dalam hal derajat kesulitan. Level-level ini juga cocok untuk mengetes kelompok-kelompok dewasa umum yang belum terseleksi untuk berbagai tujuan. Isi dari tes-tes pada level ini dapat diilustrasikan oleh butir-butir soal level paling tinggi dari  Tes Keterampilan Kognitif (Test of Cognitif Skils : TCS/2).

·         Urutan (Sekuen)—memahami dan mengaplikasikan aturan atau prinsip dalam sebuah pola atau urutan bentuk, huruf, atau nomor.

·         Analogi—mengidentifikasikan hubungan dalam satu pasangan gambar dan melengkapi pasangan kedua yang menununjukan hubungan yang sama; meliputi gambar pemandangan, orang, binatang, objek, atau symbol grafik.

·         Penalaran Verbal— dites dengan keanekaragaman jenis soal, mencakup identifikasi atau unsur-unsur pokok dari objek atau konsep, mengklarifikasi objek menurut atribut-atribut umum, menyimpulkan hubungan antara perangkat kata, atau menggambarkan konklusi logis dari bagian-bagian atau alinea yang singkat.

·         Memori (ingatan) — definisi-definisi dari seperangkat kata-kata artifisak (suku kata tanpa arti) disajikan untuk dipelajari dan ingatan mereka dites sesudah kira-kira 25 menit; tes-tes lain tetap diadakan selama 25 menit itu.

 

Ada juga satu tes praktis yang harus diselenggarakan satu atau dua hari sebelum sesi pengetesan aktual. Dalam kumpulan tes ini jenis soal yang sama dari tes urutan (sekuensi), analogy dan penalaran verbal digunakan dari kelas 4 sampai kelas 12.; dan butir-butir soal sampel yang sama tercakup pada semua level ini. Dua level yang lebih diatas, berhubungan dengan kelas-kelas sekolah menengah, diedakan berdasarkan tingkat kesulitan butir-butir soal mereka yang secara empiris ditetapkan lebih tinggi.

 

Pengenalan atas Multibakat. Ada suatu kecenderungan besar untuk menjembatani kesenjangan awal antara pengetesan secara keseluruhan, kemampuan umum dan pengukuran terhadap bakat-bakat terpisah yang relatif independen. Dalam kasus sekarang, kumpulan-kumpulan tes multi level pertama dirancang sebagai sebuah versi kelompok dari tes-tes intelegensi individu. Walaupun kumpulan-kumpulan tes itu biasanya memiliki tujuan yang ditetapkan secara lebih sempit, yakni untuk menilai bakat bersekolah, atau kesiapan untuk level pendidikan berikutnya. Perlahan-lahan, menjadi jelas bahwa skor tunggal keseluruhan dapat dilampirkan pada skor-skor yang agak lebih sempit dengan lebih menguntungkan. Dalam OLSAT (1996 ed.), di tunjuk bahwa skor total sendiri terbatas pada sekelompok bakat "pendidikan-verbal", kumpulan tes tidak ditunjukkan untuk mengukur segmen "praktik-mekanik" dari intelegensi umum. Ada ketentuan untuk mengidentifikasi skor-skor suplementer yang lebih sempit dalam skor-skor verbal dan nonverbal. Pembedaan ini berfokus untuk tidak menuntut penggunaan bahasa dalam jawaban tes. Kelompok ini mencakup komprehensi verbal, penalaran verbal, penalaran gambar, penalaran bentuk, dan penalaran kuantitatif. Buku pegangan (manual) mengamati bahwa sebuah perbandingan dari kinerja relatif individu dalam kelompok ini bisa membantu untuk mengidentifikasikan kekuatan dan kelemahan siswa (OLSAT, 7th ed., Preliminary Technical Manual, sedang dicetak). Buku manual memfokuskan pada nilai dari profil grafik batangan yang meramalkan prestasi akademik. Instruksi untuk menginterpretasi skor mengulangi rujukan pada arti praktis dalam mempertimbangkan profil skor individu. Norma-norma yang tersedia tidak hanya untuk skor-skor total pada kumpulan tes, melainkan juga untuk masing-masing dari 4 subtes dan untuk sebuah total "nonverbal" (Subtes urutan (sekuen) dan Analogi). Kumpulan tes itu sendiri dikembangkan untuk menilai tiga ciri kognitif yang luas yang sudah diidentifikasi melalui riset analitik faktor, yakni, Penalaran Verbal, Penalaran Nonverbal, dan Memori.

 

 

D.    Mengukur Multibakat

 

Differential Aptitude Test (DAT)

Seri test multiple bakat Differential Aptitude Test (DAT), yang dalam Bahasa Indonesia dapat dipakai istilah Tes Perbedaan Bakat, merupakan salah satu seri tes multiple bakat yang paling banyak dipakai dalam bidang pendidikan dan kerja. DAT pertama kali terbit tahun 1947, dan telah direvisi pada tahun 1963. Penyusun DAT adalah G. Bennett, H.G.Seashore, dan A.G.Wesman dari USA. DAT memakai teori kelompok faktor kecerdasan model PMA atau Kemampuan Mental (KMP) dari Thurstone. Adapun maksud dan tujuan DAT antara lain:

a. Sebagai sarana akademik untuk mendapatkan prosedur peni  laian yang ilmiah,  terintegrasi, dan standart bagi murid–murid.

b. Dirancang untuk bimbingan pendidikan dan vokasional (peker jaan).

c. Dapat dipakai dalam bidang industri untuk penempatan kar yawan dan promosi jabatan selanjutnya (perkembangan pembinaan karyawan pabrik).

d. DAT terdiri dari 8 tes, masing-masing berdiri sendiri, sehingga dapat digunakan secara terpisah, untuk seleksi dalam bidang industri pada jenis pekerjaan tertentu.

Kemungkinan hanya membutuhkan beberapa tes saja dari baterai tes ini. Dalam bidang pendidikan akan lebih baik jika semua tes digunakan secara bersamaan ke delapan tes tersebut jika dikelompokkan maka akan terdiri dari 2 kelompok besar, yaitu:

a. Kelompok Tes Verbal, meliputi: Verbal Reasoning, Numerical Ability, Clerical Speed Accuracy, Language Usage.

b. Kelompok Tes Non Verbal, meliputi: Abstract Reasoning, Mechanical Reasoning, Space Relation.

Adapun deskripsi ke-delapan sub test tersebut adalah:

a) Verbal Reasoning (VR)/Test Penalaran Verbal. Dirancang untuk mengukur kemampuan berpikir abstrak, ge   ne  ralisasi, dan konstruktif memahami konsep verbal.

 Per   ben da  haraan kata yang digunakan dalam test ini meliputi perb end aharaan kata yang biasa digunakan dalam berbagai bidang, diantaranya sejarah, geografi , sastra, dan sains.

Materi test ini berupa analogi sederhana, yang biasa digunakan dalam test intelegensi umum, walaupun ana logi sederhana ini telah mendasarkan pada asosiasi daripada ber pikir. Hasil pengukuran test VR ini diharapkan untuk prediksi kesuk sesan dalam bidang yang me mentingkan pemahaman konsep verbal. Contoh pertanyaan tes verbal reasoning: Pilihlah pasangan kata – kata yang benar untuk melengkapi kalimat dibawah ini ! ..…bisa dipakai dalam resepsi,dan pakaian seragam SD dipakai di...

a. Baju kerudung – wisata

b. Pecis dan sarung – mesjid

c. Setelan jas – sekolah

d. Kain kebaya – kondangan

e. Jas dasi – rumah.

Pilihan yang tepat adalah C.

b)   Numerical Ability (NA) / Kemampuan Aritmatik. Dirancang untuk mengukur kemampuan memahami hu      bung an numerik dan memecahkan masalah yang ber hubunga n den gan konsep numerik. Test ini lebih mengukur kemampuan komputasi daripada penalaran numerik. Test ini sangat penting untuk prediksi dalam bidang matematika, fi sika, kimia, teknik, dan bidang lain yang membutuhkan kemampuan berpikir sec ara kuantitatif. Prediksi dalam bidang pekerjaan seperti akuntansi, statistik, dan asisten laboratorium. NA bersama dengan VR di gunakan untuk estimasi kemampuan General Learning. Contoh pertanyaan tes numerical ability: 79 + 48  ....

 a. 125

b. 157

c. 126

d. 127

e. 137

Pilihan yang tepat adalah D.

c)    Abstract Reasoning (AR) / Penalaran Abstrak Dirancang untuk mengukur penalaran non verbal. Dalam set iap butir test ini menuntut pemahaman logis tentang prinsip–prinsip yang digunakan untuk mengubah diagram dan ke mam puan mem bedakan perbedaan yang kecil pada garis, da erah, maupun bentuk. AR merupakan suplemen VR + NA, guna estimasi intelegensi. AR digunakan untuk pred iksi dalam bidang pendidikan dan profesi yang me nuntut pemahaman relasi antara benda atau objek. Skor AR dapat dipakai sebagai bahan pertimbangan untuk me mahami penalaran seseorang jika seseorang mengalami kes ukaran bahasa dan mendapatkan skor rendah pada test VR.

d)     Relation (SR) / Hubungan Spasial atau ruang. Mengukur kemampuan visualisasi terhadap konstruksi objek tiga dimensi yang dibangun dari pola dua dimensi dan kemampuan membayangkan berbagai cara yang dig     un akan untuk memutar ob jek tersebut sehingga mempunyai bangun an seperti yang tampak dalam gambar. Test ini dirancang untuk memprediksi kesuksesan dalam bidang pe rencanaan tata ruang, desainer, arsitektur, seni, dan dek orasi.

e)   Mechanical Reasoning (MR) / Penalaran Mekanikal Test ini merupakan bentuk baru dari test bakat Spatial Mechanical Comprehension. Setiap butir dari test ini menyajikan gambar si tuasi mekanik disertai pertanyaan dalam kata– kata sederhana. Test ini men gukur pemahaman prinsip– prinsip mekanik dan fi sika dalam situasi familiar. Skor test ini akan dipengaruhi oleh pengalaman in  dividu, walaupun hanya meningkatkan beberapa point saja. Hasil ini diguna  kan untuk prediksi kesuksesan da lam belajar dan pekerja an yang menuntut pemahaman prin sip-prinsip umum dari fi sika. Prediksi dalam pekerjaan seperti bidang mekanik, perakitan, pertukangan kayu. Perlu diketahui testee yang mendapat skor ting gi pada tes ini akan dengan mudah mempelajari prinsip–prinsip kerja dan reparasi alat yang bersifat kompleks.

f)   Clerical Speed Accuracy (CSA)/Kecepatan dan Keakuratan klerikal. Tes ini dirancang untuk mengukur kecepatan dan ketelitian resp  on dalam tugas–tugas yang membutuhkan persepsi sederh ana. Tugas testee adalah memilih kombinasi angka atau huruf yang sama dengan kombinasi yang telah diberi garis bawah pada buku soal, dengan cara memberi garis bawah pada kom binasi pilihannya. Butir tes ini merupakan elemen yang sering digunakan pada berbagai tugas admin istrasi.

Hasil tes ini unt uk prediksi kemampuan mengerjakan hal-hal penting rutin adm  inistrasi seperti mengatur arsip. Manfaat untuk bidang pe n  di dikan dapat dika ta kan relatif kecil, tetapi skor rendah menunjukkan bahwa testee mengalami kesulitan dalam hal ke berhasilan, ketepatan, kecepatan dalam mengerjakan tugas.

g)   Language Usage, bagian I  Perbendaharaan kata dalam tes ini merupakan hasil seleksi dari Gate’s Spelling Differential in 3876 Words, dan merupa kan perbendaharaan kata yang sering digunakan dalam kehidupan sehari-hari. Skor yang rendah pada subtes ini menunjukkan kesulitan dalam Spelling.

h)    Language Usage, bagian II Test ini dirancang untuk mengukur kemampuan membeda kan tata bahasa yang baik dengan yang jelek ,memahami pemberian tan da baca yang tepat dan penggunaan kata yang tepat dalam ba hasa inggris. Kemampuan tersebut banyak digunakan dalam bidang jurnalistik, korespodensi bisnis. Perlu diketahui tes ini lebih menyerupai tes prestasi jika dibandingkan dengan tes yang lain.


Daftar Pustaka

Nur’aeni.2012.Tes Psikologi : Tes Intelegensi dan Tes Bakat. Purwokerto : UM   Purwekerto Press.

https://www.semestapsikometrika.com/2017/12/penerapan-computer-adaptive-testing-cat.html?m=1

http://fadilah=psikogiagnistik-ke1.blogspot.com/2016/05/tes-kelompok-dan-individu.html?m=1


Komentar