ABOUT - ALBUM - POEMS - WRITING - TESTS - JOURNAL - WEBSITE - CONTACT  
 


Psikometri
Oleh: Yamin Setiawan

Dari pertanyaan salah satu pengunjung site saya tentang validitas dan reliabilitas dari suatu alat tes, menggelitik saya untuk sedikit menulis tentang psikometri.. :) Saya mencoba untuk tidak menuliskan rumus-rumus dalam tulisan ini, takut membosankan, saya coba membicarakan secara garis besarnya aja ya.. :)

Pembuatan suatu soal atau angket harus memenuhi validitas dan reliabilitas-nya.

Suatu soal dapat dikatakan valid atau sahih jika tepat (semua butir soal mengukur sesuai dengan yang diukur) dan cermat (mampu membedakan sampai sekecil-kecilnya).

Untuk mengukur validitas dan reliabilitas dari suatu soal, maka setelah soal itu jadi maka soal tersebut harus disebarkan, semakin banyak jumlah populasi yang mengisi angket tersebut maka akan semakin baik. Setelah itu dihitung korelasi butir total dengan korelasi (rbt). Butir soal akan dianggap valid jika:

  1. Korelasi rbt bernilai positif
  2. Korelasi rbt > r tabel atau p < 0.05
  3. Ada kesepakatan bahwa butir dinggap valid jika rbt > 0.30
Yang perlu diingat bahwa nilai rbt tersebut adalah nilai per-aitem atau perbutir, jadi harus dihitung lagi rbt-nya sebanyak jumlah soal. Bila tidak valid, butir soal tersebut dibuang, tidak dipakai lagi dalam angket tersebut.

Bila angket atau soal tersebut memiliki lebih dari satu faktor, misalnya mengukur kecerdasan emosi seseorang memiliki 2 faktor, yaitu faktor interpersonal dan faktor antarpersonal maka harus dilakukan uji faktor, untuk mengetahui apakah faktor 1 dan 2 tersebut valid.

Biasanya dalam penelitian, para mahasiswa hanya melakukan uji butir dan uji faktor, padahal uji instrument (alat ukur) tidak kalah pentingnya agar bisa diketahui alat ukur yang kita buat sudah memenuhi standart nggak dibandingkan dengan alat ukur lain yang sudah baku dalam pengukuran yang diteliti. Alat ukur yang dibuat haruslah memiliki conruent validity (kevalidan yang setara) dengan alat ukur lain. Dianggap setara jika memiliki nilai rxx > 0.80. Orang biasanya mengadakan pembedaan validitas berdasar kriteria ini menjadi 2 macam:

  1. Validitas sama saat (Concurrent validity), contohnya: menggunakan skor pada tes Wechsler atau tes Stanforf-Binet sebagai kriteria adalah jenis validitas sama saat.
  2. Validitas ramalan (Predictive validity), contohnya: validitas ujian masuk perguruan tinggi yang menggunakan IPK mahasiswa sebagai kriteria.
Suatu alat ukur dikatakan reliabel jika alat ukur tersebut menunjukkan sejauh mana hasil pengukuran dengan alat tersebut dapat dipercaya. Hal ini ditunjukkan oleh taraf keajegan (konsistensi) skor yang diperoleh oleh para subjek yang diukur dengan alat yang sama, atau diukur dengan alat yang setara pada kondisi yang berbeda. Dalam artinya yang paling luas, realiabilitas alat ukur menunjuk kepada sejauh mana perbedaan-perbedaan skor perolehan itu mencerminkan perbedaan-perbedaan atribut yang sebenarnya.

Reliabilitas alat ukur yang juga menunjukkan derajat kekeliruan pengukuran tak dapat ditentukan dengan pasti, malainkan hanya dapat diestimasi. Ada tiga pendekatan dalam mengestimasi relibilitas alat ukur itu, yaitu:

  1. Pendekatan tes ulang / Test-Retest Method:
    Suatu perangkat tes diberikan kepada sekelompok subjek 2x, dengan selang waktu tertentu, misalkan 2 minggu. Reliabilitas tes dicari dengan menghitung korelasi antara skor pada testing 1 dan skor pada testing 2. Pendekatan ini secara teori baik, namun didalam praktek mengandung kelemahan, yaitu bahwa kondisi subjek pada testing 2 tidak lagi sama dengan kondisi subjek pada testing 1, karena terjadinya proses belajar, pengalaman, perubahan motivasi, dll. Oleh karena itu pendekatan ini sudah sangat jarang dipakai. Pendekatan ini sangat sesuai kalau yang dijadikan objek pengukuran adalah ketrampilan, terutama ketrampilan fisik.
  2. Pendekatan dengan tes paralel / Parallel Form Method:
    Dua perangkat tes yang paralel, misalnya perangkat A dan B diberikan kepada sekelompok subjek. Reliabilitas tes dicari dengan menghitung korelasi antara skor pada perangkat A dan skor pada perangkat B. Keterbatasan utama pendekatan ini terletak pada sulitnya menyusun 2 perangkat tes yang paralel. Pendekatan inipun sudah jarang digunakan.
  3. Pendekatan pengukuran satu kali / Single Trial Method:
    Seperangkat tes diberikan kepada sekelompok subjek satu kali, lalu dengan cara tertentu dihitung estimasi reliabilitas tes tersebut. Pendekatan pengukuran satu kali ini menghasilkan informasi mengenai keajegan (konsistensi) internal alat ukur. Pendekatan pengukuran satu kali ini dapat menghindarkan diri dari kesulitan yang timbul dari pendekatan dengan pengukuran ulang maupun pendekatan tes paralel, oleh karena itu pendekatan ini banyak digunakan. Yang menggunakan pendekatan pengukuran satu kali:
    1. Spearman-Brown: Jumlah butir dibelah menjadi 2 dan dicari nilai rxx-nya. Jumlah butir dapat dibelah kiri dan kanan, angka ganjil dan genap maupun dengan cara random / acak. Bila nilai rxx-nya > 0.8 maka dianggap reliabel.
    2. Rulon: Menghitung dengan melihat selisih belahan satu dengan belahan yang lain, bukan dilihat dari belahannya. Bila nilai rxx-nya > 0.8 maka dianggap reliabel.
    3. Alpha Cronbach: Alpha membagi jumlah butir dengan berapapun asal sama rata, tidak seperti Spearman-Brown dan Rulon yang tidak dapat membagi dua angka ganjil menjadi sama rata seperti misalnya angka 15, Alpha bisa membagi menjadi: 5, 5 dan 5. Bila nilai Alpha-nya > 0.8 maka dianggap reliabel.
    4. Anava Hoyt: Membagi jumlah butir sebesar jumlah butirnya, jadi dapat dibagi berapapun, tidak seperti Alpha yang tidak dapat membagi jumlah butir yang nilainya imajiner, misalnya 19. Tapi Alpha akhirnya mengeluarkan rumus baru yang dapat membagi jumlah butir sebesar jumlah butirnya juga. Dan Anava Hoyt dan Alpha yang paling banyak digunakan dalam perhitungan reliabilitas sampai saat ini. Bila nilai rtt-nya > 0.8 maka dianggap reliabel.
    5. KR20: Kuder Richardson mengeluarkan rumus perbaikan tetapi KR20 juga jarang dipakai karena KR20 hanya dapat digunakan pada data dikotomi (pilihan ya dan tidak / 0 dan 1) tidak seperti diatas, yang bisa menghitung data dikotomi dan kontinu. Bila nilai KR20-nya > 0.8 maka dianggap reliabel.
Tapi ada pendapat lain yang mengatakan bahwa suatu suatu alat tes bukan dilihat dari rtt-nya tapi dilihat dari seberapa besar penyimpangan dari alat ukur tersebut (Standart Error Measurement / SEM / SE). Semakin kecil nilai penyimpangannya maka alat ukur tersebut semakin baik.

Dengan adanya kemajuan teknologi dan adanya program-program komputer yang menangani tentang statistik, kita tidak perlu lagi menghitung secara manual, kita bisa menggunakan program SPSS atau menggunakan program SPS yang dibuat oleh Prof. Sutrisno Hadi dari UGM Yogyakarta. Tapi dengan mengetahui statistik dan psikometri, diharapkan kita bisa membaca serta menginterpretasikan hasil perhitungan program statistik tersebut.

16 Pebruari 2008


Reviews:
***** [Mar 23, 2011] by Eben
Sumbernya darimana ya. Aq perlu ni. Please.

***** [Nop 24, 2010] by Fitri
Jgn hanya validitas dan reabilitas, klu bisa y,, sesuatu yang berhubungan sma psikometri.

**** [Sep 15, 2009] by Wahyu Widhiarso
Bagus sekali artikel ini...

Cuma menambahkan bahwa pengujian validitas itu dilakukan dengan menggunakan kriteria eksternal instrumen, misalnya panel (content), alat ukur valid (concurent/predictive),atau teori (construct). Jadi, pengujian validitas melalui rbt internal instrumen, saya kira perlu dilengkapi dari eksternal.

***** [Peb 12, 2009] by Suyono
Semoga bermanfaat.

***** [Nov 22, 2008] by Sitierni
Mencari nilai validitas ramalan dengan rumus menurut Nana Sudjana disini saya meminta cara-cara menghitung korelasi product momentnya.

 
Copyright  2006 Yamin Setiawan