Reliabilitas (Statistika): Pengertian, Jenis dan Model Umum

Dipublikasikan oleh Dias Perdana Putra

18 April 2024, 12.28

Sumber: share28s.com

Reliabilitas (Statistika)

Dalam statistik dan psikologi, reliabilitas mengacu pada konsistensi pengukuran secara keseluruhan. Suatu pengukuran dikatakan reliabel jika menghasilkan hasil serupa dalam kondisi serupa."Ini adalah properti set pengujian yang mengacu pada jumlah kesalahan acak yang dapat disertakan dalam proses pengukuran. Hal ini sangat mungkin terjadi dan konsisten dari satu pengujian ke pengujian lainnya, artinya jika mengulangi proses pengujian pada beberapa server maka akan mendapatkan hasil yang sama (banyak kesalahan) hingga 1,00 (tidak ada kesalahan) dan eksponen digunakan untuk menunjukkan derajat kesalahan. "Misalnya, pengukuran tinggi dan berat badan seseorang sangatlah akurat.

Jenis

Ada beberapa jenis estimasi reliabilitas yang menggambarkan reliabilitas dan konsistensi suatu ukuran atau pengujian. Keandalan antar penilai mengacu pada tingkat kesepakatan antara dua atau lebih penilai mengenai suatu penilaian. Misalnya dalam bidang medis, jika seseorang mengeluh sakit perut dan mendapat gejala serupa dari beberapa dokter, hal ini menunjukkan keandalan penilai. Reliabilitas tes-tes ulang menilai sejauh mana skor tes tetap konsisten dari tes ke tes. Ini melibatkan pengukuran yang dilakukan oleh seorang penilai dengan menggunakan metode atau instrumen dan metode tes yang sama.

Reliabilitas antar metode adalah penilaian terhadap konsistensi nilai tes ketika metode atau instrumen yang digunakan berbeda, sehingga mengabaikan reliabilitas antar penilai. Jika gambar atau perangkatnya berbeda, konsep ini disebut paralelisme. Terakhir, reliabilitas internal menilai konsistensi hasil di seluruh item tes dan menggambarkan kualitas konsistensi pengukuran. Pemahaman yang lebih mendalam tentang jenis kebenaran ini akan membantu Anda memvalidasi hasil pengukuran dan meningkatkan kepercayaan diri Anda dalam menafsirkan data.

Perbedaan dari validitas

Kebenarannya tidak benar. Artinya, ukuran sebenarnya yang mengukur sesuatu tidak selalu mengukur apa yang hendak diukur. Misalnya, ada banyak tes yang dapat diandalkan untuk keterampilan tertentu, namun tidak semuanya valid untuk memprediksi kinerja.

Reliabilitas tidak menjamin validitas, namun membatasi validitas keseluruhan tes. Tes tersebut kurang reliabel sehingga tidak dapat dikatakan valid sepenuhnya sebagai alat untuk mengukur ciri-ciri kepribadian atau sebagai penanda berdasarkan suatu sifat tertentu. Pengujian yang dapat diandalkan dapat memberikan informasi yang berguna dan valid, namun pengujian yang tidak dapat diandalkan mungkin tidak valid.

Misalnya, satu set timbangan dapat menimbang suatu benda seberat 500 gram atau lebih. Timbangan ini sangat akurat dalam pengukuran, namun tidak valid (karena berat yang dikembalikan bukan berat sebenarnya). Agar timbangan menjadi valid, berat benda harus dikembalikan. Contoh ini menunjukkan bahwa pengukuran absolut tidaklah akurat, namun pengukuran yang valid seharusnya akurat..

Model umum

Dalam praktiknya, pengukuran tes tidak selalu sama. Teori reliabilitas tes dikembangkan untuk memperkirakan pengaruh kebisingan terhadap akurasi pengukuran. Titik awal dari hampir semua teori reliabilitas tes adalah gagasan bahwa nilai tes mencerminkan pengaruh dua faktor.Pertama, faktor yang mendukung konsistensi berkaitan dengan stabilnya karakteristik orang atau atribut yang diukur. Hal ini mencakup faktor-faktor seperti kesehatan, kelelahan, motivasi, dan stres emosional, yang memengaruhi nilai ujian.Faktor-faktor tersebut dapat menyebabkan variabilitas dalam pengukuran. terkait dengan keadaan atau keadaan individu, Mempengaruhi ujian Anda. mencetak gol tanpa masalah.

Hubungan dengan hasil yang diukur. Misalnya, kondisi pengujian dan kejadian acak dapat menimbulkan bias pada hasil pengujian meskipun orang tersebut stabil.Dalam konteks ini, desain dan implementasi pengukuran yang andal harus sama. Pemahaman mendalam tentang kelompok itu penting.

Faktor-faktor tersebut antara lain

Seseorang mungkin mengalami kondisi yang bersifat sementara namun umum, seperti kesehatan yang buruk, kelelahan, mudah tersinggung, dan stres emosional, yang dapat berdampak signifikan pada hasil tes. Kondisi jangka pendek spesifik yang berkaitan dengan penguasaan tugas tes, instruksi dan prosedur khusus dalam mengolah materi tes, dan perbedaan memori, perhatian, atau akurasi. Aspek situasi pengujian, seperti kejelasan instruksi, interaksi manusia, dan tidak adanya gangguan, berperan penting dalam mempengaruhi hasil pengukuran.

Terakhir, faktor risiko seperti keberuntungan dalam memprediksi pilihan jawaban, gangguan waktu, dan faktor lainnya dapat mempengaruhi validitas dan reliabilitas tes. Memahami kompleksitas dan keragaman faktor-faktor ini akan memberikan pemahaman yang lebih mendalam tentang bagaimana menafsirkan hasil tes dan memungkinkan evaluasi yang lebih efisien.

Tujuan estimasi reliabilitas adalah untuk menentukan seberapa besar variasi skor tes yang disebabkan oleh kesalahan pengukuran dan seberapa besar variasi yang disebabkan oleh skor sebenarnya.Skor reliabilitas merupakan karakteristik subjektif. Itu sedang diukur. Ini adalah pecahan dari penghitungan pengamatan yang diulang tanpa kesalahan dalam kondisi pengukuran berbeda.Kesalahan pengukuran adalah kesalahan acak dan sistematis. Ini mewakili perbedaan antara skor tes dan skor aktual yang sesuai.Analisis teoritis ini sering dinyatakan dalam persamaan sederhana:

Skor tes yang diamati = skor aktual + kesalahan pengukuran.

Tujuan teori reliabilitas adalah untuk menentukan kesalahan pengukuran dan menyarankan cara untuk meningkatkan eksperimen guna meminimalkan kesalahan.Asumsi utama teori reliabilitas adalah bahwa kesalahan pengukuran bersifat acak. . Ini tidak berarti bahwa kesalahan terjadi dalam proses acak.

Bagi seorang individu, kesalahan pengukuran bukanlah suatu kejadian yang terjadi secara acak. Namun, sumber kesalahan pengukuran antar individu sangat bervariasi sehingga kami menganggap kesalahan pengukuran sebagai variabel acak.Jika kesalahan tersebut mengandung karakteristik sebenarnya dari variabel acak, yang terbaik adalah: asumsikan bahwa kesalahan positif dan negatif sama, dan kesalahan tersebut tidak berhubungan dengan skor sebenarnya atau kesalahan dalam tes lainnya.

Teori tes klasik

Diasumsikan bahwa:

1. Rata-rata kesalahan pengukuran = 0

2. Skor benar dan kesalahan tidak berkorelasi

3. Kesalahan pada ukuran yang berbeda tidak berkorelasi

Teori reliabilitas menunjukkan bahwa varians skor yang diperoleh hanyalah jumlah varians dari skor sebenarnya ditambah varians dari kesalahan pengukuran.

\sigma _{X}^{2}=\sigma _{T}^{2}+\sigma _{E}^{2}

Persamaan ini menunjukkan bahwa nilai tes bervariasi sebagai akibat dari dua faktor:

1. Variabilitas dalam skor sebenarnya

2. Variabilitas karena kesalahan pengukuran.

Koefisien reliabilitas memberikan indeks pengaruh relatif dari skor benar dan skor kesalahan pada skor tes yang dicapai. Dalam bentuk umumnya, koefisien reliabilitas didefinisikan sebagai rasio varians skor benar terhadap varians total nilai tes. Atau, secara ekuivalen, satu dikurangi rasio variasi skor kesalahan dan variasi skor yang diamati:

\rho _{{xx'}}={\frac  {\sigma _{T}^{2}}{\sigma _{X}^{2}}}=1-{\frac  {\sigma _{E}^{2}}{\sigma _{X}^{2}}}

Namun, tidak ada cara untuk mengamati atau menghitung skor aktual secara langsung, sehingga berbagai metode digunakan untuk memperkirakan reliabilitas tes.Contoh metode untuk memperkirakan reliabilitas mencakup reliabilitas tes-tes ulang, reliabilitas internal, dan paralelisme. buktinya, kebenarannya. Setiap metode menghadapi tantangan untuk mengidentifikasi sumber kesalahan dalam eksperimen yang berbeda.

Teori respon barang

Para ahli teori pengujian sangat menyadari bahwa akurasi pengukuran tidak sama di semua skala pengukuran. Tes tersebut membedakan dengan lebih baik antara peserta tes dengan sifat tingkat menengah dan lebih buruk lagi antara peserta tes dengan nilai tinggi dan rendah. Teori respon item memperluas konsep reliabilitas indeks tunggal ke suatu fungsi yang disebut fungsi verbal. Fungsi pelaporan IRT adalah transformasi kesalahan standar dari skor observasi dan terikat pada skor tes.

Perkiraan

Pendugaan reliabilitas bertujuan untuk mengidentifikasi variabilitas skor tes yang disebabkan oleh kesalahan pengukuran dan variabilitas skor yang sebenarnya. Terdapat empat strategi praktis untuk memperkirakan reliabilitas tes.Pertama, metode tes-tes ulang mengevaluasi konsistensi skor tes dari satu administrasi ke administrasi berikutnya. Dengan menggunakan koefisien korelasi product-moment Pearson, hasil tes pertama dikorelasikan dengan hasil tes ulang untuk memperkirakan reliabilitas.Kedua, metode bentuk paralel melibatkan pengembangan bentuk tes alternatif setara yang dihubungkan dengan tes awal untuk memperkirakan reliabilitas.Ketiga, metode split-half membagi tes menjadi dua bagian dan menghubungkan skor setiap bagian untuk memperkirakan reliabilitas. Prediksi Spearman-Brown digunakan untuk mengestimasi reliabilitas penuh tes dari hasil reliabilitas separuh.Terakhir, konsistensi internal dievaluasi melalui alpha Cronbach, mengukur konsistensi hasil di seluruh item dalam tes.

Hal ini memberikan pandangan menyeluruh tentang reliabilitas dan dapat ditingkatkan dengan berbagai strategi, seperti peningkatan kejelasan ekspresi dan analisis item untuk mengganti item yang tidak memadai.Meskipun ukuran reliabilitas berbeda dalam sensitivitasnya terhadap kesalahan, strategi tersebut memberikan kerangka kerja yang holistik untuk mengevaluasi dan meningkatkan reliabilitas tes..

  • R(t)=1-F(t).
  • R(t)=\exp(-\lambda t). adalah tingkat kegagalan)

Disadur dari : https://en.wikipedia.org/wiki/Reliability_(statistics)