Statistik inferensial
Statistik inferensial merupakan sebuah proses yang menggunakan analisis data untuk membuat kesimpulan mengenai sifat-sifat distribusi probabilitas yang mendasarinya. Dalam analisis statistik inferensial, kesimpulan tentang sifat-sifat suatu populasi diambil, contohnya dengan melakukan uji hipotesis dan mendapatkan estimasi. Hal ini diasumsikan bahwa data yang diamati merupakan sampel yang diambil dari populasi yang lebih besar.
Perbandingan dapat dibuat antara statistik inferensial dengan statistik deskriptif. Statistik deskriptif hanya fokus pada karakteristik-karakteristik data yang diamati, tanpa asumsi bahwa data tersebut berasal dari populasi yang lebih besar. Dalam konteks pembelajaran mesin, istilah inferensi kadang-kadang digunakan sebagai pengganti dari "membuat prediksi, dengan mengevaluasi model yang sudah dilatih". Dalam hal ini, membuat kesimpulan mengenai sifat-sifat model disebut sebagai pelatihan atau pembelajaran (bukan inferensi), sementara menggunakan model untuk melakukan prediksi disebut sebagai inferensi (bukan prediksi); konsep ini juga dikenal sebagai inferensi prediktif.
Pendahuluan
Inferensi statistik membuat proposisi tentang suatu populasi, menggunakan data yang diambil dari populasi dengan beberapa bentuk pengambilan sampel. Mengingat hipotesis tentang suatu populasi, yang ingin kita tarik kesimpulannya, inferensi statistik terdiri dari (pertama) pemilihan model statistik dari proses yang menghasilkan data dan (kedua) menyimpulkan proposisi dari model tersebut.
Menurut Konishi & Kitagawa, "Mayoritas permasalahan dalam inferensi statistik dapat dianggap sebagai permasalahan yang berkaitan dengan pemodelan statistik". Sehubungan dengan itu, Sir David Cox mengatakan, "Bagaimana penerjemahan dari permasalahan pokok ke model statistik dilakukan seringkali merupakan bagian paling penting dari sebuah analisis".
Kesimpulan dari inferensi statistik adalah proposisi statistik. Beberapa bentuk proposisi statistik yang umum adalah sebagai berikut: perkiraan titik, yaitu nilai tertentu yang paling mendekati beberapa parameter yang diinginkan; perkiraan interval, misalnya interval kepercayaan (atau perkiraan set), yaitu interval yang dibangun menggunakan kumpulan data yang diambil dari suatu populasi sehingga, dengan pengambilan sampel berulang dari kumpulan data tersebut, interval tersebut akan berisi nilai parameter sebenarnya dengan probabilitas pada tingkat keyakinan yang dinyatakan tingkat; interval yang kredibel, yaitu sekumpulan nilai yang mengandung, misalnya, 95% keyakinan posterior; penolakan hipotesis; dan pengelompokan atau klasifikasi titik data ke dalam kelompok.
Model dan Asumsi
Model dan asumsi adalah elemen kunci dalam inferensi statistik. Setiap analisis statistik memerlukan beberapa asumsi, yang ditetapkan oleh model statistik. Model ini merangkum bagaimana data observasi dibuat dan serupa. Dalam konteks ini, model statistik menggarisbawahi peran jumlah populasi yang ingin ditarik kesimpulannya. Sebagai langkah awal sebelum mengambil kesimpulan yang lebih formal, statistik deskriptif biasanya digunakan.
Para ahli statistik membedakan tiga tingkat asumsi pemodelan: parametrik penuh, non-parametrik, dan semi-parametrik. Setiap tingkat memiliki ciri khasnya sendiri dalam mengasumsikan proses pembuatan data. Validitas asumsi model adalah hal yang sangat penting dalam inferensi statistik. Asumsi yang tidak valid dapat mengancam keakuratan inferensi statistik, terlepas dari kompleksitasnya. Bahkan asumsi yang tampak sederhana seperti pengambilan sampel acak 'sederhana' dapat mempengaruhi hasil inferensi secara signifikan. Oleh karena itu, penting untuk mempertimbangkan dengan hati-hati model dan asumsi yang digunakan dalam analisis statistik.
Model Berbasis Pengacakan
Model berbasis pengacakan memainkan peran penting dalam inferensi statistik. Dalam konteks rancangan pengacakan, distribusi suatu statistik dihitung dengan mengevaluasi statistik uji untuk semua skenario yang mungkin terjadi. Penggunaan pengacakan memungkinkan inferensi berdasarkan distribusi pengacakan, yang berguna terutama dalam survei dan desain eksperimen. Bahkan dalam inferensi Bayesian, pengacakan memainkan peran krusial, memastikan pertukaran sampel dengan populasi dalam survei dan menjaga sifat acak dalam eksperimen.
Pengacakan obyektif mendukung prosedur induktif yang akurat, terutama dalam analisis data yang dihasilkan oleh prosedur pengacakan yang terdefinisi dengan baik. Pentingnya pengacakan dalam analisis eksperimen acak sangat ditekankan, mengingat model pengacakan menjadi panduan dalam pemilihan model statistik yang sesuai. Kesalahan sering terjadi ketika protokol eksperimen diabaikan, mengakibatkan hasil yang menyesatkan. Oleh karena itu, penting untuk mempertimbangkan skema pengacakan dalam analisis eksperimen acak untuk mendapatkan kesimpulan yang akurat.
Selain pendekatan berbasis model, teknik bebas model juga memberikan tambahan penting dalam inferensi statistik. Pendekatan ini memungkinkan algoritma yang dinamis beradaptasi dengan proses kontekstual dan mempelajari karakteristik observasi secara intrinsik. Misalnya, regresi linier sederhana tanpa model dapat dilakukan berdasarkan rancangan acak independen dan terdistribusi identik atau desain deterministik dengan variabel respons yang sesuai dengan distribusi kondisional yang umum. Dalam kedua kasus tersebut, inferensi pengacakan bebas model memberikan perkiraan yang konsisten, dengan bergantung pada kondisi keteraturan tertentu seperti kelancaran fungsional.
Disadur dari: en.wikipedia.org