Thursday, March 02, 2006

Apakah Sample Kurang dari 30, Distribusinya Normal?

Oleh: Bagus Sartono

Kita berangkat dari yang namanya peubah acak. Jika X adalah peubah acak, maka fungsi dari X juga merupakan peubah acak. Rata-rata (x-bar) merupakan fungsi dari data X1, X2, ..., Xn yang kita asumsikan merupakan peubah acak dengan sebaran tertentu (tidak harus normal). Karenanya x-bar juga merupakan peubah acak, yang tentu saja punya sebaran (distribusi). Lalu apa distribusinya?

Jika Xi (data kita) merupakan peubah acak yang iid (independent-identical distribution) karena kita anggap data merupakan random sample yang memiliki sebaran NORMAL, maka x-bar akan memiliki sebaran NORMAL, BERAPAPUN SAMPLE SIZE-NYA. Kurang dari 30 atau lebih dari 30, kalau X (data) berasal dari sebaran NORMAL maka rataan (x-bar) juga memiliki sebaran NORMAL. Hanya berbeda parameternya. Kalau datanya menyebar normal dengan nilai harapan MU dan ragam SIGMA-KUADRAT, maka x-bar memiliki nilai harapan MU dan ragam SIGMA-KUADRAT-DIBAGI-n.

Dengan demikian, x-bar dikurangi MU dibagi akar dari SIGMA-KUADRAT-DIBAGI-n, akan memiliki sebaran NORMAL BAKU (nilai harapan 0, ragam 1). Tapi jika nilai SIGMA-KUADRAT is unknown, dan diduga dengan ragam contoh, maka sebaran x-bar dikurangi MU dibagi akar dari STDEV-CONTOH-DIBAGI-n adalah t-student berderajat bebas (n-1).

Lalu bagaimana dengan sebaran x-bar jika datanya (Xi) tidak berasal dari sebaran normal?
Jelas bahwa x-bar tidak menyebar normal. Namun central limit theorem says bahwa untuk n menuju tak hingga (infinity) x-bar dari data dengan sebaran apapun memiliki sebaran yang konvergen ke sebaran normal.Prakteknya bagaimana? Mana mungkin kita punya data yang banyaknya tak hingga. Empirical study by simulation menunjukkan bahwa ukuran 30 secara umum sudah menghasilkan kekonvergenan yang disebutkan diatas.Angka 30 tidak bisa
digunakan sebagai patokan yang tidak bisa digoyang-goyang.Angka 30 umumnya
cocok kalau sebaran X asal meskipun tidak normal tapi bentuknya simetrik
.
Kalau tidak simetrik, n yang diperlukan lebih besar agar distribusinya konvergen ke normal.

Detailnya bisa dilihat di Hogg & Craig atau Casella & Berger.

Penulis: Bagus Sartono, Alumni dan Dosen Jurusan Statistika IPB

Friday, February 17, 2006

Pengenalan Stata

Stata merupakan software statistik yang cukup lengkap terutama untuk fungsi statistik deskriptif. Selain itu Stata juga memiliki kelebihan diantaranya kemampuannya dalam mengolah data dengan variabel yang banyak maupun dengan observasi yang besar. Karena itu Stata banyak digunakan untuk pengolahan data mikro maupun data survei dengan observasi yang besar. Dalam pelatihan ini, Stata yang akan kita gunakan merupakan Stata versi 7 atau biasa disebut sebagai Intercooled Stata.

Sebelum memulai pengolahan data pada Stata, kita harus memastikan bahwa data yang akan diolah sudah dalam format Stata. Stata tidak memiliki menu data import ataupun transfer data dari format lain (misalkan SPSS) ke format Stata, karena itu kita harus mengubah format data ke format Stata. Untuk mengubah format atau mentransfer data gunakan program Stat Transfer. Dalam hal ini format data Household Survey sudah merupakan format Stata sehingga kita belum perlu untuk mentransfer data.

Artikel lengkap dan data untuk latihan bisa di download di Http://swastika.0moola.com/files/stata_yudho.zip

Penulis:
Teguh Yudho Wicaksono, Alumni Mahasiswa Ekonomi FEUI.