Thursday, 11 April 2013

KRITIK ATAS PEMAKAIAN DAN PENYAJIAN STATISTIK

Pendahuluan

Apakah yang dimaksud dengan statistik itu? Berbagai ragam jawaban atas pertanyaan ini telah didefinisikan secara berbeda-beda. Hal ini dapat dipahami karena definisi statistik terdiri dari beberapa kalimat untuk ruang lingkup statistik yang sangat luas. Setiap definisi dapat diperdebatkan karena setiap definisi mengandung keterbatasan-keterbatasan tertentu.
Statistik dapat didefinisikan sebagai ilmu matematika yang berhubungan dengan pengumpulan, pengaturan, peringkasan, penyajian, analisis, dan interpretasi data. Statistik mengandung perangkat untuk melakukan penjelasan dan prediksi atau prakiraan berdasar atas data. Statistik berlaku untuk berbagai disiplin ilmu dan berbagai ragam aplikasi.
Metode statistik dapat dipakai untuk meringkas atau mendeskripsikan data. Metode ini dinamakan statistik deskriptif. Pola dalam data dapat juga dimodelkan dengan cara yang mengandung unsur keacakan dan unsur ketidaktentuan dalam pengamatan kemudian dipakai untuk merumuskan kesimpulan tentang populasi berdasar atas sampel yang diteliti. Hal ini biasa dinamakan statistik inferensial.
Statistik inferensial biasa dikelompokkan ke dalam statistik parametrik dan statistik nonparametrik. Perbedaan antara statistik parametrik dan statistik nonparametrik mencakup perbedaan dalam jenis data, perbedaan dalam jumlah data atau kasus atau observasi, perbedaan dalam pemenuhan persyaratan normalitas distribusi data, dan perbedan dala pemenuhan persyaratan homogenitas varians.
Statistik parametrik dapat dipakai jika jenis data adalah interval atau rasio, jumlah data atau kasus atau observasi minimal adalah 30 kasus, persyaratan normalitas distribusi data terpenuhi, dan persyaratan homogenitas varians terpenuhi. Statistik nonparametrik dapat dipakai jika jenis data adalah nominal atau ordinal atau jika jenis data adalah interval atau rasio akan tetapi salah satu dari keempat persyaratan tersebut tidak terpenuhi misalkan saja jumlah kasus adalah 20 observasi, persyaratan normalitas distribusi data tidak terpenuhi, atau persyaratan homogenitas varians tidak terpenuhi.
Apakah yang dimaksud dengan variabel itu?
Variabel adalah karakteristik atau kuantitas yang meningkat atau menurun dari waktu ke waktu, atau mempunyai nilai-nilai yang berbeda dalam situasi yang berbeda. Variabel biasa dikelompokkan ke dalam variabel bebas dan variabel terikat. Variabel bebas (independen) adalah variabel yang dapat mempunyai nilai yang berbeda dan yang dapat menyebabkan perubahan yang sesuai pada variabel lain. Variabel terikat (dependen) adalah variabel yang dapat mempunyai nilai yang berbeda hanya dalam menanggapi variabel bebas.

Variabel dapat juga dikelompokkan ke dalam variabel laten dan variabel manifes. Variabel laten adalah variabel yang tidak dapat diobservasi dan tidak dapat diukur secara langsung. Variabel laten terdiri dari variabel laten eksogen dan variabel laten endogen. Pengukuran variabel laten eksogen dan variabel laten endogen dilakukan dengan cara merinci variabel tersebut ke dalam dimensi, sub-dimensi, dan indikator-indikator. Variabel manifes adalah variabel rincian dari variabel laten yang dapat diobservasi dan dapat diukur secara langsung. Variabel-variabel manifes ini sering juga dinamakan variabel-variabel indikator. Variabel-variabel indikator dikelompokkan ke dalam variabel-variabel indikator eksogen dan variabel-variabel indikator endogen.

Kritik Statistik
Buku-buku statistik dan buku-buku SPSS yang telah diterbitkan di Indonesia adalah sangat tidak lengkap dan lebih didominasi oleh statistik parametrik. Ketidaklengkapan buku-buku tersebut mengakibatkan perkuliahan statistik dan penelitian yang telah memanfaatkan statistik juga tidak lengkap.
Perkembangan teknologi komputer dan teknologi telekomunikasi telah mengungkap perkembangan yang sangat pesat dalam perangkat keras dan perangkat lunak. Salah satu perangkat lunak komputer adalah IBM SPSS Statistics Version 20.  Paket program statistik ini dapat dijalankan dengan cara point and click, dengan cara pemrograman, atau dengan cara gabungan.
Paket program ini mengandung peluang pilihan mengenai Reports, Descriptive Statistics, Tables, Compare Means, General Linear Model, Generalized Linear Models, Mixed Models, Correlate, Regression, Loglinear, Neural Networks, Classify, Dimension Reduction, Scale, Nonparametric Tests, Forecasting, Survival, Multiple Response, Missing Value Analysis, Multiple Imputation, Complex Samples, Quality Control, ROC Curve, Direct Marketing, dan sebagainya.
Buku-buku statistik dan buku-buku SPSS yang telah diterbitkan itu belum menjamah pembahasan mengenai Generalized Linear Models, Mixed Models,  Loglinear, Neural Networks,   Forecasting, Survival, Complex Samples, Quality Control, ROC Curve, dan Direct Marketing, termasuk pula peluang-peluang pilihan yang terkandung dalam tiap peluang pilihan ini.
Kelemahan lain adalah bahwa buku-buku SPSS tersebut belum membahas secara lengkap mengenai cara pemrograman. Pembahasan didominasi oleh cara point and click berdasar atas menu sedangkan cara pemrograman belum disinggung secara lengkap. Cara pemrograman SPSS dilakukan melalui sintaksis dalam SPSS. Program-program yang dihasilkan dapat disimpan dan dapat dipakai berulang-ulang sesuai dengan kebutuhan, akan tetapi cara ini juga belum terjamah. Para penerbit juga enggan menerbitkan Pemrograman Lengkap SPSS Versi 19 atau Pemrograman Lengkap IBM SPSS Statistics Versi 20 karena mereka masing asing dengan cara pemrograman tersebut. Pertimbangan para penerbit dapat dipahami karena mereka lebih didominasi oleh kemampuan penjualan buku dan bukan oleh kualitas buku. Contoh cara pemrograman SPSS versi 20 tentang jaringan saraf (neural networks) adalah sebagai berikut :

GET
  FILE='D:\BUK20\bankloan.sav'.

SET MTINDEX=9191972.
COMPUTE partition=2*rv.bernoulli(0.7)-1 .
EXECUTE.
.
*Multilayer Perceptron Network.
MLP default (MLEVEL=N) BY ed WITH age employ address income debtinc
    creddebt othdebt
  /RESCALE COVARIATE=STANDARDIZED
  /PARTITION  VARIABLE=partition
  /ARCHITECTURE   AUTOMATIC=YES (MINUNITS=1 MAXUNITS=50)
  /CRITERIA TRAINING=BATCH OPTIMIZATION=SCALEDCONJUGATE LAMBDAINITIAL=0.0000005
    SIGMAINITIAL=0.00005 INTERVALCENTER=0 INTERVALOFFSET=0.5
  /PRINT CPS NETWORKINFO SUMMARY CLASSIFICATION IMPORTANCE
  /PLOT ROC GAIN LIFT PREDICTED
  /STOPPINGRULES ERRORSTEPS= 1 (DATA=AUTO) TRAININGTIMER=ON (MAXTIME=15)
    MAXEPOCHS=AUTO ERRORCHANGE=1.0E-4 ERRORRATIO=0.0010
  /MISSING USERMISSING=EXCLUDE .

Kritik lain terarah pada buku-buku statistik. Banyak buku statistik telah memakai statistik parametrik walau jumlah data hanya 12 kasus, tanpa pengujian normalitas distribusi data, dan tanpa pengujian homogenitas varians. Pemakaian statistik parametrik untuk kasus sebanyak 12 adalah tidak tepat dan kesalahan ini juga akhirnya tercermin dalam skripsi atau tesis.
Kritik lain lagi terarah pada pemakaian variabel-variabel laten seperti variabel motivasi kerja, disisplin kerja, kinerja, kemampuan kerja, dan variabel-variabel laten lainnya. Variabel-variabel ini telah dirinci ke dalam dimensi, sub-dimensi, dan ke dalam indikator-indikator berdasar atas teori-teori bersangkutan. Indikator-indikator tersebut kemudian dipakai untuk menyusun pertanyaan atau pernyataan penelitian. Kuesioner penelitian disebar dan hasil pengisian kuesioner tersebut kemudian dikumpulkan dan ditabulasi. Pengujian reliabilitas dan validitas dilakukan. Data yang telah memenuhi pengujian reliabilitas dan validitas itu kemudian dijumlahkan sehingga tiap responden mempunyai satu nilai dari variabel laten misalkan motivasi kerja. Penjumlahan nilai dari tiap variabel menjadi nilai variabel laten merupakan kesalahan. Apakah nilai-nilai dari dimensi kebutuhan akan pencapaian dapat dijumlahkan dengan nilai-nilai untuk dimensi kebutuhan afilisasi dan kebutuhan akan kekuasaan sehingga menjadi nilai untuk motivasi?
Kesalahan melakukan penjumlahan ini akan meminbulkan kesalahan lain yaitu kesalahan dalam memilih dan memakai perangkat lunak komputer. IBM SPSS Statistics versi 20 dipakai untuk melakukan pengolahan data yang telah dirinci ke dalam variabel-variabel indikator eksogen dan variabel-variabel indikator endogen. Pemakaian SPSS ini adalah tidak tepat. Pemakaian yang tepat adalah pemakaiaan AMOS, LISREL, EQS, RAMONA, SPATH, dan sebagainya.

Rangkuman
Kritik statistik ini dilancarkan dengan maksud untuk memperbaiki kelemahan-kelemahan, kekurangan-kekurangan, dan kesalahan-kesalahan yang tercermin dalam buku-buku statistik, buku-buku SPSS, hasil-hasil penelitian, dan penerbitan-penerbitan sehingga pemakaian statistik dapat dilakukan secara tepat.
Ketepatan pemakaian statistik akan mempengaruhi kualitas perkuliahan dan kualitas penelitian di samping kualitas penerbitan.
Oleh ; Abdullah M. Jaubah

No comments:

Post a Comment