PSL-PPSUB MALANG-2012 SEKALA LIKERT DALAM ………. FOTO: smno.kampus.ub.febr2012 SKALA LIKERT Skala Likert merupakan skala psikometrik yang lazim digunakan dalam kuesioner, dan merupakan skala yang paling banyak digunakan dalam survei. Nama skala ini diambil dari nama Rensis Likert, yang mempublikasikan suatu laporan yang menjelaskan penggunaan sekala ini. Pada saat menanggapi suatu pertanyaan dalam skala Likert, responden menentukan tingkat persetujuannya terhadap pernyataan tersebut dengan jalan memilih salah satu dari pilihan yang tersedia. Biasanya ada lima pilihan skala dengan format : 1. 2. 3. 4. 5. Sangat tidak setuju Tidak setuju Netral Setuju Sangat setuju Selain pilihan dengan lima skala seperti contoh di atas, kadangkala digunakan juga skala dengan tujuh atau sembilan tingkat. Suatu studi empiris menemukan bahwa beberapa karakteristik statistik hasil kuesioner dengan berbagai jumlah pilihan tersebut ternyata sangat mirip. Skala Likert merupakan metode skala bipolar yang mengukur baik tanggapan positif ataupun negatif terhadap suatu pernyataan. Empat skala pilihan juga kadang digunakan untuk kuesioner skala Likert yang memaksa orang memilih salah satu kutub karena pilihan "netral" tak tersedia. Diunduh dari: http://id.wikipedia.org/wiki/Skala_Likert ………….. 23/8/2012 PSIKOLOGI DAN PSIKOMETRIK Psikologi adalah ilmu pengetahuan yang mempelajari perilaku manusia dalam hubungan dengan lingkungannya. Menurut asalnya katanya, psikologi berasal dari bahasa Yunani Kuno: "ψυχή" (Psychē yang berarti jiwa) dan "-λογία" (-logia yang artinya ilmu) sehingga secara etimologis, psikologi dapat diartikan dengan ilmu yang mempelajari tentang jiwa. Psikometrik merupakan bidang kajian yang berkaitan dengan teori dan teknik dalam pengukuran pendidikan dan psikologis, mencakup pengukuran pengetahuan, kemampuan, sikap, dan sifat kepribadian. Bidang ini terutama mempelajari perbedaan antar individu dan antar kelompok. Penelitiannya terutama pada: Pembuatan alat dan prosedur pengukuran, dan Pengembangan dan penyempurnaan pendekatan teoretis terhadap pengukuran. Kebanyakan dari kerja awal secara teoretis dan terapan dalam psikometrik dilakukan dalam upaya mengukur kecerdasan. Konsep kunci tradisional dalam teori tes klasikal adalah reliabilitas dan validitas. Alat ukur yang reliabel melakukan pengukuran dengan konsisten, sementara pengukuran yang valid adalah yang mengukur apa yang akan diukur. Diunduh dari: http://id.wikipedia.org/wiki/Psikometrik………….. 23/8/2012 PSIKOLOGI DAN PSIKOMETRIK Apa itu Persepsi? Persepsi merupakan suatu proses bagaimana seseorang menyeleksi, mengatur dan menginterpretasikan masukan-masukan informasi dan pengalaman-pengalaman yang ada dan kemudian menafsirkannya untuk menciptakan keseluruhan gambaran yang berarti. Menurut Mangkunegara, persepsi merupakan suatu proses pemberian arti atau makna terhadap lingkungan. Dalam hal ini persepsi mecakup penafsiran obyek, penerimaan stimulus (Input), pengorganisasian stimulus, dan penafsiran terhadap stimulus yang telah diorganisasikan dengan cara mempengaruhi perilaku dan pembentukan sikap. Robbins (2003) mendeskripsikan persepsi dalam kaitannya dengan lingkungan, yaitu sebagai proses di mana individu-individu mengorganisasikan dan menafsirkan kesan indera mereka agar memberi makna kepada lingkungan mereka. Proses persepsi melalui tiga tahap, yaitu: 1. Tahap penerimaan stimulus, baik stimulus fisik maupun stimulus sosial melalui alat indera manusia, yang dalam proses ini mencakup pula pengenalan dan pengumpulan informasi tentang stimulus yang ada. 2. Tahap pengolahan stimulus sosial melalui proses seleksi serta pengorganisasian informasi. 3. Tahap perubahan stimulus yang diterima individu dalam menanggapi lingkungan melalui proses kognisi yang dipengaruhi oleh pengalaman, cakrawala, serta pengetahuan individu. Diunduh dari: http://www.masbow.com/2009/08/apa-itu-persepsi.html 23/8/2012 PSIKOLOGI DAN PSIKOMETRIK Faktor-faktor yang Mempengaruhi Persepsi Thoha (1993) : persepsi pada umumnya terjadi karena dua faktor, yaitu faktor internal dan faktor eksternal. Faktor internal berasal dari dlam diri individu, misalnya sikap, kebiasaan, dan kemauan. Sedangkan faktor eksternal adalah faktor-faktor yang berasal dari luar individu yang meliputi stimulus itu sendiri, baik sosial maupun fisik. Robbins (2003): meskipun individu-individu memandang pada satu benda yang sama, mereka dapat mempersepsikannya berbeda-beda. (Robbins, S.P. 2003. Perilaku Organisasi. Jilid I. Jakarta: PT INDEKS Kelompok Garmedia). Ada sejumlah faktor yang bekerja untuk membentuk dan terkadang memutar-balikkan persepsi., yaitu : 1. Pelaku persepsi (perceiver) 2. Objek atau yang dipersepsikan 3. Konteks dari situasi dimana persepsi itu dilakukan. Diunduh dari: ………….. 23/8/2012 PSIKOLOGI DAN PSIKOMETRIK Aspek-aspek Persepsi “Sikap” merupakan suatu interelasi dari tiga komponen, yaitu: 1. Komponen kognitif, yaitu komponen yang tersusun atas dasar pengetahuan atau informasi yang dimiliki seseorang tentang obyek sikapnya. Dari pengetahuan ini kemudian akan terbentuk suatu keyakinan tertentu tentang obyek sikap tersebut. 2. Komponen Afektif , afektif berhubungan dengan rasa senang dan tidak senang. Jadi sifatnya evaluatif yang berhubungan erat dengan nilai-nilai kebudayaan atau sistem nilai yang dimilikinya. 3. Komponen Konatif, yaitu merupakan kesiapan seseorang untuk bertingkah laku yang berhubungan dengan obyek sikapnya. Byrne Myers (dalam Gerungan, 1996): “sikap” mengandung tiga komponen yang membentuk struktur sikap, yaitu: 1. Komponen kognitif (komponen perseptual), yaitu komponen yang berkaitan dengan pengetahuan, pandangan, keyakinan, yaitu hal-hal yang berhubungan dengan bagaimana orang mempersepsi terhadap objek sikap. 2. Komponen afektif (komponen emosional), yaitu komponen yang berhubungan dengan rasa senang atau tidak senang terhadap objek sikap. Rasa senang merupakan hal yang positif, sedangkan rasa tidak senang merupakan hal yang negatif. 3. Komponen konatif (komponen perilaku, atau action component), yaitu komponen yang berhubungan dengan kecenderungan bertindak terhadap objek sikap. Komponen ini menunjukkan intensitas sikap, yaitu menunjukkan besar kecilnya kecenderungan bertindak atau berperilaku seseorang terhadap objek sikap. (Gerungan, W. A. 1996. Psikologi Sosial. (edisi kedua). Bandung : PT Refika Aditama.) Diunduh dari: http://www.masbow.com/2009/08/apa-itu-persepsi.html………….. 23/8/2012 PSIKOLOGI DAN PSIKOMETRIK Sikap adalah pernyataan evaluatif terhadap objek, orang atau peristiwa . Hal ini mencerminkan perasaan seseorang terhadap sesuatu. Komponen utama sikap Sikap mempunyai tiga komponen utama: kesadaran, perasaan, dan perilaku (Breckler, S. J."Empirical Validation of Affect, Behavior, and Cognition as Distinct Component of Attitude," Journal of Personality and Social Psychology, Mei 1984, hal. 1191-1205). Keyakinan bahwa "Diskriminasi itu salah" merupakan sebuah pernyataan evaluatif. Opini semacam ini adalah komponen kognitif dari sikap yang menentukan tingkatan untuk bagian yang lebih penting dari sebuah sikap -komponen afektifnya.[ Perasaan adalah segmen emosional atau perasaan dari sebuah sikap dan tercermin dalam pernyataan seperti "Saya tidak menyukai John karena ia mendiskriminasi orang-orang minoritas.“ Akhirnya, “perasaan” dapat menimbulkan hasil akhir dari perilaku. Komponen perilaku dari sebuah sikap merujuk pada suatu maksud untuk berperilaku dalam cara tertentu terhadap seseorang atau sesuatu. Diunduh dari: http://id.wikipedia.org/wiki/Sikap………….. 23/8/2012 PSIKOLOGI DAN PSIKOMETRIK Perilaku manusia merupakan sekumpulan perilaku yang dimiliki oleh manusia dan dipengaruhi oleh adat, sikap, emosi, nilai, etika, kekuasaan, persuasi, dan/atau genetika. (Albarracín, Dolores, Blair T. Johnson, & Mark P. Zanna. The Handbook of Attitude. Routledge, 2005. Hlm. 74-78). Perilaku seseorang dikelompokkan ke dalam perilaku wajar, perilaku dapat diterima, perilaku aneh, dan perilaku menyimpang. Dalam sosiologi, ‘perilaku’ dianggap sebagai sesuatu yang tidak ditujukan kepada orang lain dan oleh karenanya merupakan suatu tindakan sosial manusia yang sangat mendasar. ‘Perilaku’ tidak boleh disalahartikan sebagai perilaku sosial, yang merupakan suatu tindakan dengan tingkat lebih tinggi, karena perilaku sosial adalah perilaku yang secara khusus ditujukan kepada orang lain. Penerimaan terhadap perilaku seseorang diukur relatif terhadap norma sosial dan diatur oleh berbagai kontrol sosial. Dalam kedokteran perilaku seseorang dan keluarganya dipelajari untuk mengidentifikasi faktor penyebab, pencetus atau yang memperberat timbulnya masalah kesehatan. Intervensi terhadap perilaku seringkali dilakukan dalam rangka penatalaksanaan yang holistik dan komprehensif. Benjamin Bloom, membedakan adanya tiga bidang perilaku, yakni kognitif, afektif, dan psikomotor. Kemudian dalam perkembangannya, domain perilaku yang diklasifikasikan oleh Bloom dibagi menjadi tiga tingkat: Pengetahuan (knowledge) Pengetahuan adalah hasil penginderaan manusia, atau hasil tahu seseorang terhadap obyek melalui indera yang dimilikinya. Sikap (attitude) Sikap merupakan respons tertutup seseorang terhadap stimulus atau objek tertentu, yang sudah melibatkan faktor pendapat dan emosi yang bersangkutan. Tindakan atau praktik (practice) Tindakan ini merujuk pada perilaku yang diekspresikan dalam bentuk tindakan, yang merupakan bentuk nyata dari pengetahuan dan sikap yang telah dimiliki. Diunduh dari: http://id.wikipedia.org/wiki/Perilaku ………….. 23/8/2012 PENGETAHUAN Pengetahuan adalah informasi yang diketahui atau disadari oleh seseorang. Pengetahuan termasuk, tetapi tidak dibatasi pada deskripsi, hipotesis, konsep, teori, prinsip dan prosedur yang secara Probabilitas Bayesian adalah benar atau berguna. Dalam pengertian lain, “pengetahuan” adalah pelbagai gejala yang ditemui dan diperoleh manusia melalui pengamatan akal. Pengetahuan muncul ketika seseorang menggunakan akal budinya untuk mengenali benda atau kejadian tertentu yang belum pernah dilihat atau dirasakan sebelumnya. Misalnya ketika seseorang mencicipi masakan yang baru dikenalnya, ia akan mendapatkan pengetahuan tentang bentuk, rasa, dan aroma masakan tersebut. “Pengetahuan” adalah informasi yang telah dikombinasikan dengan pemahaman dan potensi untuk menindaki; yang lantas melekat di benak seseorang. Pada umumnya, pengetahuan memiliki kemampuan prediktif terhadap sesuatu sebagai hasil pengenalan atas suatu pola. Manakala informasi dan data sekedar berkemampuan untuk menginformasikan atau bahkan menimbulkan kebingungan, maka pengetahuan berkemampuan untuk mengarahkan tindakan. Hal ini lah yang disebut potensi untuk menindaki. Pengetahuan empiris Pengetahuan yang lebih menekankan pengamatan dan pengalaman inderawi dikenal sebagai pengetahuan empiris atau pengetahuan aposteriori. Pengetahuan ini bisa diperoleh dengan melakukan pengamatan yang dilakukan secara empiris dan rasional. Pengetahuan empiris tersebut juga dapat berkembang menjadi pengetahuan deskriptif bila seseorang dapat melukiskan dan menggambarkan segala ciri, sifat, dan gejala yang ada pada objek empiris tersebut. Pengetahuan empiris juga bisa didapatkan melalui pengalaman pribadi manusia yang terjadi berulangkali. Misalnya, seseorang yang sering dipilih untuk memimpin organisasi dengan sendirinya akan mendapatkan pengetahuan tentang manajemen organisasi. Diunduh dari: http://id.wikipedia.org/wiki/Pengetahuan ………….. 23/8/2012 SURVEI Survei adalah pemeriksaan atau penelitian secara komprehensif. Survei yang dilakukan dalam melakukan penelitian biasanya dilakukan dengan menyebarkan kuesioner atau wawancara, dengan tujuan untuk mengetahui: siapa mereka, apa yang mereka pikir, rasakan, atau kecenderungan suatu tindakan. Dalam penelitian kuantitatif, survei lebih merupakan pertanyaan tertutup, sementara dalam penelitian kualitatif berupa wawancara mendalam dengan pertanyaan terbuka. Survei (survey) atau lengkapnya self-administered survey adalah metode pengumpulan data primer dengan memberikan pertanyaan-pertanyaan kepada responden individu. (Diunduh dari: http://id.wikipedia.org/wiki/Survei) PEMBUATAN KUESIONER Tujuannya: untuk memperoleh informasi yang relevan untuk memperoleh tingkat keandalan (reliability) dan keabsahan (validity) setinggi mungkin Tahap awal dari pembuatan kuesioner yang harus dipersiapkan adalah informasi apa saja yang ingin didapatkan dari responden, setelah itu baru disusun responden, pertanyaan. Diunduh dari: http://images.iwakcucut.multiply.multiplycontent.com/attachment/0/Sew8pQoKCC0AACXyfmc1/ME TOD%20SURVEI.pdf?key=iwakcucut:journal:4&nmid=233175371………….. 24/8/2012 METODE SURVEI DALAM METODE PENELITIAN KUANTITATIF Survei merupakan istilah yang digunakan dalam bidang sosiologi terutama sejak publikasi Pittsburg Survei pada tahun 1912. Survei ini banyak digunakan di Amerika Serikat dan Inggris, tetapi kurang begitu banyak digunakan di continental Eropa. Survei merupakan penelitian yang dilakukan untuk memperoleh fakta dan gejalagejala yang ada dan mencari keterangan secara faktual. Metode survei digunakan sebagai teknik penelitian yang melalui pengamatan langsung terhadap suatu gejala atau pengumpulan informasi melalui pedoman wawancara, kuisioner, kuisioner terkirim (mailed questionnaire) atau survei melalui telepon (telephone survey). Beberapa kelemahan metode survei: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. Kuisioner yang digunakan dapat menggunakan kuisioner terkirim, dapat juga melalui telepon. Sehingga tidak ada interaksi langsung dari kedua pihak, peneliti pun tidak dapat mengetahui ekspresi dari responden. Kuisioner yang dikirim melalui pos kadang kala tidak dikembalikan ataupun tidak diisi oleh responden (tidak valid) Secara sosiologis, metode survey melihat masyarakat sebagai kumpulan individu. Pendekatan ini dipandang sebagai pendekatan atomistic, dan tidak dipandang sebagai satu kesatuan sosial yang holostik. Survey bersifat kaku. Dimana tidak memungkinkan peneliti untuk meneliti hal-hal diluar rancangan. Tidak dapat menyajikan gambaran khas mengenai kelompok atau komunitas tertentu dalam populasi. Hanya dilakukan pada titik waktu tertentu saja, sehingga tidak mengetahu proses atau sejarah perkembangan masyarakat. Tidak cocok untuk masyarakat tradisional. Sangat rentan adanya kesalahan, sehingga sangat ditentukan oleh besar kecilnya sampling. Menuntut validitas dan reliabilitas instrument penelitian. Dapat menghasilkan generalisasi empiris terhadap populasinya apabila menggunakan teknik sampling yang benar. Survey dapat dilakukan serempak di berbagai lokasi penelitian. Bermanfaat untuk menjawab masalah sosial dengan cepat sehingga kebijakan, program, dan intervensi sosial segera dapat dilakukan. Dapat menghindari bias peneliti. Karena bersifat obyektif, tanpa memasukkan perasaan peneliti, dan bebas nilai, dan hasil survey tidak diragukan keabsahannya. Diunduh dari: http://indudt.blog.fisip.uns.ac.id/2012/03/01/metode-survey-dalam-metodepenelitian-kuantitatif/ ………….. 24/8/2012 KELEBIHAN MENGGUNAKAN METODE SURVEI 1. 2. 3. 4. 5. Dapat dilakukan untuk menginvestigasi masalah yang terkait dengan kehidupan manusia tanpa harus melalui riset laboratorium atau melalui perancangan suatu kondisi tertentu. Tidak membutuhkan biaya yang besar Pengumpulan data yang luas dapat dilakukan dengan relatif mudah. Tidak dibatasi oleh faktor geografi Data yang telah ada di lapangan memberikan kemudahan survei 1. Kelebihan Metode Survei 2. Dalam Survei biasanya dilibatkan banyak orang (sampel) untuk mencapai generalisasi atau kesimpulan yang bersifat umum yang dapatdipertanggungjawabkan Dapat digunakan berbagai teknik pengumpulan data seperti Angket, Wawancara atau Observasi sesuai kebutuhan. Sering tampil masalah-masalah yang sebelumnya tidak diketahui atau diduga, sehingga sekaligus dapat bersifat eksploratif Dengan survei, peneliti dapat membenarkan atau menolak teori tertentu. 3. 4. 5. Metode survei merupakan bagian dari paradigma positivisme. Ada beberapa kaidah yang perlu dipatuhi dalam menggunakan metode survei. 1. 2. 3. 4. Pertama, peneliti harus membangun jarak dengan objek penelitiannya untuk menghindari bias. Ke dua, kaidah yang menyangkut hasil penelitian. Ke tiga, survei dicirikan oleh tahapan riset yang terstruktur. Ke empat, kaidah yang terkait dengan pemaknaan terhadap kebenaran. Diunduh dari: kaskusian.awardspace.biz/.../... ………….. 24/8/2012 SURVEI SOSIAL Survei sosial mempunyai prinsip-prinsip, diantaranya adalah sebagai berikut : 1. 2. 3. 4. 5. Menggunakan metode ilmiah dalam mnengatasi suatu masalah di suatu tempat tertentu dengan memberikan saran yang bermanfaat. Merupakan proses pengumpulan fakta kuantitatif mengenai aspek sosial dari komposisi dan kegiatan masyarakat. Digunakan untuk mempersiapkan suato program pembangunan melalui penelitian sosial untuk menghikangkan penyakit sosial. Dimaksudkan untuk dasar bagi pene;itian sosial lebih lanjut guna menghasilkan hipotesis baru. Merupakan kegiatan pengumpulan pendapat, sikap dan perilaku dari sebagian besar orang disuatu wilayah dan waktu tertentu. Tujuan survei sial adalah untuk menyediakan informasi mengenai suatu masalah. Informasi yang disajikan ini sangat dibutuhkan oleh orang atau pihak lain yang sedang menpelajari masalah sosial. Disebut dengan utilitarian, yaitu memberikan informasi yang berkaitan dengan masalah praktis. Survey sosial juga bertujuan untuk mendeskripsikan suatu gejala. Dalam hal ini peneliti melakukan penelitian secara langsung dengan datang ke lokasi dan berhubungan langsung dengan gejala yang sedang ia teliti. Disini peneliti bertujuan untuk mengumpulkan informasi, bukan membuktikan suatu gejala. Dengan informasi ini sehingga dapat menjadikan landasan dalam pembentukan hipotesis berikutnya. Survei sosial juga dapat dilakukan untuk menjelaskan suatu gejala sosial. Fungsinya lebih bersifat teoritis, yaitu menguji sejumlah hipotesis yang disarankan oleh teori sosiologi. Survei juga banyak digunakan untuk menerangkan hubungan antara dua variabel. Survei juga dapat bersifat umum maupun khusus, sifatnya dapat utilitarian maupun akademis. Diunduh dari: http://indudt.blog.fisip.uns.ac.id/2012/03/01/metode-survey-dalam-metodepenelitian-kuantitatif/ ………….. 24/8/2012 DATA, SKALA, DAN VARIABEL Data dapat dimaknai sebagai sekumpulan informasi atau nilai yang diperoleh dari pengamatan (observasi) suatu obyek, data dapat berupa angka dan dapat pula merupakan lambang atau sifat. Beberapa macam data antara lain ; data populasi dan data sampel, data observasi, data primer, dan data sekunder. Data yang baik adalah data yang bisa dipercaya kebenarannya (reliable), tepat waktu dan mencakup ruang lingkup yang luas atau bisa memberikan gambaran tentang suatu masalah secara menyeluruh merupakan data relevan. Menurut sifatnya, yang selanjutnya dapat dibagi dua : 1. Data Kualitatif yaitu data yang tidak berbentuk angka, misalnya: Kuesioner Pertanyaan tentang suasana kerja, kualitas pelayanan sebuah restoran atau gaya kepemimpinan, dsb 2. Data Kuantitatif yaitu data yang berbentuk angka, misalnya: harga saham, besarnya pendapatan, dsb Penyusunan skala (perskalaan) adalah menetapkan proposisi atau mengatur secara seimbang, atau menurut perimbangan nilai pada dimensi variabelvariabel. Penyusunannya dapat dibedakan antara penyusunan indeks variabel dan penyusunan skala variabel. Scaling atau perskalaan hanya dapat dikenakan pada gejala kontinum yaitu menetapkan proporsi atau mengatur menurut pertimbangan (to set in proportion, to design or regulate to ratio ). Perskalaan pada gejala – gejala kontinum merupakan akibat logis dari pada adanya variabilitas tingkatan pada gejala–gejala kontinum itu. Skala Likert: skala likert digunakan untuk mengukur sikap, pendapat, dan persepsi seseorang atau sekelompok orang tentang fenomena sosial. Skala likert bisa 1,2,3, 4, 5, skala tergantung kebutuhan. Diunduh dari: http://usupress.usu.ac.id/files/Analisis%20Data%20untuk%20Riset%20dan%20Manajemen%20%20Final%20Cetak_bab%201.pdf ………….. 24/8/2012 Petunjuk membuat pertanyaan 1. 2. 3. 4. 5. 6. 7. Gunakan kata-kata sederhana, jelas dan khusus Pertanyaan berlaku bagi semua responden Berkaitan dengan masalah dan sasaran penelitian Tidak menggiring Tidak membuat informasi yang tidak dimiliki responden Tidak memuat hal yang bersifat pribadi atau peka Tidak bersifat klise TEKNIK SKALA Bertujuan untuk mengetahui ciri-ciri atau karakteristik sesuatu hal berdasarkan suatu ukuran tertentu, sehingga dapat dibedakan Sifat Skala 1. Skala Nominal: Membedakan, tanpa tingkatan. Misalnya: Laras, Tata, Gagas, Kokom dll 2. Skala Ordinal: membedakan dengan suatu urutan, tanpa jarak. Misalnya: Mhs semester I kodenya 4, Mhs semester II Kodenya 6, mhs semester III kodenya 8. 3. Skala interval: membedakan dengan tingkatan, ada jarak. Misalnya: umur fiya 2 tahun, gagas 3 tahun, laras 5 tahun. 4. Skala Ratio: membedakan dengan tingkatan, ada jarak, ada nilai mutlak. Misalnya IP Tata 4 dan IP Siska 2, jadi prestasi Tata 2 kali prestasi Siska Diunduh dari: http://images.iwakcucut.multiply.multiplycontent.com/attachment/0/Sew8pQoKCC0AACXyfmc1/ME TOD%20SURVEI.pdf?key=iwakcucut:journal:4&nmid=233175371………….. 24/8/2012 VARIABEL Variabel adalah sesuatu yang dapat membedakan atau mengubah variasi pada nilai. Nilai dapat berbeda pada waktu yang berbeda untuk obyek atau orang yang sama, atau nilai dapat berbeda dalam waktu yang sama untuk obyek atau orang yang berbeda. Untuk lebih jelasnya bisa dilihat pada bab tiga mengenai proposisi. 1. 2. 3. 4. Secara konseptual variabel dapat kita bagi menjadi empat, yaitu: Variabel dependent adalah variabel yang menjadi perhatian utama dalam sebuah pengamatan. Tujuan penelitian adalah memahami dan membuat variabel terikat, menjelaskan variabilitasnya atau memprediksinya. Variabel dependen sering juga disebut dengan variabel terikat atau variabel terpengaruh. Variabel independent adalah variabel yang dapat mempengaruhi perubahan dalam variabel dependen dan mempunyai hubungan yang positif ataupun yang negatif bagi variabel dependen nantinya. Variasi dalam variabel dependen merupakan hasil dari variabel independen. Variabel independen sering juga disebut dengan variabel bebas atau variabel yang mempengaruhi. Moderating Variable adalah variabel yang mempunyai dampak kontingensi (contingent effect) yang kuat pada hubungan variabel independen dan variabel dependen. Intervening variable adalah faktor yang secara teori berpengaruh pada fenomena yang diamati tetapi tidak dapat dilihat, diukur, atau dimanipulasi, namun dampaknya dapat disimpulkan berdasarkan dampak variabel independen dan moderating terhadap fenomena yang diamati. Intervening variable ini dapat membantu kita dalam menjelaskan bagaimana mengkonsepsi hubungan anatar varibel independen dan variabel dependen. ANALISIS DATA Analisis data bertujuan untuk menyusun data dalam cara yang bermakna sehingga dapat dipahami. Para peneliti berpendapat bahwa tidak ada cara yang paling benar secara absolut untuk mengorganisasi, menganalisis, dan menginterpretasikan data Karena itu, maka prosedur analisis data dalam penelitian disesuaikan dengan tujuan penelitian. Untuk memudahkan dalam analisa data metode yang digunakan adalah metode statistik. Statistika adalah serangkaian metode yang dipakai untuk mengumpulkan, menganalisa, menyajikan dan memberi makna, data. Metode statistik mempermudah para pengambil keputusan memahami informasi mana yang harus dimanfaatkan, agar keputusan mereka tepat. Diunduh dari: http://usupress.usu.ac.id/files/Analisis%20Data%20untuk%20Riset%20dan%20Manajemen%20%20Final%20Cetak_bab%201.pdf ………….. 24/8/2012 Variables • Independent – Precedes, influences or predicts results • Dependent – Affected by or predicted by the Independent Variable • Extraneous – Affected by the D.V., but not controlled or measured. Causes error • Confounding – An extraneous variable that varies systematically (has a relationship) with the I.V. • Intervening – Unobservable trait that influences behavior (e.g., effect of new intervention on self-esteem may be affected by the motivation level of subjects) • Control – Used to eliminate the effect of extraneous variables • Organismic – Aka, measured, or assigned – Characteristics of the subjects that cannot be manipulated Diunduh dari: ………….. 23/8/2012 Types of Variables Nominal Variable Name or Identity of particular characteristics Sex, Ethnicity, Region, Religion, School, Team, Experimental Condition Quantitative Variable Numbers to indicate the extent to which a person possesses a characteristic of interest. 1. 2. 3. 4. Perceived Attractiveness, Number of Siblings Self-Esteem Independence/Interdependence Dalam suatu penelitian sosial, menurut Sofian Effendi, proses pengukuran adalah rangkaian dari empat aktivitas, yakni : Menentukan dimensi konsep penelitian Rumusan ukuran untuk masing-masing dimensi (pertanyaan- pertanyaan yang relevan dengan dimensi) Tentukan tingkat ukuran yang akan digunakan (Nominal, Ordinal, Interval, Rasio) Tentukan tingkat kesahihan dan keajegan dari alat pengukur. Utuk melakukan pengukuran, maka peneliti perlu menentukan konsep/variabel yang akan diteliti, menentukan indikator-indikator dari variabel tersebut, menentukan itemitem untuk pengukuran sesuai dengan indikator masing-masing, dan kemudian melakukan pengujian atas kesahihan (validitas) dan keajegan (reliabilitas) alat ukur tersebut (Instrumen Penelitian). DIUNDUH DARI: www.library.upnvj.ac.id/pdf/s1manajemen09/.../BAB%20III.pdf 25/8/2012 Diunduh dari: ………….. 23/8/2012 PENGERTIAN PENGUKURAN “Pengukuran” merupakan proses yang dilakukan seorang peneliti untuk menguji hipotesis dan teori. Seorang peneliti menyimpulkan berdasarkan hipotesis bahwa kondisi tertentu harus ada dalam dunia nyata dan kemudian mereka melakukan pengukuran untuk konidisi-kondisi nyata tersebut. Hal ini menunjukkan bahwa hipotesis masih bersifat abstrak yang perlu diterjemahkan secara operasional dalam bentuk kondisi-kondisi yang dapat diukur di lapangan. Jika kondisi-kondisi nyata tersebut ditemukan berarti peneliti akan mendukung hipotesis tersebut, tetapi sebaliknya, jika kondisi-kondisi tersebut tidak ditemukan berarti hipotesisnya tidak berlaku. Pertanyaannya adalah apa yang harus diukur? Banyak definisi pengukuran yang telah disampaikan oleh beberapa ahli, diantaranya adalah sebagai berikut: Measurement is the assignment of numerals to represent the properties of material system other than number, in virtue of the laws governing the properties (Campbells) Measurement is the assignment of numerals into even or object based on certain rules (Steven) Pengukuran dapat diartikan sebagai suatu prosedur untuk mengklasifikasikan kasus (subyek riset, unit eksperimen, responden, atau secara umum obyek-obyek seperti orang, perusahaan, benda, dsb) ke dalam kategori-kategori dalam suatu variabel tertentu. Pengertian tersebut menunjukkan bahwa variabel sangat erat kaitannya dengan pengertian pengukuran. Variebel adalah setiap karakteristik yang dapat diklasifikasikan ke dalam sekurang-kurang dua klasifikasi. Konsep yang digunakan dalam penelitian dapat diklasifikasikan sebagai objek atau sebagai properti (sifat, ciri, karakteristik). Objek selain meliputi suatu benda yang berwujud nyata, juga dapat berupa sesuatu yang abstrak, misalnya ketinggian suatu tempat. Sedangkan properti adalah karateristik dari objek, misalnya sifat fisik manusia bisa dinyatakan dengan berat atau tinggi badan; sifat psikologis seperti sikap atau kecerdasasan; serta sifat sosial yang mencakup kepemimpinan atau status. Karakteristik-karakteristik itulah yang merupakan objek pengukuran dalam penelitian. Setiap objek mempunyai ciri yang dapat membedakan objek suatu dengan objek lainnya. Dalam penelitian, ciri yang diteliti (diperiksa, diamati, diukur, atau dihitung) disebut “karakteristik”, sedangkan objek yang karakteritiknya diteliti disebut “satuan pengamatan”. Diunduh dari: http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf ………….. 24/8/2012 TINGKAT PENGUKURAN Seorang peneliti menggunakan beberapa bentuk skala dalam melakukan proses pengukuran. Setiap skala tersebut didasarkan sekumpulan asumsi (aturan-aturan) mengenai hubungan antara skala tersebut dengan observasi nyatanya. Konseptualisasi skala tersebut didasarkan pada tiga karakteristik sebagai berikut: 1. 2. 3. Urutan bilangan, yaitu sebuah bilangan lebih besar, lebih kecil, atau sama dengan bilangan lain, Urutan perbedaan antara bilangan, yaitu perbedaan antara sepasang bilangan bisa lebih besar, lebih kecil atau sama besar dengan perbedaan sepasang bilangan lainnya, Titik awal yang unik yang menunjukkan bilangan 0. Kombinasi ketiga karakteristik tersebut yang mencakup urutan, perbedaan, dan titik awal, membentuk 4 klasifikasi skala pengukuran sebagai berikut: Diunduh dari: http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf………….. 24/8/2012 Types of Variable and Types of Measurement Number? No Yes Quantitative Variable Order? Nominal Variable Yes Distance Matters? No Ordinal Scale Yes True Zero? No Interval Scale Yes Ratio Scale Diunduh dari: ………….. 23/8/2012 Nominal Scale Buddhist Buddhist Protestant Jewish Jewish Catholic Catholic Protestant . An aggregation framework to link indicators associated with multifunctional land use to the stakeholder evaluation of policy options Maria Luisa Paracchini, Cesare Pacini, M. Laurence M. Jones, Marta Pérez-Soba. Ecological Indicators. Volume 11, Issue 1, January 2011, Pages 71–80 Options for normalisation of indicators: showing (a) normalisation according to indicator range, with a nominal 0–10 scale representing increasing sustainability, and (b) scaling according to equal units of sustainability relative to a sustainability limit, with a nominal −3 to +3 scale representing increasing sustainability. Diunduh dari: http://www.sciencedirect.com/science/article/pii/S1470160X09000624 ………….. 25/8/2012 Ordinal Scale 1st Born 2nd Born 3rd Born Elastic Tape 1st Born 2nd Born 3rd Born 1st Born 3rd Born 2nd Born Temporal changes (1986–1999) in populations of primrose (Primula vulgaris Huds.) in an agricultural landscape and implications for conservation Patrick Endels, Hans Jacquemyn, Rein Brys, Martin Hermy, Geert De Blust. Biological Conservation. Volume 105, Issue 1, May 2002, Pages 11–25. Polar scatterplot of aspect and slope for 64 sites (populations on flat surface were omitted) with P. vulgaris populations in Belgium. [ordinal scale for the slope variable: 1, slight slope (0–30%); 2, average slope (30–60%); 3, strong slope (>60%)]. Diunduh dari: http://www.sciencedirect.com/science/article/pii/S0006320701001732 ………….. 25/8/2012 Interval Scale 0 - 10 10 0 20 10 30 40 50 60 20 30 40 50 0 10 20 30 40 50 60 Introducing wildfire into forest management planning: towards a conceptual approach Kostas D. Kalabokidis, Stylianos Gatzojannis, Spyros Galatsidas Forest Ecology and Management. Volume 158, Issues 1–3, 15 March 2002, Pages 41–50. Diunduh dari: http://www.sciencedirect.com/science/article/pii/S0378112700007155 ………….. 25/8/2012 Ratio Scale 0 10 20 30 40 50 60 - 10 0 10 20 30 40 50 0 10 20 30 40 50 60 Diunduh dari: ………….. 23/8/2012 Menentukan Rentang Skala Likert Pada dasarnya skala likert merupakan suatu alat, seperti sebuah penggaris untuk mengukur panjang. Kalau kita ingin mengukur panjang sebuah meja kecil dapat digunakan penggaris biasa; tetapi kalau kita ingin mengukur panjang jalan, maka digunakan penggaris yang lebih panjang. Apakah penelitian tersebut mengukur preference atau mengukur kinerja? Seberapa rinci pengukuran yang akan dilakukan. Satu hal yang perlu diperhatikan, rentang Skala Likert harus memiliki nilai yang tepat. Lebih mudahnya perhatikan contoh penelitian berikut: Setuju vs Tidak Setuju Ingin diketahui apakah masyarakat setuju akan suatu pernyataan. C ontoh peryataannya adalah 'Pelebaran sungai diperlukan untuk mengatasi banjir'. Maka akan muncul kemunginkan pilihan sebagai berikut: 1. Sangat tidak setuju Agak tidak setuju Agak setuju Sangat setuju 2. Sangat tidak setuju Tidak setuju Ragu2 Setuju Sangat setuju 3. Sangat tdk setuju Tdk setuju Agak tdk setuju Agak setuju Setuju Sangat-setuju 4. Dan seterusnya, kita DAPAT membuatnya menjadi 4, 5, 6, atau bahkan 7 pilihan. Tetapi mana yang terbaik? Pilihan yang terbaik adalah yang memiliki rentang paling banyak. Dengan kondisi setiap arti dari skala tersebut memiliki arti yang saling bertolak belakang dengan skala yang lain. Misalnya Setuju vs Tidak setuju, Sangat tidak setuju vs Sangat setuju, dst. Hal ini menghindari pilihan netral (ragu-ragu), kecuali jika anda ingin mengetahui apakah ada pihak netral. Misalkan untuk peryataan seperti berikut 'Pak Abdul layak menjadi Presiden 2014'. Diunduh dari: http://statisticscafe.blogspot.com/2012/02/menentukan-rentang-skala-likert.html Measures No Self-Report? Behavioral Measures Yes Physiological? Yes No Self-Report Measures Psychophysiological Measures EEG, MRI, fMRI, PET, CAT Format? Yes No Attitudes? Yes No Free Format Self-Report Measures Fix Format Self-Report Measures Non-Reactive Measures IAT Observational Measures Projective Measures Associative Measures Think-around Protocols The Likert Scale The Semantic Differential The Guttman Scale Diunduh dari: ………….. 23/8/2012 Frequency, Duration, Intensity Latency, Speed KARAKTERITIK PENGUKURAN YANG BAIK Proses pengukuran mengggunakan suatu alat ukur. Alat ukur tersebut harus menghasilkan ukuran yang sesuai dengan karakteristik obyek sesungguhnya. Kesulitan-kesulitan pengukuran dalam ilmu sosial tersebut bisa menimbulkan perbedaan-perbedaan hasil pengukuran untuk setiap peneliti yang merancang sendiri alat ukur, atau disebut juga instrumen penelitian. 1. 2. 3. 4. Sumber-sumber yang bisa menimbulkan perbedaan hasil pengukuran adalah : Faktor satuan pengamatan (misalnya responden yang asal-asalan atau tidak jujur mengisi kuisoner), Faktor situasional (misalnya tekanan dari orang lain atau enggan diwawancara secara langsung); Faktor pihak pengukur (misalnya si pewawancara tidak komunikatif atau terlalu bertele-tele), Faktor instrumen penelitian alau alat ukur (misalnya redaksi membingungkan atau bisa menimbulkan interpretasi yang berbeda-beda). Bagaimana mengevaluasi baik ATAU tidaknya suatu alat ukur? Secara umum terdapat tiga karakteristik yang digunakan untuk menilai baik- tidaknya proses pengukuran, yaitu validitas (validity), reliabilitas (reliability), dan kepraktisan (practicality). “Validitas” adalah mengukur apa yang seharusnya diukur, yaitu validitas eksternal dan validitas internal. Validitas eksternal menunjukkan kemampuan pengukuran untuk diterapkan secara umum pada berbagai obyek, tempat, dan waktu pengukuran. Sedangkan validitas internal berkaitan dengan kemampuan instrumen penelitian untuk mengukur apa yang ingin diukur. “Reliabiltas” menunjukkan konsistensi pengukuran yang dilakukan yang meliputi stabilitas (stability), ekivalen (equivalence), dan konsistensi internal (internal consistency). Reliabilitas ini sangat erat kaitannya dengan ketepatan dan ketelitian pengukuran. Pengukuran dikatakan stabil jika pengukuran pada sebuah obyek dilakukan berulang-ulang pada waktu yang berbeda, menunjukkan hasil yang sama. Pengukuran dikatakan “ekivalen” jika pengukuran menunjukkan hasil pengukuran yang sama jika dilakukan peneliti lain atau memakai contoh item lain; Pengukuran dikatakan “konsisten internal” jika item-item atau indikator yang digunakan adalah konsisten satu sama lain. “Kepraktisan” bisa ditinjau dari sudut ekonomi (biaya dan waktu), kemudahan administrasi atau pengelolaannya, serta hasil yang mudah diinterpresikan oleh pihak lain. Diunduh dari: http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf………….. 24/8/2012 TEKNIK PENSKALAAN Dalam ilmu sosial, alat ukur yang digunakan untuk mengukur variabel sering tidak tersedia sehingga harus dirancang dan dikembangkan sendiri oleh peneliti. Alat ukur (instrumen) harus dapat membeda-bedakan satuan pengamatan sesuai dengan karakteristik yang diamati dengan menggunakan teknik penskalaan tertentu. “Penskalaan” merupakan prosedur untuk memberikan bilangan (atau simbol lain) pada suatu obyek sehingga bilangan tersebut menunjukkan karakteristik obyek tersebut. Karakteritik tersebut lebih tepatnya diwakili oleh sejumlah indikator atau item. Beberapa teknik penskalaan yanh sering digunakan adalah Likert’s Summated Rating (LSR), Semantic Differential, The Law of Comparative Judgement, Method of Succesive Interval, dan Method Bsed on Rank Order. LSR adalah metode pengukuran sikap (attitude) yang banyak digunakan dalam penelitian sosial karena kesederhanaannya. LSR sangat bermanfaat untuk membandingkan skor sikap seseorang dengan distribusi skala dari sekelompok orang lainnya, serta untuk melihat perkembangan atau perubahan sikap sebelum dan sesudah ekperimen atau kegiatan. Tahap-tahap perancangan LSR adalah sebagai berikut: 1. Tentukan secara tegas sikap terhadap topik apa yang akan diukur. Contohnya, sikap para karyawan terhadap sistem pelatihan, sikap para pengusaha kecil terhadap realisasi pemberian kredit usaha, sikap mahasiswa terhadap liberalisasi perdagangan, dan sebagainya 2. Tentukan secara tegas Dimensi yang menyusun sikap tersebut. Dimensi tersebut pada dasarnya merupakan faktor-faktor yang mempengaruhi sikap yang menurut Likert terdiri dari dimensi kognitif (tahu atau tidak tahu), afektif (perasaan terhadap sesuatu), dan konatif (kecenderungan untuk bertingkat laku). Contoh lain, dimensi tingkat sosial ekonomi meliputi kekayaan, pendapatan, pendidikan, dan pekerjaan 3. Susun pernyataan-pernyataan atau item yang merupakan alat pengukur dimensi yang menyusun sikap yang akan diukur sesuai dengan indikator. Banyaknya indiktor biasanya antara 30-40 item untuk sebuah sikap tertentu. Item-item yang disusun tersebut harus terdiri dari item positif dan item negatif. Item positif adalah pernyataan yang memberikan isyarat mendukung/menyokong topik yang sedang diukur, sedangkan item negatif sebaliknya, yaitu melawan topik. Item positif dan item negatif harus ditempatkan secara acak. Contoh: Dua contoh item untuk mengukur sikap para pemilik perusahaan terhadap masuknya investor asing : a. Masuknya investor asing akan memperluas jaringan bisnis (item positif) b. Investor asing akan menyebabkan eksploatasi sumberdaya domestik (Item Negatif) 4. Diunduh dari: http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf………….. 24/8/2012 Tahap-tahap perancangan LSR adalah : 4. Setiap item diberi pilihan respon yang bersifat tertutup (closed questionare). Banyaknya pilihan respon biasanya 3, 5, 7, 9, dan 11. Dalam prakteknya, jumlah pilihan respon yang paling banyak dipakai adalah 5. Alasannya adalah jika respon terlalu sedikit maka hasilnya terlalu kasar tetapi jika terlalu banyak maka responden sulit membedakannya. Kelima pilihan respon tersebut adalah: Sangat tidak setuju Tidak setuju Tidak ada pendapat Setuju Sangat setuju Contoh: a. Masuknya investor asing akan memperluas jaringan bisnis [ ] Sangat setuju [ ] Setuju [ ] Tidak ada pendapat [ ] Tidak setuju [ ] Sangat tidak setuju b. Investor asing akan menyebabkan eksploitasi sumberdaya alam domestik [ ] Sangat setuju [ ] Setuju [ ] Tidak ada pendapat [ ] Tidak setuju [ ] Sangat tidak setuju 5. Untuk setiap pilihan respon, jawaban diberikan skor dengan kriteria apabila item positif maka angka terbesar diletakkan pada sangat setuju sedangkan jika item negatif maka angka terbesar diletakkan pada sangat tidak setuju. Skor yang diberikan pada jawaban untuk setiap item kemudian dijumlahkan. Contoh skor untuk item negatif dan positif diatas adalah sebagai berikut: a. Masuknya investor asing akan memperluas jaringan bisnis (item positif) [5] Sangat setuju [4] Setuju [3] Tidak ada pendapat [2] Tidak setuju [1] Sangat tidak setuju b. Investor asing akan menyebabkan eksploatasi sumber daya domestik (item negatif) [1] Sangat setuju [2 ] Setuju [3] Tidak ada pendapat [4] Tidak setuju [5] Sangat tidak setuju . Diunduh dari: http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf………….. 24/8/2012 HOW MEANINGFUL ARE DATA FROMLIKERT SCALES? AN EVALUATION OF HOW RATINGS ARE MADE AND THE ROLEOF THE RESPONSE SHIFT IN THE SOCIALLY DISADVANTAGED. Jane Ogden and Jessica Lo Journal of Health Psychology1 –12© The Author(s) 2011 Likert scales relating to quality of life were completed by the homeless (N= 75); first year students (N= 301)and a town population (N= 72). Participants also completed free text questions. The scale and free textdata were often contradictory and the results highlighted three processes to account for these disparities: (i) frame of reference: current salient issues influenced how questions were interpreted; (ii) within-subjectcomparisons: ratings were based on expectations given past experiences; (iii) time frame: those with morestable circumstances showed habituation to their level of deprivation. Likert scale data should be understoodwithin the context of how ratings are made . Likert scales. Participants rated the followingusing 5-point Likert scales (not at all (1), rarely(2), somewhat (3), fairly (4), very much (5)). All items for mood and health status referred to how participants were feeling ‘right now’. The quantitative data from the Likert scales wereanalysed using ANOVA and LSD post hoc tests toexplore differences in mood, health status and sat-isfaction between the three groups. Diunduh dari: http://surrey.academia.edu/JaneOgden/Papers/928422/How_meaningful_are_data_from_Likert_sc ales_an_evaluation_of_how_ratings_are_made_and_the_role_of_the_response_shift_in_the_socia lly_disadvantaged………….. 24/8/2012 Levels of Measurements Four levels of Measurements • Nominal – Measures categories • Ordinal – Categories + rank and order • Interval – Equal distance between any two consecutive measures • Ratio – Intervals + meaningful zeros Metode Pengukuran Sikap Komponen sikap dijelaskan melalui tiga dimensi: 1. 2. 3. Afektif, menyatakan refleksi perasaan atau emosi seseorang terhadap suatu obyek. Kognitif menunjukkan kesadaran seseorang terhadap pengetahuan mengenai obyek tertentu Komponen-komponen perilaku, menggambarkan suatu keingingan, kecenderungan untuk bertindak. Skala pengukuran Sikap Terdiri dari: 1. 2. 3. 4. 5. 6. Skala sederhana Skala kategori Skala Likerts Skala perbedaan semantis Skala Numeris Skala Grafis Skala Sederhana 1. Skala sederhana menggunakan skala nominal misalnya setuju atau tidak setuju, ya atau tidak. 2. Skala ini digunakan bila kuesionar penelitian berisi relatif banyak butir pertanyaan, tingkat pendidikan responden rendah atau alasan lain. Diunduh dari: ocw.usu.ac.id/.../ekm_2405_slide_skala_pengukuran_dan_instrumen...………….. 24/8/2012 Skala Kategori = Categories of Scales • Categorical (ratings) – • Comparative (ranking) – • Score by comparing - Smartest Preference – • Score without comparison - 1 to 5 scales Subjective - which do you prefer Non-preference – Objective - which solution is less costly Skala Kategori 1. 2. 3. 4. Skala ketegori merupakan metode pengukuran sikap yang berisi beberapa alternatif kategori pendapat yang emmungkinkan bagi responden untuk memberikan alternatif penilaian. Skala ini mengukur lebih sensitif dimensi konstruk dibandingkan dengan skala sederhana. Skala ini disebut juga skala butir penelianan, dan dapat dinyatakan dengan angka. Skala ini digunakan untuk mengukur sikap responden yang berkaiatan dengan: 1. kualitas, 2. urgensi, 3. menarik, 4. kepuasan, 5. frekuensi Diunduh dari: ………….. 23/8/2012 Types of Scales Categories of Scales • – – • • Unidimensional Involves only one aspect of the measurement Measurement by one construct Multi-dimensional – – Involves several aspects of a measurement Uses several dimensions to measure a single construct • Likert/Summated Rating Scales Semantic Differential Scales • Magnitude Scaling • Thruston Scales • Guttman Scales T.F. Wong and Y.Y. Yan . 2012. Perception of Neighborhood Environments and Self-rated Health in Hong Kong. The Internet Journal of Public Health. 2012 Volume 2 Number 1. DOI: 10.5580/2b7c. It is believed that where an individual resides is associated with his health status. This neighborhood and health relationship is well documented in western countries but receives very little attention in Hong Kong. The present study attempted to explore the relationship between perception of neighborhood environments and self-rated health (SRH) in Tin Shui Wai, Hong Kong. Questionnaire was used to collect people’s perception of neighborhood environments, including the physical and living environment, service environment and social environment, and their SRH. Binary logistic regression was employed to explore the neighborhood environment and SRH relationship. It was discovered that a significant negative association of poor SRH with perceptions of physical and living, service and social environments. Income and education levels also were significant predictors of SRH. Perception of neighborhood environment Neighborhood environments, for this study, include three subscales perceived by the respondents including (i) physical and living environment; (ii) service environment and (iii) social environment. For physical and living environment, respondents were asked to evaluate the air quality, noise level, environmental cleanliness and hygiene and public security of their neighborhood by a five-point Likert scale ranging from 1, very serious problem to 5, not a problem. A total of 16 questions were asked in this part. The measurement of service environment was obtained by asking respondents to assess the social services, social welfare facilities and some neighborhood facilities such as medical, recreational and cultural facilities in the neighborhood by a five-point Likert scale ranging from 1, very serious problem to 5, not a problem. Eight questions were administered in this part. The social environment was represented by asking respondents to rate a total of 20 statements regarding social participation, social networking, social connectivity, relationship with neighborhoods and sense of belonging to the neighborhood by using a five-point Likert scale ranging from 1, strongly disagree to 5, strongly agree. Responses to the individual items in each subscale were summed to produce the physical and living environment score, service environment score and social environment score which indicated the overall assessment of the three neighborhood environments respectively. Higher score demonstrated that a respondent had better perception of the neighborhood. Diunduh dari: http://www.ispub.com/journal/the-internet-journal-of-public-health/volume-2-number1/perception-of-neighborhood-environments-and-self-rated-health-in-hong-kong.html………….. 24/8/2012 Likert Scale Dr. Rensis Likert The original idea for the likert scale is found in Rensis Likert’s 1932 article in Archive of psychology titled “ A technique for the measurement of Attitudes”. This idea was expanded by Likert’s 1934 Journal of social psychology article titled “ A simple and Reliable method of scoring the Thurstone Attitude Scales”. A Likert scale ( /ˈlɪkərt/) is a psychometric scale commonly involved in research that employs questionnaires. It is the most widely used approach to scaling responses in survey research, such that the term is often used interchangeably with rating scale, or more accurately the Likert-type scale, even though the two are not synonymous. The scale is named after its inventor, psychologist Rensis Likert. Likert distinguished between a scale proper, which emerges from collective responses to a set of items (usually eight or more), and the format in which responses are scored along a range. Technically speaking, a Likert scale refers only to the former. The difference between these two concepts has to do with the distinction Likert made between the underlying phenomenon being investigated and the means of capturing variation that points to the underlying phenomenon. When responding to a Likert questionnaire item, respondents specify their level of agreement or disagreement on a symmetric agree-disagree scale for a series of statements. Thus, the range captures the intensity of their feelings for a given item, while the results of analysis of multiple items (if the items are developed appropriately) reveals a pattern that has scaled properties of the kind Likert identified. Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale Diunduh dari: ………….. 23/8/2012 What is Likert scale? • • • • • It is a psychometric scale commonly involved in research that employs questionnaires. It is the most widely used approach to scaling responses in survey research. Likert scales are a non-comparative scaling technique and are one-dimensional in nature. When responding to a Likert questionnaire item respondents specify their level of agreement or disagreement on a symmetric agree-disagree scale for a series of statements. Thus, the range captures the intensity of their feelings for a given item, while the results of analysis of multiple items reveals a pattern that has scaled properties of the kind Likert identities SKALA LIKERT 1. 2. 3. Paling banyak digunakan untuk pengukuran perilaku Skala yang terdiri dari pernyataan dan disertai jawaban setuju-tidak setuju, sering-tidak pernah, cepat-lambat, baik-buruk dsb. (tergantung dari tujuan pengukuran). C. Bird menyebutnya Method of Sumated Ratings SKALA LIKERT DIGUNAKAN PADA SAAT: 1. Menggambarkan posisi RELATIF individu dalam kelompoknya 2. Membandingkan skor subyek dengan kelompok normatifnya 3. Menyusun skala pengukuran yang sederhana dan mudah dibuat. Skala Likert 1. 2. 3. 4. Skala likert adalah skala yang mengukur sikap dengan menyatakan setuju atau ketidak setujuan terhadap subyek, obyek atau kejadian tertentu. Urutan untuk skala ini umumnya menggunakan lima angka penilaian yaitu (1). Sangat tidak setuju (2) setuju (3) Netral (tidak pasti) (4) Tidak setuju (5) Sangat Tidak Setuju. Urutan itu bisa dibalik. Alternatif angka bisa bervariasi dari 3 sampai dengan 9 Diunduh dari: http://www.google.co.id/search?q=varimax+rotation&num=10&hl=id&source=lnms&sa=X&ei=_pk1UPCBEMvLrQ f3y4GYBA&sqi=2&ved=0CAUQ_AUoAA&biw=1272&bih=506#hl=id&sclient=psyab&q=skala+likeret+ordinal&oq=skala+likeret+ordinal&gs_l=serp.3..0i13j0i13i30l3.39393.46279.0.47075.24.24.0 .0.0.15.1278.9326.0j2j7j8j2j1j2j1.23.0...0.0...1c.9oocxdIH4k&pbx=1&bav=on.2,or.r_gc.r_pw.r_qf.&fp=3322fb4802ff5da6&biw=1272&bih=531………….. 24/8/2012 Five – point Likert item Likert Scale Difference Likert item The Likert scale is a summative scaling technique developed by Rensis Likert in the 1930s. Likert scales are typically 5-point rating scales ranging from "Strongly Agree" through "Neither Agree nor Disagree" to "Strongly Disagree." An extensive list of possible statements regarding attitudes to particular research question is generated by researchers and the respondent indicates the extent to which he/she agrees with the statement. Likert scale Disadvantages : 1) Likert scaling is quite tricky to get right. The researcher must be able to prove that each item of the questionnaire has a similar psychological 'weight' in the respondent's mind, and that each item is making a statement about the same construct. psychometric validation. If this is not accomplished the results of the scale will be unreliable. 2) Likert scales tend to produce "ceiling effects", where a group may rate items close to the upper limit of the scale Diunduh dari: ………….. 23/8/2012 LIKERT ITEM Likert item is considered symmetric or balanced because there are equal amounts of positive and negative positions. Often five ordered response levels are used, although many psychometricians advocate using seven or nine level, a recent empirical study found that a 5 or 7 point scale. Stems and Scales A familiar method for assessing attitudes is the Likert item. A Likert item consists of two parts: a stem, which is simply a statement of an attitude, and a scale on which people express their agreement with that statement. For example: 1. Stem: I believe that capital punishment is cruel. 2. Scale: Disagree strongly Disagree somewhat Can't say Agree somewhat Agree strongly A five-point scale of agreement, like the one above, is probably most common, but longer or shorter scales can be used. Shorter scales are more difficult to get useful information from, though. Likert items are easy to use and they can give you useful information. A single item, however, will rarely give you any useful information, so you are best to use sets of them. Ideally you would use 40 items or more, but useful information can be got with fewer. A single item rarely provides useful information simply because responses to it are affected by many factors in addition to the one you're interested in. When several items are used, the consistency of responding produced by an attitude can be detected. Diunduh dari: http://www.actualanalysis.com/likert.htm ………….. 24/8/2012 The format of a typical five-level Likert item 1. Strongly disagree 2. Disagree 3. Neither agree nor disagree 4. Agree 5. Strongly agree Sample question presented using a five-point Likert item An important distinction must be made between a Likert scale and a Likert item. The Likert scale is the sum of responses on several Likert items. Because Likert items are often accompanied by a visual analog scale (e.g., a horizontal line, on which a subject indicates his or her response by circling or checking tick-marks), the items are sometimes called scales themselves. This is the source of much confusion; it is better, therefore, to reserve the term Likert scale to apply to the summed scale, and Likert item to refer to an individual item. A Likert item is simply a statement which the respondent is asked to evaluate according to any kind of subjective or objective criteria; generally the level of agreement or disagreement is measured. It is considered symmetric or "balanced" because there are equal amounts of positive and negative positions. Often five ordered response levels are used, although many psychometricians advocate using seven or nine levels; a recent empirical study found that a 5- or 7- point scale may produce slightly higher mean scores relative to the highest possible attainable score, compared to those produced from a 10-point scale, and this difference was statistically significant. In terms of the other data characteristics, there was very little difference among the scale formats in terms of variation about the mean, skewness or kurtosis. Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale The format of a typical five-level Likert item, for example, could be: 1. Strongly disagree 2. Disagree 3. Neither agree nor disagree 4. Agree 5. Strongly agree CONTOH: Q.18.Please measure the following affirmative perceptions about your library OPAC and Web OPAC use . Codes: 1-strongly disagree, 2- disagree, 3- neutral, 4-agree, 5- strongly agree S/N Affirmative perception statements Codes (i) OPAC / Web OPAC was Easier to use 1 than I expected 2 3 4 5 (ii) It was Fun to use 1 2 3 4 5 (iii) It was Easy to use 1 2 3 4 5 (iv) It helped me in finding the documents faster 1 2 3 4 5 (v) It is Very difficult to use 1 2 3 4 5 (vi) It is Very confusing to use 1 2 3 4 5 (vii) I found more items than expected 1 2 3 4 5 (viii) I am comfortable with simple search 1 2 3 4 5 (ix) I am comfortable complex/Advance search I am comfortable quick search 1 2 3 4 5 1 2 3 4 5 I am comfortable when using OPAC/Web OPAC 1 2 3 4 5 (x) (xi) Q.19. Please mark your appreciation towards the use of your library OPAC/Web OPAC. Codes: 1-strongly disagree, 2- disagree, 3- neutral, 4-agree, 5- strongly agree S/N Parameters Codes (i) I access OPAC/Web OPAC stand alone system 1 2 3 4 5 (ii) I access OPAC/Web OPAC library premises 1 2 3 4 5 (iii) It is easy to be familiar with this OPAC/Web OPAC 1 2 3 4 5 (iv) The OPAC/Web OPAC should have more flexible interfaces 1 2 3 4 5 (v) Library searching will be easier and faster with the Web OPAC 1 2 3 4 5 (vi) It is easy to read information provided in the Web OPAC 1 2 3 4 5 A OPAC/Web OPAC search by author is easy (viii) A OPAC/ Web OPAC search by call number is easy 1 2 3 4 5 1 2 3 4 5 (ix) OPAC/ Web OPAC scanning through a long display (forward or backward) is easy 1 2 3 4 5 (x) OPAC/ Web OPAC reducing the result when too much is retrieved is easy 1 2 3 4 5 (vii) Diunduh dari: ………….. 23/8/2012 Diunduh dari: ………….. 23/8/2012 The format of a typical Seven-level Likert item INTERPRETASI SKOR SKALA LIKERT 1. 2. Tidak dapat dilakukan secara langsung Harus dibandingkan dengan skor kelompok normatifnya Diunduh dari: ………….. 23/8/2012 Diunduh dari: ………….. 23/8/2012 TAHAPAN PENYUSUNAN SEKALA LIKERT TAHAPAN PENYUSUNAN (1) 1. Menentukan dan memahami dengan baik apa yang akan diukur 2. Menyusun Blue Print untuk memandu penyusunan alat ukur 3. Indikator yang secara teoritis-logis memberi kontribusi yang lebih besar harus diberikan pernyataan yang lebih banyak 4. Pernyataan dibuat Favorable dan Unfavorable. TAHAPAN PENYUSUNAN (2) 1. 2. 3. 4. 5. Membuat Item sesuai dengan kaidah Uji coba item Memilih item yang baik Menyusun item terpilih menjadi satu set alat ukur Menginterpretasikan hasil pengukuran. MEMILIH PERNYATAAN (1) 1. Memilih dengan nilai t, dengan langkah: Menghitung dan menjumlahkan skor tiap subyek Mengelompokkan subyek menjadi dua. Menggunakan mean atau median jika subyek sedikit, dan menggunakan percentil 25 - 75 atau 30 - 70 apabila subyek banyak MEMILIH PERNYATAAN (2) Menghitung nilai t dengan rumus: Diunduh dari: ………….. 23/8/2012 TAHAPAN PENYUSUNAN SEKALA LIKERT MEMILIH PERNYATAAN (3) 1. Pilihlah 20 – 25 item dengan nilai t yang tinggi dan semua indikator harus terwakili oleh item Favorable dan Unfovorable 2. Nilai minimal t yang baik adalah 1,75. MEMILIH PERNYATAAN (4) 1. Memilih dengan nilai r (korelasi), dengan langkah: Menghitung dan menjumlahkan skor tiap subyek Mengkorelasikan skor tiap-tiap item dengan skor total yang diperoleh setiap subyek. MEMILIH PERNYATAAN (5) 1. Nilai r hitung dibandingkan dengan r tabel. Pilihlah item yang r hitungnya positif dan lebih besar dari r tabel 2. Biasanya dapat juga menggunakan patokan r minimal 0,3 3. Buang item yang r hitungnya kurang dari r tabel atau kurang dari 0,3 dan hitung kembali korelasinya hingga r hitung semua item lebih dari r tabel atau lebih dari 0,3 4. Pilihlah 20 – 25 item dengan nilai r yang tinggi dan semua indikator harus terwakili oleh item Favorable dan Unfovorable. MENYUSUN PERNYATAAN MENJADI SATU SET SKALA Penyusunan item terpilih dalam satu set skala harus acak berdasarkan indikator maupun item Favorable dan Unfavorable. Diunduh dari: ………….. 23/8/2012 METODE ANALISIS Depending on how the Likert scale questions are treated a number of different analysis methods can be applied 1. Analysis methods used for individual questions (ordinal data) Bar charts and dot plots • Not histograms (data is not continuous) Central tendency summarised by median and mode • Not mean Variability summarised by range and interquartile range • Not standard deviation Analysed using non-parametric tests (difference between the medians of comparable groups) • Mann- whitney U test • Wilcoxon signed –rank test • Kruskal – wallis test Diunduh dari: ………….. 23/8/2012 METODE ANALISIS 2. When multiple Likert question responses are summed together (interval data) All questions must use the same Likert scale Must be a defendable approximation to an interval scale (i.e. coding indicates magnitude of difference between items but there is no absolute zero point) All items measure are single latent variable (i.e. a variable that is not directly observed, but rather inferred from other variables that are observed and directly measured) Analyzed using parametric tests • Analysis of variance (ANOVA) Kegunaan dan Asumsi 1. 2. One Way ANOVA digunakan untuk menguji perbedaan rata-rata lebih dari dua sampel. Asumsi-asumsi One Way ANOVA: • Populasi yang akan diuji berdistribusi normal. • Varians dari populasi-populasi tersebut adalah sama. • Sampel tidak berhubungan satu dengan yang lain. Analysis of Variance (ANOVA) Desain Blok Lengkap Acak ANOVA 1 Arah Desain 2 Faktor Dgn. Replikasi Uji-F Uji-F Uji TukeyKramer Uji Perbedaan Signifikan Fischer Terkecil Diunduh dari: openstorage.gunadarma.ac.id/handouts/S1.../SLIDE-PE-1.ppt ………….. 24/8/2012 METODE ANALISIS 3. Analysis methods used when reduced to nominal level of agree vs. disagree Chi –square test Cochran Q test McNemar test Analisis Khi- Kuadrat Analisis chi-square yang akan digunakan untuk mencari apakah ada hubungan (asosiasi) antar variabel-variabel kategorik tersebut Analisis chi-square didasarkan pada tabel kontingensi (sering iuga disebut tabulasi silang). Tabel kontingensi adalah tabel yang sel-selnya berisi frekuensi dari perpotongan baris dan kolom. Bentuk umum dari tabel kontingensi dengan variabel pertama memiliki m kategori dan variabel ke dua memiliki k kategori , sebagai berikut. Tabel kontingensi dua arah: Diunduh dari: http://digensia.wordpress.com/2012/03/26/koefisien-korelasi-cramer-c/………….. 24/8/2012 KEUNTUNGAN SEKALA LIKERT 1. Item analysis increases the degree of homogeneity or internal consistency in the set of statements. 2. Subjects generally find it easy to respond because they have a wide range of answers(usually five) to choose from instead of only two alternative responses, i.e., agree or disagree. 3. No outside group of judges is involved in selecting statements and giving values to them. KETERBATASAN SEKALA LIKERT • • • • • Ties in ranks occur quite frequently. The response pattern of an individual is not revealed. A respondent is required to answer all questions on the scale. A problem of interpretation arises with this type of scale. In this scale all statements of a universe are deemed to be of equal attitude value. Diunduh dari: ………….. 23/8/2012 Likert Scales • • • • A very popular rating scale Measures the feelings/degree of agreement of the respondents Ideally, 4 to 7 points Examples of 5-point surveys – Agreement SD – Satisfaction SD – Quality VP D D P ND/NA ND/NS Average A S G SA SS VG A typical Likert scale looks like this: Diunduh dari: http://rmsbunkerblog.wordpress.com/2010/09/22/rms-scale-week-2010-likert-scale%E2%80%93-market-research-in-syracuse-ny-upstate-central-new-york-survey-focus-group/ ………….. 24/8/2012 Likert Scale The Likert scale requires the respondents to indicate a degree of agreement or disagreement with each of a series of statements about the stimulus objects. Strongly disagree 1. Sears sells high quality merchandise. 1 Neither agree nor disagree 2X 3 2. Sears has poor in-store service. 1 2X 3. I like to shop at Sears. 1 2 • • Disagree Agree Strongly agree 4 5 3 4 5 3X 4 5 The analysis can be conducted on an item-by-item basis (profile analysis), or a total (summated) score can be calculated. When arriving at a total score, the categories assigned to the negative statements by the respondents should be scored by reversing the scale. Using Attitudinal Data to Identify Latent Classes that Vary in Their Preference for Landscape Preservation Edward Morey, Mara Thiene, Maria De Salvo and Giovanni Signorello Forthcoming in Ecological Economics 2008 or 2009 The likelihood of significant heterogeneity in preferences for landscape preservation should be accounted for when designing WTP questions, estimating WTP, and formulating resulting policy recommendations. Herein, heterogeneity in preferences for landscape preservation is investigated in the context of a latent-class model under the assumption of the existence of some finite number of preference classes/groups. The number of classes is estimated, so few restrictions are placed on the form of the heterogeneity. One estimates the probability that individual i belongs to class c where these probabilities are a function of observable characteristics of the individual (covariates); this is much more flexible than assuming, for example, that all farmers have the same preferences. This paper aims to identify preference classes for landscape preservation in the IBLEO, a rural and beautiful part of Sicily. Estimation of classes is performed using only attitudinal data consisting of answers to Likert-scale questions about the importance of preservation and why the respondent thinks preservation is, or is not, important. Summarizing the results, estimation indicates four distinct preference classes. The classes vary in the level of importance attached to preservation and the motivation for preservation (e.g. use vs. nonuse motivations), and include one group that has little interest in preservation. Diunduh dari: http://www.colorado.edu/economics/morey/papers/MoreyThieneDeSalvoSignorelloEcolEconomics. pdf ………….. 25/8/2012 Likert Scales: Advantages (summated rating = real name) Rensis Likert, 1903–1981 • • • • • Easy for respondents to complete, most people familiar with the scale Relatively easy to construct Most popular attitudinal measure Easy to score and analyze Each item considered to be of equal attitude value (weight) -homogeneous items Karin Braunsberger, Roger Gates, (2009) Developing inventories for satisfaction and Likert scales in a service environment Journal of Services Marketing, Vol. 23 Iss: 4, pp.219 – 225. The purpose of this paper is to produce up-to-date inventories for satisfaction and Likert scales that contain commonly used scale point descriptors and their respective mean scale values and standard deviations. All data were collected online using the SSI Survey Spot Panel. This panel is national (USA) in scope. Thirty-nine satisfaction items and 19 agreement items were tested on a random sample consisting of individuals 21-65 years old. The mean value and the standard deviation were calculated for each of these descriptors. Even though only six of the items that had been tested by Jones and Thurstone (1955) were included in the list of satisfaction scale descriptors, the semantic meanings of those six have changed very little over the years. One limitation might be that scale point descriptor inventories developed within the context of health insurance might not be valid in other service contexts. Since the present study focuses on Likert and satisfaction scales which are frequently used in service environments, the major contribution of this study is to provide services marketers with quantitative measurement of the meanings of commonly used scale point descriptors. This permits the development of successive and/or equal interval scales and thus aids in the analyses of data sets. It will thus help service marketers to develop questionnaires that more accurately reflect actual consumer satisfaction and opinions. Diunduh dari: http://www.emeraldinsight.com/journals.htm?articleid=1800605………….. 24/8/2012 Likert Scale Construction • • • • • • • • Identify the attitudinal object and delimit it quite specifically. Compose a series of statements about the attitudinal object that are half positive and half negative and are not extreme, ambiguous, or neutral. Establish (a minimum of ) content validity with the help of an expert panel. Pilot test the statements to establish reliability (Cronbach’s alpha) for each domain. Eliminate statements that negatively affect internal consistency. Construct the final scale by using the fewest number of items while still maintaining validity and reliability; create a balance of positive and negative items [Remember to reverse-code when summing]. Administer the scale and instruct respondents to indicate their level of agreement with each statement. Sum each respondent’s item scores to determine attitude. Diunduh dari: ………….. 23/8/2012 Likert Scale Instrument Construction • • • • • • Use the general criteria for attitude statements. Begin with non-threatening, easy items first; demographics last. Have clear instructions with an example. Anticipate data entry and analysis. Anticipate missing data on items. Use approved layout techniques. Indoor air quality : perception versus reality in a rural hospital setting Goddard, Dianna Marie The objective of this study was to evaluate occupant perception of indoor air quality in a rural Arkansas hospital. Three generally accepted standard parameters of indoor air quality were examined---carbon dioxide levels, temperature, and relative humidity---for comparison to recommended standards of these values. A review of the literature revealed a lack of information in the subject of indoor air quality concerned with perception. Experimental data was obtained using two real-time monitoring instruments that logged work environment levels of carbon dioxide, carbon monoxide, relative humidity, and temperature. The results were tabulated and graphically formatted for ease of interpretation. In addition, an occupant survey containing a Likert scale was also used to determine the predictability of indoor air quality based on the individual responses from the surveys. Collectively, the data does not provide any conclusive evidence that occupant perception is a valid indicator of actual indoor air quality.Further investigation in this subject area of indoor air quality is needed. A better understanding of how air quality perception relates to actual indoor air quality will help to simplify the challenges that face air quality practitioners. Diunduh dari: http://sunzi.lib.hku.hk/ER/detail/hkul/4082419 ………….. 24/8/2012 Scaling of Statements Response scales vary. Recommend to use an even number of response categories (no neutral category) and a N/A response for agreement scales Label all response categories. Since this is a summated rating scale, the scale of measurement of the sum or mean is interval. Never analyze by item. Scale of measurement of any one item is ordinal. Anchored scales: frequency, importance, etc. (Odd # = OK) Pictures, thermometers, etc., may be used as scales Multiple scales per item may be used. Greater range in the scales produce more variability in the data: 8 better than 6, 6 better than 4, etc. (Correlations work better.) Likert scales may be subject to distortion from several causes. Respondents may avoid using extreme response categories (central tendency bias); agree with statements as presented (acquiescence bias); or try to portray themselves or their organization in a more favorable light (social desirability bias). Designing a scale with balanced keying (an equal number of positive and negative statements) can obviate the problem of acquiescence bias, since acquiescence on positively keyed items will balance acquiescence on negatively keyed items, but central tendency and social desirability are somewhat more problematic. Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale Diunduh dari: ………….. 23/8/2012 Likert Scaling • • • • Even Number of Response Categories Label all categories Use N/A if appropriate [No neutral/undecided] Frequency, Importance, etc. [Anchored] 1 2 3 4 5 6 Strongly Disagree Disagre e Slightly Disagre e Slightly Agree Agree Strongly Agree Costa Rica is a good location for the AIAEE conference. 1 2 3 4 Strongly Disagree Disagree Agree Strongly Agree Costa Rica is a good location for the AIAEE conference. Likert scaling is a bipolar scaling method, measuring either positive or negative response to a statement. Sometimes an even-point scale is used, where the middle option of "Neither agree nor disagree" is not available. This is sometimes called a "forced choice" method, since the neutral option is removed. The neutral option can be seen as an easy option to take when a respondent is unsure, and so whether it is a true neutral option is questionable. It has been shown that when comparing between a 4-point and a 5-point Likert scale, where the former has the neutral option unavailable, the overall difference in the response is negligible. Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale Diunduh dari: ………….. 23/8/2012 Summative Ratings • • A number of items collectively measure one construct (Job Satisfaction) A number of items collectively measure a dimension of a construct and a collection of dimensions will measure the construct (Self-esteem) Community Perceptions toward Economic and Environmental Impacts of Tourism on Local Communities Fariborz Aref , Ma’rof Redzuan and Sarjit S. Gill Asian Social Science. July, 2009. Vol. 5, No. 7 This paper investigates the community perceptions toward economic and environmental impacts of tourism in Shiraz, Iran. Special focus is on the differences in perceptions between the Old and New Districts of Shiraz. The study demonstrates that there are broadly similar views among the community leaders and community residents from both districts of Shiraz. In fact, a high percentage of the answers obtained highlighted positive aspects environmental and economic impacts of tourism toward local communities. According to the survey, the strongest and favourable perceptions toward tourism impacts are found to be linked with environmental aspects and while economic matters are found to be the least favourable in terms of the perceived impacts on tourism. T-test analysis of the study indicates that there is no significant difference between community leaders' perceptions in both districts of Shiraz City. Results drew from discussion with the target group show that the community residents have positive perceptions toward economic and environmental impacts of tourism with only minor differences with each other. The questionnaire was structured around a Likert scale. The items for community perceptions toward tourism impacts were taken from these studies. The respondents answered to each statement based on five scales. The value of each response for these items on the questionnaire is as follows: 1 = strongly disagree 2 = disagree 3 = not sure 4 = agree 5 = strongly agree. Ko & Stewart (2002) and Maddox (1985), recommended the use of a Likert type scale in tourism research due to its high validity. Then, the questionnaire was piloted tested to have its content validated by several reviewers of Persian background. Statements for tourism impacts were tested for their validity using Cronbach’s alpha. The participants in the pilot test had relatively diverse demographic characteristics, especially with regards to community. The t-test was employed to test to determine whether there were significant differences among group mean totals and item mean scores. Means and standard deviations are the descriptive statistics used in discussing the distribution of responses gathered during the quantitative component of this study. To assess the normality of the distribution of the data, the skewness and kurtosis of each variable were also examined. According to George & Mallery (2002) if the coefficient of the skewness and kurtosis falls between -0.5 and +0.5 inclusive, then the distribution appears to be relatively symmetric which in this study skewness was .254 and Kurtosis -.211. Diunduh dari: journal.ccsenet.org/index.php/ass/.../2746………….. 24/8/2012 Summative Likert Scales • • • • • Must contain multiple items Each individual item must measure something that has an underlying, quantitative measurement continuum There can be no right/wrong answers as opposed to multiple-choice questions Items must be statements to which the respondent assigns a rating Cannot be used to measure knowledge or ability, but familiarity J Air Waste Manag Assoc. 2000 Jul ;50 (7):1081-94. Exposure of chronic obstructive pulmonary disease patients to particulate matter: relationships between personal and ambient air concentrations. S. T. Ebelt, A J Petkau, S Vedal, T V Fisher, M Brauer. Mot time-series studies of particulate air pollution and acute health outcomes assess exposure of the study population using fixed-site outdoor measurements. To address the issue of exposure misclassification, we evaluate the relationship between ambient particle concentrations and personal exposures of a population expected to be at risk of particle health effects. Sampling was conducted within the Vancouver metropolitan area during April-September 1998. Sixteen subjects (non-smoking, ages 54-86) with physician-diagnosed chronic obstructive pulmonary disease (COPD) wore personal PM2.5 monitors for seven 24-hr periods, randomly spaced approximately 1.5 weeks apart. Time-activity logs and dwelling characteristics data were also obtained for each subject. Daily 24-hr ambient PM10 and PM2.5 concentrations were measured at five fixed sites spaced throughout the study region. SO4(2-), which is found almost exclusively in the fine particle fraction and which does not have major indoor sources, was measured in all PM2.5 samples as an indicator of accumulation mode particulate matter of ambient origin. The mean personal and ambient PM2.5 concentrations were 18 micrograms/m3 and 11 micrograms/m3, respectively. In analyses relating personal and ambient measurements, ambient concentrations were expressed either as an average of the values obtained from five ambient monitoring sites for each day of personal sampling, or as the concentration obtained at the ambient site closest to each subject's home. The mean personal to ambient concentration ratio of all samples was 1.75 (range = 0.24 to 10.60) for PM2.5, and 0.75 (range = 0.09 to 1.42) for SO4(2-). Regression analyses were conducted for each subject separately and on pooled data. The median correlation (Pearson's r) between personal and average ambient PM2.5 concentrations was 0.48 (range =0.68 to 0.83). Using SO4(2-) as the exposure metric, the median r between personal and average ambient concentrations was 0.96 (range = 0.66 to 1.0). Use of the closest ambient site did not improve the median correlation of the group for either PM2.5 or SO4(2-). All pooled analyses resulted in lower correlation coefficients than the median correlation coefficient of individual regressions. Personal SO4(2-) was more highly correlated with all ambient measures than PM2.5. Inclusion of time-activity and dwelling characteristics data did not result in a useful predictive regression model for PM2.5 personal exposure, but improved the model fit from simply regressing against ambient concentration (R2 = 0.27). The model for SO4(2-) was predictive (R2 = 0.82), as personal exposures were largely explained by ambient levels. These results indicate a relatively low correlation between personal exposure and ambient PM2.5 that is not improved by assigning exposure to the closest ambient monitor. The correlation between personal exposure and ambient concentration is high, however, when using SO4(2-), an indicator of accumulation mode particulate matter of ambient origin. Diunduh dari: http://lib.bioinfo.pl/paper:10939202 ………….. 24/8/2012 SCALE CONSTRUCTION • Define Constructs – Conceptual/theoretical basis from the literature – Are their sub-scales (dimensions) to the scale – Multiple item sub-scales – Principle of Parsimony (kesederhanaan, kehematan) • Simplest explanation among a number of equally valid explanations must be used. DATA VARIABEL LATENT (KONSTRUK) Penelitian di bidang ekoilogi-ekonomi dan sering melibatkan variabel yang tidak dapat diukur secara langsung, disebut variabel latent atau unobservable; misalnya kepuasan, motivasi dan lainnya. Pengukuran variabel laten menggunakan instrumen berupa kuisioner akan menghasilkan data dari setiap indikator atau data dari setiap item. Oleh karena itu, indikator atau item sering disamakan dengan variabel manifest atau variabel observable. Untuk memperoleh data dari variabel latent atau variabel unobservable dapat dilakukan dengan beberapa cara, antara lain: 1. Metode Total Skor 2. Metode Rata-Rata Skor 3. Metode Rescoring 4. Metode Indikator Terkuat 5. Metode Skor Faktor 6. Metode Skor Komponen Utama Metode pertama berarti menjumlahkan skor semua indikator, shingga diperoleh data total skor yang merupakan data variabel laten bersangkutan. Sedangkan metode kedua menggunakan rata-rata skor indikator. Sebagai ilustrasi digunakan data rekaan di bawah ini (menggunakan skala Likert 1 sampai 5). Diunduh dari: http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html………….. DATA VARIABEL LATENT (KONSTRUK) Metode Rescoring Metode ini merubah total skor menjadi skala awal (1 sampai 5). Caranya adalah, untuk data di atas, sebagai berikut: - Nilai minimal skor total yang mungkin adalah 3 - Nilai maksimal skor total yang mungkin adalah 15 - Range = 15 – 3 = 12 - Interval kelas (banyaknya skor awal, 1 sampai 5) adalah 5 - Lebar interval kelas = 12/5 = 2.4 Rescoring bernilai 1 jika nilai skor total antara 3 sampai (3 + 2.4) = 5.4 Rescoring bernilai 2 jika nilai skor total antara >5.4 sampai (5.4 + 2.4) = 7.8 Rescoring bernilai 3 jika nilai skor total antara >7.8 sampai 10.2 Rescoring bernilai 4 jika nilai skor total antara >10.2 sampai 12.6 Rescoring bernilai 5 jika nilai skor total antara >12.6 sampai 15 Untuk observasi pertama, nilai skor total adalah 7, di mana 7 berada pada selang rescoring 2, yaitu >5.4 sampai 7.8. Demikian seterusnya. Ketiga metode ini bersifat setiap indikator dipandang memiliki bobot yang sama, dan informasi 100% terpakai atau tercakup dalam variabel latent. Diunduh dari: http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html………….. METODE INDIKATOR TERKUAT Metode Indikator Terkuat ini menggunakan indikator terkuat. Indikator terkuat diperoleh dari hasil korelasi antar masing-masing indikator dengan total skor. Indikator yang memiliki korelasi terbesar dipandang sebagai indikator terkuat dan digunakan untuk mewakili variabel latent. Nilai korelasi antara setiap indikator dengan total skor: Dari hasil analisis tersebut diperoleh nilai korelasi antara indikator 1 dengan skor total adalah 0.625, indikator 2 dengan skor total adalah 0.832 dan indikator 3 dengan skor total adalah 0.790. Indikator yang memiliki korelasi tertinggi adalah indikator 2 (0.832), sehingga variabel latent yang digunakan menggunakan skor indikator 2. Diunduh dari: http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html………….. METODE SKOR FAKTOR & METODE SKOR KOMPONEN UTAMA Kedua Metode ini menggunakan analisis faktor dan analisis komponen utama. Metode ini menghasilkan skor faktor dan skor komponen utama, yang dijadikan sebagai data untuk variabel latent. Kedua metode ini berbeda dengan ketiga metode pertama yaitu bobot masing-masing indikator adalah berbeda, dan tidak 100% informasi terpakai atau tercakup. Kedua metode terakhir ini akan dijelaskan pada sub bab tersendiri pada bab ini. Perbedaan masing-masing metode dapat dilihat dari gambar berikut: Pada kedua gambar tampak terlihat perbedaan terletak bagaimana arah hubungan antara variabel laten dengan indikator. Pada analisis faktor, masing-masing variabel indikator adalah fungsi dari variabel latent, sedangkan pada analisis komponen utama, variabel latent adalah fungsi dari seluruh variabel indikator. Konstruk dengan analisis faktor menganggap bahwa variabel latent adalah refleksi dari sejumlah indikator, sedangkan konstruk dengan analisis komponen utama menganggap bahwa variabel latent dibentuk (formasi) dari sejumlah indikator. Oleh karena itu, pembentukan variabel latent menggunakan analisis faktor dinamakan bentuk reflektif, sedangkan pembentukan variabel latent menggunakan analisis komponen utama dinamakan bentuk formatif. Diunduh dari: http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html………….. ITEM CONSTRUCTION • Agreement items – Write declarative statements • Death penalty should be abolished • I like to listen to classical music – Frequency items (how often) • I like to read – Evaluation items • How well did your team play • How well does the police serve your community Prosedur dalam membuat skala Likert adalah sebagai berikut: 1. Peneliti mengumpulkan bahan-bahan yang relevant dengan masalah yang sedang diteliti 2. Menyusun Blue Print untuk memandu penyusunan alat ukur 3. Membuat item-item yang akan diuji sesuai dengan panduanUji coba item kepada sekelompok responden yang cukup representatif dari populasi yang ingin diteliti. Responden di atas diminta untuk mengecek tiap item, apakah ia menyenangi (+) atau tidak menyukainya (-). Respons tersebut dikumpulkan dan jawaban yang memberikan indikasi menyenangi diberi skor tertinggi. Tidak ada masalah untuk memberikan angka 5 untuk yang tertinggi dan skor 1 untuk yang terendah atau sebaliknya. Yang penting adalah konsistensi dari arah sikap yang diperlihatkan. Demikian juga apakah jawaban “setuju” atau “tidak setuju” disebut yang disenangi, tergantung dari isi pertanyaan dan isi dari item-item yang disusun. 4. Setelah item di uji coba kepada responden, lalu diuji tingkat validitas dan reabilitas dari item-item tersebut. Validitas adalah suatu ukuran yang menunjukkan tingkatan kevalidan atau kesa hihan suatu instrumen sedangkan reliabilitas merupakan penilaian tingkat konsistensi terhadap hasil pengukuran bila dilakukan multiple measurement pada sebuah variabel suatu alat ukur dikatakan reliabel jika alat ukur tidak berubah. Diunduh dari: http://kiptykipty.wordpress.com/2010/06/05/skala-likert-dalam-teknik-evaluasiperencanaan/ ………….. 25/8/2012 PENULISAN ITEM • • • • • • Mutually exclusive and collectively exhaustive items Use positively and negatively phrased questions Avoid colloquialism, expressions and jargon Avoid the use of negatives to reverse the wording of an item – Don’t use: I am not satisfied with my job – Use: I hate my job! Be brief, focused, and clear Use simple, unbiased questions Instrumen atau alat pengumpul data adalah alat yang digunakan untuk mengumpulkan data dalam suatu penelitian. Data yang terkumpul dengan menggunakan instrumen tertentu akan dideskripsikan dan dilampirkan atau digunakan untuk menguji hipotesis yang diajukan dalam suatu penelitian. Alur Penyusunan dan Pengembangan Instrumen: Variabel Teori Berdasarkan sintesis dari teori-teori yang dikaji tentang suatu konsep dari variabel yang hendak diukur, kemudian dirumuskan konstruk dari variabel tersebut. Konstruk Konstruk pada dasarnya adalah bangun pengertian dari suatu konsep yang dirumuskan oleh peneliti. Definisi Konseptual Definisi Operasional Penetapan Jenis Instrumen Menyusun Butir Ada beberapa jenis instrumen yang biasa digunakan dalam penelitian, antara lain kuesioner, skala (skala sikap atau skala penilaian), tes, dan lain-lain. Kuesioner adalah alat pengumpul data yang berbentuk pertanyaan yang akan diisi atau dijawab oleh responden. Beberapa alasan digunakannya kuesioner adalah : 1. kuesioner terutama dipakai untuk mengukur variabel yang bersifat faktual, 2. untuk memperoleh informasi yang relevan dengan tujuan penelitian, dan 3. Untuk memperoleh informasi dengan validitas dan reliabilitas setinggi mungkin. Sumber:Instrumen Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002 Diunduh dari: https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/ PENULISAN ITEM (BUTIR –BUTIR TES) Tipe Pilihan Ganda 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Item hendaklah menanyakan hal yang penting untuk diketahui. Tulislah item yang berisi pernyataan pasti. Utamakan item yang mengandung pernyataan umum yang bertahan lama. Buatlah item yang berisi hanya satu gagasan saja. Buatlah item yang menyatakan inti pertanyaan dengan jelas. kalimat sederhana dan tidak berlebih-lebihan. Sebaiknya item tidak didasari oleh pernyataan negatif. Gunakan bahasa yang jelas, kata yang sederhana, dan pernyataan yang langsung. Item harus memberikan alternatif bagi isi pernyataan yang paling penting. Berikan alternatif jawaban yang jelas berbeda. Alternatif yang ditawarkan hendaknya mempunyai struktur dan arti yang sejajar atau dalam satu kategori. Penggunaan alternatif yang semata-mata meniadakan atau bertentangan dengan alternatif yang lain, haruslah dihindari. Bilamana mungkin, susunlah alternatif jawaban dalam urutan besarnya atau urutan logisnya. Penggunaan alternatif “bukan salah-satu di atas” atau “semua yang di atas” hanya baik apabila kebenaran bersifat mutlak dan bukan semata-mata masalah lebih dan kurang baik atau masalah kebenaran relatif. Jangan menjebak siswa dengan menanyakan hal yang tidak ada jawabannya. Hindari penggunaan kata-kata yang dapat dijadikan petunjuk oleh siswa dalam menjawab. Tipe Benar-Salah Kaidah atau petunjuk penulisan item tipe benar–salah telah dikemukakan oleh Ebel (1979) sebagaimana berikut ini. 1. 2. 3. 4. 5. Item haruslah mengungkap ide atau gagasan yang penting. Item tipe benar-salah hendaknya menguji pemahaman, mengungkap ingatan mengenai suatu fakta atau hafalan. Kebenaran atau ketidakbenaran suatu item haruslah bersifat mutlak. Item harus menguji pengetahuan yang spesifik dan jawabannya tidak jelas bagi semua orang, kecuali bagi mereka yang menguasai pelajaran. Item harus dinyatakan secara jelas. Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002 Diunduh dari: https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/ PENULISAN ITEM (BUTIR –BUTIR TES) Tipe Jawaban Pendek 1. 2. 3. 4. 5. Pernyataan atau pertanyaan item harus ditulis dengan hati-hati sehingga dapat dijawab dengan hanya satu jawaban yang pasti. Sebaiknya rumuskan jawabannya lebih dahulu baru kemudian menulis pertanyaannya. Gunakan pertanyaan langsung, kecuali bilamana model kalimat tak selesai akan memungkinkan jawaban yang lebih jelas. Usahakan agar dalam pertanyaan tidak terdapat petunjuk yang mungkin digunakan oleh subjek dalam menjawab item. Jangan menggunakan kata atau kalimat yang langsung dikutip dari buku. Tipe Karangan (Esai) 1. 2. 3. 4. Berikan pertanyaan atau tugas yang mengarahkan penjawab pertanyaan (siswa) agar dapat menunjukkan penguasaan pengetahuan yang penting. Buatlah pertanyaan yang arah jawabannya jelas, sehingga para ahli dapat setuju bahwa satu jawaban akan lebih baik daripada yang lainnya. Jangan menanyakan sikap atau pendapat. Sebaiknya pertanyaan diawali oleh kata-kata seperti, “Bandingkan …”, “Berikan alasan …”, “Jelaskan mengapa …”, “Beri contoh …”, dan semacamnya. Tipe Pasangan 1. 2. 3. 4. 5. Premis dan respons hendaknya dibuat dalam jumlah yang tidak sama. Baik premis maupun respons haruslah berisi hal yang homogen, yaitu dari sejenis kategori isi. Usahakan agar premis dan responsnya berisi kalimat-kalimat atau kata yang pendek. Buatlah petunjuk pemasangan yang jelas, sehingga penjawab soal atau pertanyaan mengetahui dasar apakah yang harus digunakan dalam memasangkan premis dan responsnya. Sedapat mungkin susunlah premis dan respons masing-masing secara alfabetik atau menurut besaran kuantitatifnya. Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002 Diunduh dari: https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/ PENULISAN ITEM UNTUK SKALA LIKERT Untuk menulis pernyataan sikap yang bermutu, penyusun skala harus menuruti suatu kaidah atau pedoman penulisan pernyataan agar ciri-ciri pernyataan sikap tidak terlupakan dan agar setiap pernyataan mempunyai kemampuan membedakan antara kelompok responden yang setuju dengan kelompok responden yang tidak setuju terhadap objek sikap. Beberapa petunjuk untuk menyusun skala Likert di antaranya : 1. Tentukan objek yang dituju, kemudian tetapkan variabel yang akan diukur dengan skala tersebut. 2. Lakukan analisis variabel tersebut menjadi beberapa sub variabel atau dimensi variabel, lalu kembangkan indikator setiap dimensi tersebut. 3. Dari setiap indikator di atas, tentukan ruang lingkup pernyataan sikap yang berkenaan dengan aspek kognisi, afeksi, dan konasi terhadap objek sikap. 4. Susunlah pernyataan untuk masing-masing aspek tersebut dalam dua kategori, yakni pernyataan positif dan pernyataan negatif, secara seimbang banyaknya. Edwards (1957) meramu berbagai saran dan petunjuk dari para ahli menjadi suatu pedoman atau kriteria penulisan pernyataan sikap. Beberapa kriteria yang dimaksud adalah sebagai berikut. 1. Jangan menulis pernyataan yang membicarakan mengenai kejadian yang telah lewat kecuali kalau objek sikapnya berkaitan dengan masa lalu. 2. Jangan menulis pernyataan yang berupa fakta atau dapat ditafsirkan sebagai fakta. 3. Jangan menulis pernyataan yang dapat menimbulkan lebih dari satu penfsiran. 4. Jangan menulis pernyataan yang tidak relevan dengan objek psikologisnya. 5. Jangan menulis pernyataan yang sangat besar kemungkinannya akan disetujui oleh hampir semua orang atau bahkan hampir tak seorang pun yang akan menyetujuinya. 6. Pilihlah pernyataan-pernyataan yang diperkirakan akan mencakup keseluruhan liputan skala afektif yang diinginkan. 7. Usahakan agar setiap pernyataan ditulis dalam bahasa yang sederhana, jelas, dan langsung. Jangan menuliskan pernyataan dengan menggunakan kalimat- kalimat yang rumit. 8. Setiap pernyataan hendaknya ditulis ringkas dengan menghindari kata-kata yang tidak diperlukan dan yang tidak akan memperjelas isi pernyataan. 9. Setiap pernyataan harus berisi hanya satu ide (gagasan) yang lengkap. 10. Pernyataan yang berisi unsur universal seperti “tidak pernah”, “semuanya”, “selalu”, “tak seorang pun”, dan semacamnya, seringkali menimbulkan penafsiran yang berbeda-beda dan karenanya sedapat mungkin hendaklah dihindari. 11. Kata-kata seperti “hanya”, “sekedar”, “semata-mata”, dan semacamnya harus digunakan seperlunya untuk menghindari kesalahan penafsiran isi pernyataan. 12. Jangan menggunakan kata atau istilah yang mungkin tidak dapat dimengerti oleh para responden. 13. Hindarilah pernyataan yang berisi kata negatif ganda. Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002 Diunduh dari: https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/ PENULISAN BUTIR UNTUK KUESIONER Cara menyusun kuesioner beserta butir-butir yang tercantum di dalamnya haruslah tetap mengacu pada pedoman penyusunan instrumen secara umum, sehingga berlaku pula langkah-langkah sebagaimana telah dijelaskan di bagian terdahulu. Dimulai dengan analisis variabel, pembuatan kisi-kisi, dan kemudian sampai pada penyusunan pertanyaan untuk kuesioner. Secara lebih teknis, petunjuk untuk membuat kuesioner adalah sebagai berikut. 1. Mulai dengan pengantar yang isinya berupa permohonan mengisi kuesioner sambil menjelaskan maksud dan tujuannya. 2. Jelaskan petunjuk atau cara mengisinya supaya tidak salah. berikan contoh pengisiannya. 3. Mulai dengan pertanyaan untuk mengungkapkan identitas responden. Dalam identitas ini sebaiknya tidak diminta mengisi nama. Identitas cukup mengungkapkan jenis kelamin, usia, pendidikan, pekerjaan, pengalaman, dan lain-lain yang ada kaitannya dengan tujuan kuesioner. 4. Isi pertanyaan sebaiknya dibuat beberapa kategori atau bagian sesuai dengan variabel yang diungkapkan, sehingga mudah mengolahnya. 5. Rumusan pertanyaan dibuat singkat, tetapi membingungkan dan menimbulkan salah penafsiran. 6. Hubungan antara pertanyaan yang satu dengan pertanyaan lainnya harus dijaga sehingga tampak keterkaitan logikanya dalam satu rangkaian yang sistematis. Hindari penggolongan pertanyaan terhadap indikator atau persoalan yang sama. 7. Usahakan agar jawaban, yakni kalimat atau rumusannya tidak lebih panjang daripada pertanyaan. 8. Kuesioner yang terlalu banyak atau terlalu panjang akan melelahkan dan membosankan responden sehingga pengisiannya tidak objektif lagi. 9. Ada baiknya kuesioner diakhiri dengan tanda tangan si pengisi untuk menjamin keabsahan jawabannya. 10. Untuk melihat validitas jawaban kuesioner, ada baiknya kuesioner diberikan kepada beberapa responden secara acak dan dilakukan wawancara dengan pertanyaan yang identik dengan isi kuesioner yang telah diisinya. Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002 Diunduh dari: https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/ SUMBER KESALAHAN • Social desirability – Giving politically correct answers • Response sets – All yes, or all no responses • Acquiescence – Telling you what you want to hear • Personal bias – Wants to send a message • Response order – Recency - Respondent stops reading once s/he gets to the response s/he likes – Primacy - Remember better the initial choices – Fatigue • Item order – Answers to later items may be affected by earlier items (simple, factual items first) – Respondent may not know how to answer earlier questions Diunduh dari: ………….. 23/8/2012 MENILAI INSTRUMENT • Three issues to consider – Validity: Does the instrument measure what its supposed to measure – Reliability: Does it consistently repeat the same measurement – Practicality: Is this a practical instrument Proses Validasi Konsep Melalui Panel 1. Memeriksa instrumen mulai dari konstruk sampai penyusunan butir Dalam kaitan ini, beberapa hal yang perlu diperhatikan antara lain : 1. Apakah dimensi yang dirumuskan sudah merupakan jabaran yang tepat dari konstruk yang telah dirumuskan dan sesuai untuk mengukur konstruk dari variabel yang hendak diukur ? 2. Apakah indikator yang dirumuskan sudah merupakan jabaran yang tepat dari dimensi yang telah dirumuskan dan sesuai untuk mengukur konstruk dari variabel yang hendak diukur ? 3. Apakah butir-butir instrumen yang dibuat telah sesuai untuk mengukur indikator-indikator dari variabel yang hendak diukur ? 2. Menilai butir Item Butir yang sudah dibuat diberikan kepada sekelompok panel untuk dinilai dengan tetap mengacu pada tolok ukur di atas. Metode penilaian butir dapat dilakukan dengan beberapa cara, misalnya dengan Metode Thurstone dan Pair Comparison. Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002 Diunduh dari: https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/ TIPE-TIPE VALIDITAS • • Face validity – Does the instrument, on its face, appear to measure what it is supposed to measure Content validity – Degree to which the content of the items adequately represent the universe of all relevant items under study – Generally arrived at through a panel of experts Content validity “Validity refers to the degree to which evidence and theory support the interpretations of test scores entailed by proposed uses of tests (AERA/APA/NCME, 1999). Content validity refers to the degree to which the content of the items reflects the content domain of interest (APA, 1954) Content validity addresses the adequacy and representativeness of the items to the domain of testing purposes Content validity is not usually quantified possibly due to : 1.) subsuming it within construct validity; 2.) ignoring it as important; and/or 3.) relying on accepted expert agreement procedures Diunduh dari: plaza.ufl.edu/.../CONTENT%20VALIDITY.p... 25/8/2012 TIPE-TIPE VALIDITAS • Criterion related – Degree to which the predictor is adequate in capturing the relevant aspects of criterion – Uses Correlation analysis – Concurrent validity • Criterion data is available at the same time as predictor scorerequires high correlation between the two – Predictive validity • Criterion is measured after the passage of time • Retrospective look at the validity of the measurement • Known-groups • Criterion related – Degree to which the predictor is adequate in capturing the relevant aspects of criterion – Uses Correlation analysis – Concurrent validity • Criterion data is available at the same time as predictor scorerequires high correlation between the two – Predictive validity • Criterion is measured after the passage of time • Retrospective look at the validity of the measurement • Known-groups Diunduh dari: ………….. 23/8/2012 TIPE-TIPE RELIABILITAS • Stability – Test-retest: Same test is administered twice to the same subjects over a short interval (3 weeks to 6 months) – Look for high correlation between the test and retest – Situational factors must be minimized • Equivalence – Degree to which alternative forms of the same measure produce same or similar results – Give parallel forms of the same test to the same group with a short delay to avoid fatigue – Look for high correlation between the scores of the two forms of the test – Inter-rater reliability • Internal Consistency – Degree to which instrument items are homogeneous and reflect the same underlying constructs – Split-half testing where the test is split into two halves that contain the same types of questions – Uses Cronbach’s alpha to determine internal consistency. Only one administration of the test is required – Kuder-Richardson (KR20) for items with right and wrong answers Diunduh dari: ………….. 23/8/2012 PRAKTIKALITAS • • • Is the survey economical • Cost of producing and administering the survey • Time requirement • Common sense! Convenience • Adequacy of instructions • Easy to administer Can the measurement be interpreted by others • Scoring keys • Evidence of validity and reliability • Established norms A comparison of Likert scale and traditional measures of self-efficacy. By Maurer, Todd J.; Pierce, Heather R. Journal of Applied Psychology, Vol 83(2), Apr 1998, 324-329. This study addressed whether a Likert-type measurement format can be used as an alternative to the traditional format for measuring self-efficacy. Classical reliability, observed correlations with relevant criteria, and confirmatory factor analyses were used to assess the similarity of the two formats in a sample of 128 college students. The results indicated that Likert-type and traditional measures of self-efficacy have similar reliability–error variance, provide equivalent levels of prediction, and have similar factor structure and similar discriminability. Overall, considering both practicality and the apparent similarity of empirical results from the two methods, a Likert scale seems to offer an acceptable alternative method of measuring self-efficacy. Limitations and suggestions for future research are discussed. Diunduh dari: ………….. 23/8/2012 Development of a Multi-item Scale Develop Theory Generate Initial Pool of Items: Theory, Secondary Data, and Qualitative Research Select a Reduced Set of Items Based on Qualitative Judgement Collect Data from a Large Pretest Sample Statistical Analysis Develop Purified Scale Collect More Data from a Different Sample Evaluate Scale Reliability, Validity, and Generalizability Final Scale Diunduh dari: ………….. 23/8/2012 EVALUASI SEKALA Scale Evaluation Reliability Test/ Retest Alternative Forms Validity Internal Consistency Content Convergent Diunduh dari: Criterion Generalizability Construct Discriminant ………….. 23/8/2012 Nomological Transformasi data ordinal ke interval dengan Method of Succesive Interval (MSI) Untuk dapat diolah menjadi analisis regresi, data ordinal yang biasanya didapat dengan menggunakan skala likert, dll (skor kuesioner), maka terlebih dahulu data ini harus ditrasformasikan menjadi data interval salah satu cara yang dapat digunakan adalah Method of Succesive Interval (MSI). Sepintas memang terlihat sangat susah karena kita harus membuat frekuensi, kemudian menentukan proporsi, membuat proporsi komulatif dst. Langkah-langkah Method of Succesive Interval (MSI).sebagai berikut: 1. 2. 3. 4. 5. Membuat ferkuensi dari setiap butir jawaban pada masing-masing kategori pertanyaan. Membuat proporsi dengan cara membagi frekuensi dari setiap butir jawaban dengan seluruh jumlah responden. Membuat proporsi kumulatif Menentukan nilai z untuk setiap butir jawaban berdasarkan nilai frekuensi yang telah diperoleh dengan bantuan tabel z riil. Menghitung nilai skala, dengan rumus: 6. Penyertaan nilai skala Nilai penyertaan inilah yang disebut skala interval dan dapat digunakan dalam perhitungan analisis regresi. Diunduh dari: http://jurnal-sdm.blogspot.com/2007/12/transformasi-data-ordinal-ke-interval.html ………….. 24/8/2012 TRANSFORMASI DATA ORDINAL MENJADI INTERVAL Data primer adalah data yang direspon langsung oleh responden berdasarkan wawancara ataup daftar pertanyaan yang dirancang, disusun, dan disajikan dalam bentuk skala; baik skala nominal, ordinal, interval maupun ratio. Teknik pengumpulan data seperti ini lazim digunakan karena selain bisa langsung menentukan skala pengukuranya, juga dapat melengkapi hasil wawancara yang dilakukan dengan responden. Melakukan manipulasi data dengan cara transformasi “skala” dari ordinal menjadi interval, selain bertujuan untuk tidak melanggar kelaziman, juga untuk mengubah agar syarat distribusi normal dapat dipenuhi ketika menggunakan statistika parametrik. Menurut Sambas Ali Muhidin dan Maman Abdurahman, “salah satu metode transformasi yang sering digunakan adalah metode succesive interval (MSI)”. Ada dua pendapat berbeda tentang bagaimana skor-skor yang diberikan terhadap alternatif jawaban pada skala pengukuran Likert. Pendapat pertama mengatakan bahwa skor 1, 2, 3, 4, dan 5 adalah data interval. Pendapat ke dua, menyatakan bahwa jenis skala pengukuran Likert adalah ordinal. Alasannya skala Likert merupakan Skala Interval adalah karena skala sikap merupakan dan menempatkan kedudukan sikap seseorang pada kesatuan perasaan kontinum yang berkisar dari sikap “sangat positif”, artinya mendukung terhadap suatu objek psikologis terhadap objek penelitian, dan sikap “sangat negatif”, yang tidak mendukung sama sekali terhadap objek penelitian. Ciri spesifik yang dimiliki oleh data yang diperoleh dengan skala pengukuran ordinal, adalah bahwa, data ordinal merupakan jenis data kualitatif, bukan numerik, berupa kata-kata atau kalimat, seperti misalnya sangat setuju, kurang setuju, dan tidak setuju, jika pertanyaannya ditujukan terhadap persetujuan tentang suatu event. Atau bisa juga respon terhadap keberadaan suatu Bank “PQR” dalam suatu daerah yang bisa dimulai dari sangat tidak setuju, tidak setuju, ragu-ragu, Setuju, dan sangat setuju. Data interval adalah termasuk data kuantitatif, berbentuk numerik, berupa angka, bukan terdiri dari kata-kata, atau kalimat. Peneliti melakukan penelitian dengan menggunakan pendekatan kuantitatif, termasuk di dalamnya adalah data interval, data yang diperoleh dari hasil pengumpulan data bisa langsung diolah dengan menggunakan model statistika. Akan tetapi data yang diperoleh dengan pengukuran skala ordinal, berbentuk kata-kata, kalimat, penyataan, sebelum diolah, perlu memberikan kode numerik, atau simbol berupa angka dalam setiap jawaban. Diunduh dari: myunanto.staff.gunadarma.ac.id/.../Transformasi+Data+Ordinal+Men...………….. 24/8/2012 PERLUKAH DATA ORDINAL DI TRANSFORMASI KE INTERVAL DENGAN MSI? Posted by: Muji Gunarto on: 25 Desember 2008 Data ordinal dengan Skala Likert STS(1), TS(2), R(3), S(4), SS(5) jika diubah skalanya menjadi interval maka skore interval akan mirip sama urutannya dengan skore asli ordinal dan berkorelasi sebesar 99%. Jadi data asli ordinal sama dengan interval dan dapat dianggap interval. Hal yang membedakan adalah interpretasi model dari hasil analisis anatara data ordinal dengan data interval. Misalkan ada model regresi sebagai berikut: Y = a + b1X1 +b2X2 Y = 0.50 +0.25X1 +0.30X2 Jika data interval misal Y = Produksi padi (ton/Ha), X1 = Pupuk UREA (kg/Ha) dan X2 = Bibit (kg/Ha), maka interpretasinya adalah kalau pupuk dinaikan 10% maka produksi padi akan naik 2.5%, kalau bibit naik 10%, maka produksi padi naik 3%. Kalau data ordinal (kualitatif) misalnya Y= kepuasan kerja, X1=Komitmen, X2=motivasi, maka tidak bisa diinterpretasikan jika komitmen naik 10% maka kepuasan naik 2.5% (karena datanya kualitatif) jadi hanya bisa dikatakan bahwa komitmen berpengaruh (signifikan) terhadap kepuasan kerja seberapa besar pengaruhnya tidak tahu (karena kualiatif). Walaupun data ordinal tadi sudah menjadi interval tetap saja kita tidak bisa interpretasi seperti data kuantitatif karena data aslinya adalah kualitatif. Diunduh dari: http://mujigunarto.wordpress.com/2008/12/25/perlukah-data-ordinal-ditransformasi-ke-interval-dengan-msi/………….. 24/8/2012 Questionnaire design For a questionnaire to fulfill a researcher’s purposes, the questions must meet the basic criteria of relevance and accuracy. To achieve these ends, a researcher who is systematically planning a questionnaire’s design will be required to make several decisions—typically, but not necessarily, in the following order: 1. 2. 3. 4. 5. What should be asked? How should questions be phrased? In what sequence should the questions be arranged? What questionnaire layout will best serve the research objectives? How should the questionnaire be pretested? Does the questionnaire need to be revised? What Should Be Asked? Certain decisions made during the early stages of the research process will influence the questionnaire design. The preceding chapters stressed good problem definition and clear research questions. This leads to specific research hypotheses that, in turn, clearly indicate what must be measured. Different types of questions may be better at measuring certain things than are others. In addition, the communication medium used for data collection—that is, telephone interview, personal interview, or self-administered questionnaire—must be determined. This decision is another forward linkage that influences the structure and content of the questionnaire. Therefore, the specific questions to be asked will be a function of previous decisions made in the research process. At the same time, the latter stages of the research process will also have an important impact on questionnaire wording and measurement. For example, when designing the questionnaire, the researcher should consider the types of statistical analysis that will be conducted. Diunduh dari: http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf ………….. 25/8/2012 Questionnaire design A survey is only as good as the questions it asks Langkah-Langkah Pembuatan Quesioner: Langkah 1: • Menentukan Hipotesis • Menentukan tipe survey yang akan digunakan • Menentukan pertanyaan-pertanyaan survey • Menentukan kategori jawaban • mendesain letak survey Langkah 2: • Rencanakan bagaimana data akan dikumpulkan • Uji awal alat pengukuran Langkah 3: • tentukan target populasi • tentukan teknik sampling (random sampling, non random sampling) • tentukan ukuran sampel • pilih sampel Langkah 4: • Temukan responden • lakukan interview/wawancara • kumpulkan data dengan teliti Langkah 5: • Masukkan data kedalam komputer • periksa ulang seluruh data • lakukan analisis statistik pada data yang diperoleh Langkah 6: • Jelaskan metode dan penemuan dalam laporan penelitian • Presentasikan untuk mendapatkan masukan dan evaluasi Diunduh dari: http://jurnal-sdm.blogspot.com/2011/06/penyusunan-kuesionerpenelitian.html………….. 24/8/2012 What should you ask? • • The questions asked are a function of previous decisions The questions asked are a function of future decisions (such as statistical analysis) Ecosystem services (also called environmental services or nature’s services) are benefits provided by ecosystems to humans, that contribute to making human life both possible and worth living. Many of these goods and services are traditionally viewed as free benefits to society, or "public goods" - wildlife habitat and diversity, watershed services, carbon storage, and scenic landscapes, for example. Lacking a formal market, these natural assets are traditionally absent from society’s balance sheet; their critical contributions are often overlooked in public, corporate, and individual decision-making. Diunduh dari: http://www.trunity.net/oceanresource/topics/view/55385/ ………….. 25/8/2012 Key criteria • Questionnaire relevancy – • No unnecessary information is collected and only information needed to solve the problem is obtained. Be specific about your data needs; tie each question to an objective Questionnaire accuracy – Information is both reliable and valid What is LCA? In the context of environmental challenges and the need for more sustainable production modes, Life Cycle Assessment (LCA) has been brought forward as an important and comprehensive method for analyzing the environmental impact of products and services. While its has long been used in the industry, LCA has only been applied to agricultural systems for the last 10 years. (http://lca-rice.cirad.fr/what_is_lca) LCA is defined and framed by ISO standards. It involves 4 typical phases: 1. Goal and scope definition (where system is delineated, indicators are chosen, functional unit is selected, ways of presenting results are decided upon, etc.) 2. Inventory analysis (where all inputs and resources used are inventoried and quantified, related to the given functional unit; it is a kind of mass and energy balance, focused on environmentally relevant flows) 3. Impact assessment (where environmental impact indicators are calculated, involving classification and characterization stages) 4. Interpretation and presentation of results (with necessary caution regarding indicators uncertainty and errors should be considered, sensitivity analysis should be carried out). Diunduh dari: http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf ………….. 25/8/2012 Questionnaire Relevancy A questionnaire is relevant to the extent that all information collected addresses a research question that will help the decision maker address the current business problem. Asking a wrong question or an irrelevant question is a common pitfall. If the task is to pinpoint store image problems, questions asking for political opinions are likely irrelevant. The researcher should be specific about data needs and have a rationale for each item requesting information. Irrelevant questions are more than a nuisance because they make the survey needlessly long. In a study where two samples of the same group of businesses received either a one-page or a threepage questionnaire, the response rate was nearly twice as high for the one-page survey. Conversely, many researchers, after conducting surveys, find that they omitted some important questions. Therefore, when planning the questionnaire design, researchers must think about possible omissions. Is information on the relevant demographic and psychographic variables being collected? Would certain questions help clarify the answers to other questions? Will the results of the study provide the answer to the manager’s problem? Questionnaire Accuracy Once a researcher decides what should be asked, the criterion of accuracy becomes the primary concern. Accuracy means that the information is reliable and valid. While experienced researchers generally believe that questionnaires should use simple, understandable, unbiased, unambiguous, and nonirritating words, no stepby-step procedure for ensuring accuracy in question writing can be generalized across projects. Obtaining accurate answers from respondents depends strongly on the researcher’s ability to design a questionnaire that will facilitate recall and motivate respondents to cooperate. Respondents tend to be more cooperative when the subject of the research interests them. When questions are not lengthy, difficult to answer, or ego threatening, there is a higher probability of obtaining unbiased answers. Question wording and sequence also substantially influence accuracy, which can be particularly challenging when designing a survey for technical audiences. The Department of Treasury commissioned a survey of insurance companies to evaluate their offering of terrorism insurance as required by the government’s terrorism reinsurance program. But industry members complained that the survey misused terms such as “contract” and “high risk,” which have precise meanings for insurers, and asked for policy information “to date,” without specifying which date. These questions caused confusion and left room for interpretation, calling the survey results into question. Diunduh dari: http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf ………….. 25/8/2012 Phrasing Questions • Open ended response versus fixed alternative questions “?” • Decision criteria: type of research; time; method of delivery; budget; concerns regarding researcher bias Open-ended response questions pose some problem or topic and ask respondents to answer in their own words. If the question is asked in a personal interview, the interviewer may probe for more information, as in the following examples: 1. 2. 3. 4. 5. 6. 7. 8. What names of local banks can you think of? What comes to mind when you look at this advertisement? In what way, if any, could this product be changed or improved? I’d like you to tell me anything you can think of, no matter how minor it seems. What things do you like most about working for Federal Express? What do you like least? Why do you buy more of your clothing in Nordstrom than in other stores? How would you describe your supervisor’s management style? Please tell us how our stores can better serve your needs. Open-ended response questions are free-answer questions. The fixed-alternative questions—sometimes called closed-ended questions— which give respondents specific limited-alternative responses and ask them to choose the one closest to their own viewpoints. For example: Did you use any commercial feed or supplement for livestock or poultry in 2010? Yes No Would you say that the labor quality in Japan is higher, about the same, or not as good as it was 10 years ago? Higher About the same Not as good Diunduh dari: ………….. 25/8/2012 Avoid • • • • • • • Leading questions (pertanyaan yang “menggiring”) Overly complex questions Use of jargon Loaded questions (can use a counterbiasing statement) Ambiguity Double barreled questions Making assumptions Avoid Leading and Loaded Questions leading question = A question that suggests or implies certain answers. Leading and loaded questions are a major source of bias in question wording. A leading question suggests or implies certain answers. A study of the dry cleaning industry asked this question: Many people are using dry cleaning less because of improved wash-and-wear clothes. How do you feel wash-and-wear clothes have affected your use of dry cleaning facilities in the past 4 years? Use less No change Use more It should be clear that this question leads the respondent to report lower usage of dry cleaning. The potential “bandwagon effect” implied in this question threatens the study’s validity. loaded question = A question that suggests a socially desirable answer or is emotionally charged. A loaded question suggests a socially desirable answer or is emotionally charged. Consider the following question from a survey about media influence on politics: What most influences your vote in major elections? 1. My own informed opinion 2. Major media outlets such as CNN 3. Newspaper endorsements 4. Popular celebrity opinions 5. Candidate’s physical attractiveness 6. Family or friends 7. Video advertising (television or Web video) 8. Other Diunduh dari: http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf ………….. 25/8/2012 Order? • Order bias results from an alternative answer’s position in a set of answers or from the sequencing of questions – Funneling technique: general to specific helps understand the frame of reference first • Anchoring effect: the first concept measured tends to become a comparison point from which subsequent evaluations are made COUNTERBIASING STATEMENT An introductory statement or preamble to a potentially embarrassing question that reduces a respondent’s reluctance to answer by suggesting that certain behavior is not unusual. An introductory counterbiasing statement or preamble to a question that reassures respondents that their “embarrassing” behavior is not abnormal may yield truthful responses: Some people have time to brush three times daily but others do not. How often did you brush your teeth yesterday? If a question embarrasses the respondent, it may elicit no answer or a biased response. This is particularly true with respect to personal or classification data such as income or education. The problem may be mitigated by introducing the section of the questionnaire with a statement such as this: To help classify your answers, we’d like to ask you a few questions. Again, your answers will be kept in strict confidence. Diunduh dari: http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf ………….. 25/8/2012 AVOID AMBIGUITY: BE AS SPECIFIC AS POSSIBLE Items on questionnaires often are ambiguous because they are too general. Consider such indefinite words as often, occasionally, regularly, frequently, many, good, and poor. Each of these words has many different meanings. For one consumer, frequent reading of Fortune magazine may be reading all 25 issues in a year, while another might think 12, or even 6 issues a year is frequent. Earlier, we used the following question as an example of a checklist question: Please check which, if any, of the following sources of information about investments you regularly use. What exactly does regularly mean? It can certainly vary from respondent to respondent. How exactly does hardly any differ from occasionally? Where is the cutoff? It is much better to use specific time periods whenever possible. A brewing industry study on point-of-purchase advertising (store displays) asked their distributors: How often does the company shut down production for sanitary maintenance? 1. Annually (once a year) 2. Semiannually (once every six months) 3. Quarterly (about every three months) 4. At least once monthly 5. Less frequently (less often than once a year) Here the researchers clarified the terms permanent, semipermanent, and temporary by defining them for the respondent. However, the question remained somewhat ambiguous. Beer marketers often use a variety of point-of-purchase devices to serve different purposes—in this case, what is the purpose? In addition, analysis was difficult because respondents were merely asked to indicate a preference rather than a degree of preference. Thus, the meaning of a question may not be clear because the frame of reference is inadequate for interpreting the context of the question. A student research group asked this question: What media do you rely on most? 1. Television 2. Radio 3. Internet 4. Newspapers This question is ambiguous because it does not provide information about the context. “Rely on most” for what—news, sports, entertainment? When—while getting dressed in the morning, driving to work, at home in the evening? Knowing the specific circumstance can affect the choice made. Diunduh dari: http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf ………….. 25/8/2012 Decisions • • • • • Ranking, sorting, rating or choice? How many categories or response positions? Balanced or unbalanced? Forced choice or nonforced choice? Single measure or index? The Air Quality Index (AQI) is an index for reporting daily air quality. The Environmental Protection Agency calculates the AQI for five major air pollutants regulated by the Clean Air Act: ground-level ozone, particle pollution (also known as particulate matter), carbon monoxide, sulfur dioxide and nitrogen dioxide. The higher the AQI value, the greater the level of air pollution and the greater the health concern. Diunduh dari: http://aapnews.aappublications.org/content/25/6/279.2.full ………….. 25/8/2012 Types of fixed alternative questions… • Single dichotomy or dichotomous-alternative questions “Are you currently registered in a course at the University of Lethbridge? Yes____ No____” • Respondent chooses one of two alternatives (yes/no; male/female) • What scale would this data create? • Multi-choice alternative – Respondent chooses from several alternatives – Many types… Diunduh dari: ………….. 23/8/2012 Multi-choice alternative questions… • Determinant choice – Choose only one from several possible responses “Which faculty are you currently registered in at the University of Lethbridge? Management ___ Education ____ Arts/Science____ Health sciences____ Combined degree____ • What type of scale would these data create? • Frequency determination – Asks for an answer about frequency of occurrence In a typical week, how often do you purchase chocolate chip cookies? __never __ once __ 2 or more times What type of scale would these data create? Diunduh dari: ………….. 23/8/2012 CHECK LIST • Check list – Provide multiple answers to a single question – Should be mutually exclusive and exhaustive “What brands of chocolate chip cookies have you, to the best of your memory, purchased in the past month (check all that apply?)” __ Dare __ Chips A’hoy __ Presidents Choice Decadent etc. etc. • What type of scale would these data create? The checklist question allows the respondent to provide multiple answers to a single question. The respondent indicates past experience, preference, and the like merely by checking off items. In many cases the choices are adjectives that describe a particular object. A typical checklist question might ask the following: Please check which, if any, of the following sources of information about investments you regularly use. 1. 2. 3. 4. 5. 6. 7. 8. Personal advice of your broker(s) Brokerage newsletters Brokerage research reports Investment advisory service(s) Conversations with other investors Web page(s) None of these Other (please specify) __________ Diunduh dari: ………….. 23/8/2012 ATTITUDE RATING SCALES Attitude: An enduring disposition to consistently respond to various aspect of the world, including persons, events and objects Typically seen as having three components: – Cognitive – Affective – Behavioural Scaling Techniques for Measuring Data Gathered from Respondents The term scaling is applied to the attempts to measure the attitude objectively. Attitude is a resultant of number of external and internal factors. Depending upon the attitude to be measured, appropriate scales are designed. Scaling is a technique used for measuring qualitative responses of respondents such as those related to their feelings, perception, likes, dislikes, interests and preferences. Nominal Scale This is a very simple scale. It consists of assignment of facts/choices to various alternative categories which are usually exhaustive as well mutually exclusive. These scales are just numerical and are the least restrictive of all the scales. Instances of Nominal Scale are credit card numbers, bank account numbers, employee id numbers etc. It is simple and widely used when relationship between two variables is to be studied. In a Nominal Scale numbers are no more than labels and are used specifically to identify different categories of responses. How do you stock items at present? [ ] By product category [ ] At a centralized store [ ] Department wise [ ] Single warehouse. Ordinal Scale Ordinal scales are the simplest attitude measuring scale used in Marketing Research. It is more powerful than a nominal scale in that the numbers possess the property of rank order. The ranking of certain product attributes/benefits as deemed important by the respondents is obtained through the scale. Rank the following attributes (1 - 5), on their importance in a microwave oven. a. Company Name b. Functions c. Price d. Comfort e. Design Diunduh dari: http://www.managementstudyguide.com/attitude-scales.htm………….. 24/8/2012 Affective The feelings or emotions toward an object Cognitive Knowledge and beliefs Behavioral Predisposition to action Intentions Behavioral expectations Diunduh dari: ………….. 23/8/2012 Attitude Scales: Scaling Defined The term scaling refers to procedures for attempting to determine quantitative measures of subjective and sometimes abstract concepts. It is defined as a procedure for the assignment of numbers to a property of objects in order to impart some of the characteristics of numbers to the properties in question. Unidimensional Scaling Multidimensional Scaling Procedures designed to measure only one attribute of a respondent or object Procedures designed to measure several dimensions of a respondent or object Diunduh dari: ………….. 23/8/2012 PROSES MENGUKUR ATTITUDE • • • • Ranking Rating Sorting Choice A ranking is a relationship between a set of items such that, for any two items, the first is either 'ranked higher than', 'ranked lower than' or 'ranked equal to' the second. In mathematics, this is known as a weak order or total preorder of objects. It is not necessarily a total order of objects because two different objects can have the same ranking. The rankings themselves are totally ordered. For example, materials are totally preordered by hardness, while degrees of hardness are totally ordered. By reducing detailed measures to a sequence of ordinal numbers, rankings make it possible to evaluate complex information according to certain criteria. Thus, for example, an Internet search engine may rank the pages it finds according to an estimation of their relevance, making it possible for the user quickly to select the pages they are likely to want to see. Analysis of data obtained by ranking commonly requires non-parametric statistics. In statistics, "ranking" refers to the data transformation in which numerical or ordinal values are replaced by their rank when the data are sorted. For example, the numerical data 3.4, 5.1, 2.6, 7.3 are observed, the ranks of these data items would be 2, 3, 1 and 4 respectively. For example, the ordinal data hot, cold, warm would be replaced by 3, 1, 2. In these examples, the ranks are assigned to values in ascending order. (In some other cases, descending ranks are used.) Ranks are related to the indexed list of order statistics, which consists of the original dataset rearranged into ascending order. Some kinds of statistical tests employ calculations based on ranks: Friedman test Kruskal-Wallis test Rank products Spearman's rank correlation coefficient Wilcoxon rank-sum test Wilcoxon signed-rank test. Ranks can sometimes have non-integer values for tied data values. Thus, in one way of treating tied data values, when there is an even number of copies of the same data value, the statistical rank (being the median rank of the tied data) can end in ½. Diunduh dari: http://en.wikipedia.org/wiki/Ranking ………….. 24/8/2012 Types of attitude scales • • • Simple attitude scales Most basic form – respondent responds to a single question Do not allow for fine distinctions or placement on continua – You are at a company party and are feeling nervous, but you are obligated to be there. Do you: __ find someone you know to buddy up with __ take it as an opportunity to meet new people What type of scale would these data create? Attitude Scales An attitude scale is a special type of questionnaire designed to produce scores indicating the intensity and direction (for or against) of a person's feelings about an object or event. There are several types of scales that can be constructed, but the most common is the Likert -type. The scale is constructed so that all its questions concern a single issue. Attitude scales are often used in attitude change experiments. One group of people is asked to fill out the scale twice, once before some event, such as reading a persuasive argument, and again afterward. A control group fills out the scale twice without reading the argument. The control group is used to measure exposure or practice effects. The change in the scores of the experimental group relative to the control group, whether their attitudes have become more or less favorable, indicates the effects of the argument. Likert-type Scale A Likert -type scale, named for Rensis Likert (1932) who developed this type of attitude measurement, presents a list of statements on an issue to which the respondent indicates degree of agreement using categories such as : Strongly Agree, Agree, Undecided, Disagree, and Strongly Disagree. Diunduh dari: http://famusoa.net/mpowers/trandp/docs/14%20Attitude%20and%20Rating%20Scales%20by%20S ommer.pdf ………….. 24/8/2012 CATEGORY SCALES • Category scales – More sensitive; provides more information – Overall, how satisfied are you with the high speed performance of your Mercedes: __ very satisfied __ somewhat satisfied __ neither satisfied nor dissatisfied __ somewhat dissatisfied __ very dissatisfied If you could choose, how long would each term be? ___26 weeks __ 13 weeks __ 6 weeks ___4 weeks What type of scale would these data create? RATIO SCALES AND CATEGORY SCALES OF ODOUR INTENSITY J. R. PIGGOTT and R. HARPER. Chem. Senses (1975) 1 (3): 307-316. doi: 10.1093/chemse/1.3.307 The relation between a ratio scale obtained by magnitude estimation and a category scale of the odour intensity of 1-butanol was studied, together with individual variations in the ratio scale. Series of solutions of butanol in water in small bottles were presented to a panel for judgement, half using the method of magnitude estimation, the other half a category scale. Plots were made of the category scale against the ratio scale, and the ratio scales of individual members of the panel were analysed. A power function exponent of 0.48 was found for the panel's ratio scale, with individual values ranging from 0.25 to 0.49. The category scale was curved relative to the ratio scale; variability of the magnitude estimates was approximately proportional to the magnitude estimates; and a small time-order error was found. Odour intensity exhibits the three tested characteristics of a prothetic continuum, and the variability of individual exponents was not as great as sometimes suggested. Diunduh dari: http://chemse.oxfordjournals.org/content/1/3/307.abstract………….. 24/8/2012 Summated rating scales – the Likert scale • Summated rating scales – the Likert scale – Respondents indicate their attitudes by checking how strongly they agree or disagree with statements – Chocolate chip cookies are my preferred variety of cookie Strongly disagree Disagree Uncertain (1) (2) (3) Agree (4) Strongly Agree (5) What type of scale would these data create? Ratio scales, category scales, and variability in the production of loudness and softness. Bruce Schneider, and Harlan Lane. J. Acoust. Soc. Am. Volume 35, Issue 12, pp. 1953-1961 (December 1963). Several studies have shown that category scales are nonlinearly related to ratio scales of subjective magnitude. A variability model has been proposed previously to account for this departure from linearity. This article examines the model in the light of the empirical relations that enter into it: the ratio scale of subjective magnitude, the corresponding category scale, and the variability of judgments in both physical and psychological units. These relations are determined, through repeated measurement with a single observer, for the psychological continuum, loudness, and its inverse, softness. The ratio scales are shown to be reciprocals, and the category scales complements. The category scale of softness is more concave downward, relative to its magnitude scale, than is the category scale of loudness. This outcome is also derived mathematically from the empirical equations relating the four scales to physical magnitude. Variability is found to increase with increasing stimulus magnitude at the same rate for both loudness and softness productions, expressed either in physical units or in psychological units. Hence, the variability model is found not to accord with the observed difference in concavity between softness and loudness category scales relative to their respective psychological magnitude scales. Diunduh dari: http://iris.lib.neu.edu/psych_fac_pubs/15/………….. 24/8/2012 SEMANTIC DIFFERENTIAL RATING SCALE Semantic Differential Rating scale – An attitude measure consisting of a series of seven-point bipolar rating scales allowing response to a “concept” Think of your favorite type of cookie. Rate it on each of the following continua: Hard------------------------------------------------------Soft Lots of chips---------------------------------------Fewer chips Crispy---------------------------------------------------chewy What type of scale would these data create? Journal of Marketing Management, Vol. 9:3, Winter 1999, 114-123. ©1999 RATING THE RATING SCALES Hershey H. Friedman, and Taiwo Amoo Rating scales are used quite frequently in research, especially in surveys. Typically, an itemized rating scale asks subjects to choose one response category from several arranged in hierarchical order. Dishonest researchers can, of course, purposefully manipulate the outcome of their research, if they wish, but such biasing may also be totally unintentional. This paper examines issues involved in creating a relatively unbiased rating scale. These include: (1) Connotations of category labels; (2) Response alternative effects; (3) Implicit assumptions of the question; (4) Forced-choice vs. non-forced-choice rating scales; (5) Unbalanced and balanced rating scales; (6) Order effects; (7) Direction of comparison; (8) Optimal number of points; (9) Context effects; (10) Rating approach, e.g., improvement needed, performance, comparison to expectations, comparison to ideal, etc. Diunduh dari: http://academic.brooklyn.cuny.edu/economic/friedman/rateratingscales.htm………….. 24/8/2012 NUMERICAL RATING SCALE Numerical Rating scale – Similar to a semantic differential except that it uses numbers as response options to identify response positions instead of verbal descriptions Think of your favorite type of cookie. Rate it on each of the following continua: Hard------------------------------------------------------------------------Soft 8 2 7 1 6 5 4 3 This scale is called an 8 point numerical scale, why? What type of scale would these data create? Numerical rating scale “A scale used for the subjective measurement of a clinical sign/syndrome, in which numerical scores are given (e.g. 0-4). A description is given for each score. The observer chooses, for each individual observed, the number on the scale which they consider most closely matches that individual.“ This system groups information in discrete units, which may place a constraint on the observer. The NRS can also be used without a descriptor for each score, but is improved by the addition of the descriptions. Validation of the numerical rating scale for pain intensity and unpleasantness in pediatric acute postoperative pain: sensitivity to change over time Pagé, M. Gabrielle; Katz, Joel; Stinson, Jennifer; Isaac, Lisa; Martin-Pichora, Andrea L.; Campbell, Fiona. Journal of Pain, 13(4), 359-369. (2012) Date: 2012. This study evaluates the construct validity (including sensitivity to change) of the numerical rating scale (NRS) for pain intensity (I) and unpleasantness (U) and participant pain scale preferences in children/adolescents with acute postoperative pain. Eighty-three children aged 8 to 18 years (mean = 13.8, SD = 2.4) completed 3 pain scales including NRS, Verbal Rating Scale (VRS), and faces scales (Faces Pain Scale-Revised [FPS-R] and Facial Affective Scale [FAS], respectively) for pain intensity (I) and unpleasantness (U) 48 to 72 hours after major surgery, and the NRS, VRS and Functional Disability Index (FDI) 2 weeks after surgery. As predicted, the NRSI correlated highly with the VRSI and FPS-R and the NRSU correlated highly with the VRSU and FAS 48 to 72 hours after surgery. The FDI correlated moderately with the NRS at both time points. Scores on the NRSI and NRSU at 48 to 72 hours were significantly higher than at 2 weeks after surgery. Children found the faces scales the easiest to use while the VRS was liked the least and was the hardest to use. The NRS has adequate evidence of construct validity including sensitivity for both pain intensity and unpleasantness. This study further supports the validity of the NRS as a tool to measure both intensity and unpleasantness of acute pain in children. Diunduh dari: http://pi.library.yorku.ca/dspace/handle/10315/14340 Diunduh dari: CONSTANT SUM SCALES Constant Sum Scales – Attributes based on their importance to the person. Respondents are asked to divide a constant sum to indicate the relative importance of attributes Example: Suppose the photocopy budget per professor was $100 per month. How much should be allocated to the following. Divide the $100 according to your preference: ____ photocopying for student needs; ____ photocopying for research needs; ____ photocopying for committee needs. ==== $100 TOTAL Constant-Sum Scales A scale that helps the researcher discover proportions is the constant-sum scale. 1. 2. With this scale, the participant allocates points to more than one attribute or propertyindicant, such that they total a constant sum, usually 100 or 10. In the Exhibit 13-2 example, two categories are presented that must sum to 100. In the restaurant example, the participant distributes 100 points among four categories to indicate the relative importance of each attribute: _____ Food Quality _____ Atmosphere _____ Service _____ Price 100 TOTAL 3. Up to 10 categories may be used, but both participant precision and patience suffer when toomany stimuli are proportioned and summed. 1. A participant’s ability to add is also taxed in some situations; this is not a responsestrategy that can be effectively used with children or the uneducated. 2. The advantage of the scale is its compatibility with percent (100 percent) and the fact thatalternatives that are perceived to be equal can be so scored— unlike most ranking scales. 3. The scale is used to record attitudes, behavior, and behavioral intent. 4. The constant-sum scale produces interval data. Diunduh dari: http://www.scribd.com/doc/82071910/157/Constant-Sum-Scales ………….. 24/8/2012 GRAPHIC RATING SCALES Graphic Rating Scales – An attitude measure consisting of a graphic continuum that allows respondents to rate an object by choosing any point on the continuum GRAPHIC RATING SCALES 1. The graphic rating scale was originally created to enable researchers to discern fine differences. Theoretically, an infinite number of ratings are possible if participants are sophisticatedenough to differentiate and record them. 2. They are instructed to mark their response at any point along a continuum. Usually, the score is a measure of length (millimeters) from either endpoint. The results are treated as interval data. 3. The difficulty is in coding and analysis; this scale requires more time than scales with predetermined categories. Never __X___________ Always 4. Other graphic rating scales use pictures, icons, or other visuals to communicate with the rater and represent a variety of data types. 5. Graphic scales are often used with children, whose more limited vocabulary prevents the useof scales anchored with words Diunduh dari: http://www.scribd.com/doc/82071910/157/Constant-Sum-Scales………….. 24/8/2012 Rank-Order Scales Scales in which the respondent compares one item with another or a group of items against each other and ranks them. A Rank Order scale gives the respondent a set of items and asks them to put the items in some form of order. The measure of 'order' can include such as preference, importance, liking, effectiveness and so on. The order is often a simple ordinal structure (A is higher than B). It can also be done by relative position (A scores 10 whilst B scores 6). Example Please write a letter next to the four evening activities below to show your preference. Use A for your most preferred activity, B for the next preferred, then C for the next and then D for the least preferred. __ Staying in and watching television __ Going bowling __ Going out for a meal __ Going to a bar with a friend 1. 2. 3. 4. 5. 6. Discussion Sorting of ordinal data can be done in several ways: Priority sorting looks for the most important first, then the next most important and so on. Block sorting sorts items in to sub groups and then sorts the sub-groups (this is more important, that is less important -- then sort the 'more important' group). Score sorting gives an absolute score to each item. Pairwise sorting compares pairs of items, moving the more important item higher or giving it a higher score. Q-Sorting is done by writing items on cards (Q-cards) and asking the subject to place these in order. Swap-sorting uses pairwise comparison on cards or Post-It Notes in a vertical column, swapping each pair in turn until the whole column is in order. Rank order items are analyzed using Spearman or Kendall correlation. The Rank Order scale is also known as the Ranking scale. Diunduh dari: http://changingminds.org/explanations/research/measurement/rank_ordering.htm ………….. 23/8/2012 LIKERT SCALE The Likert scale is the most frequently used variation of the summated rating scale. Summated rating scales consist of statements that express either a favorable or anunfavorable attitude toward the object of interest. 1. 2. 3. The participant is asked to agree or disagree with each statement. Each response is given a numerical score to reflect its degree of attitudinal favorableness,and the scores may be summed to measure the participant’s overall attitude. Summation is not necessary and in some instances may actually be misleading. The participant chooses one of five levels of agreement. 1. 2. The numbers indicate the value to be assigned to each possible answer, with 1 the leastfavorable impression of Internet superiority and 5 the most favorable. Likert scales also use 7 and 9 scale points. The Likert scale has many advantages that account for its popularity. 1. 2. 3. It is easy and quick to construct. It is more reliable and provides more data than many other scales. It produces interval data. Originally, creating a Likert scale involved a procedure know as item analysis. • • • • • • • In the first step, a large number of statements were collected that met two criteria: Each statement was relevant to the attitude being studied; Each reflected a favorable or unfavorable position on that attitude. People similar to those who are going to be studied were asked to read each statementand to state the level of their agreement with it, using a 5-point scale. A scale value of 1 indicated a strongly unfavorable attitude (strongly disagree). Theother intensities were 2 (disagree), 3 (neither agree nor disagree), 4 (agree), and 5(strongly agree), a strongly favorable attitude. To ensure consistent results, the assigned numerical values are reversed if thestatement is worded negatively (1 is always strongly unfavorable and 5 is alwaysstrongly favorable). Each person’s responses are then added to secure a total score. The next step is to array these total scores and select some portion representing thehighest and lowest total scores (generally the top and bottom 10 to 25 percent). The middle group (50 to 80 percent of participants) are excluded from the subsequentanalysis. Diunduh dari: http://www.scribd.com/doc/82071910/157/Constant-Sum-Scales ………….. 24/8/2012 Using Angler Characteristics and Attitudinal Data to Identify Environmental Preference Classes: A Latent-Class Model EDWARD MOREY, JENNIFER THACHER, and WILLIAM BREFFLE Environmental & Resource Economics (2006) 34: 91–115 A latent-class model of environmental preference groups is developed and estimated with only the answers to a set of attitudinal questions. Economists do not typically use this type of data in estimation. Group membership is latent/unobserved. The intent is to identify and characterize heterogeneity in the preferences for environmental amenities in terms of a small number of preference groups. The application is to preferences over the fishing characteristics of Green Bay. Anglers answered a number of attitudinal questions, including the importance of boat fees, species catch rates, and fish consumption advisories on site choice. The results suggest that Green Bay anglers separate into a small number of distinct classes with varying preferences and willingness to pay for a PCB-free Green Bay. The probability that an angler belongs to each class is estimated as function of observable characteristics of the individual. Estimation is with the expectation–maximization (E–M) algorithm, a technique new to environmental economics that can be used to do maximum-likelihood estimation with incomplete information. As explained, a latent-class model estimated with attitudinal data can be melded with a latent-class choice model. Diunduh dari: http://www.colorado.edu/economics/morey/papers/MoreyThacherBreffle2006.pdf ………….. 25/8/2012 Relating Environmental Ethical Attitudes and Contingent Valuation Responses Using Cluster Analysis, Latent Class Analysis, and the NEP: A Comparison G. Aldrich, K. Grimsrud, J. THACHER, and M. Kotchen September 1, 2005 Environmental ethics and attitudes may be an important source of heterogeneity when considering the welfare effects and equity implications of policy changes dealing with environment and natural resources. The New Ecological Paradigm (NEP) Scale is a set of 15 likert questions and is intended to indicate whether an individual holds pro-environmental or anti-environmental beliefs. This paper provide an overview and comparison of three methodologies that may be applied to NEP survey data to detect environmental ethics groups: total NEP score, latent class analaysis, and cluster analysis methods. We find that while environmental attitudes do not significantly affect average willingness to pay measures, there are significant differences in willingness to pay across environmental attitude groups. The willingness to pay estimates for each attitudinal group are consistent across the different analystical measures. Diunduh dari: http://www2.bren.ucsb.edu/~kolstad/events/OccWkshp/Aldrich.pdf ………….. 25/8/2012 Environmental and Resource Economics 14: 95–117, 1999. The Validity of Environmental Benefits Transfer: Further Empirical Testing ROY BROUWER and FRANK A. SPANINKS. 1 This paper provides further empirical evidence of the validity of environmental benefits transfer based on CV studies by expanding the analysis to include control factors which have not been accounted for in previous studies. These factors refer to differences in respondent attitudes. Questionnaires complying with Dillman’s (1978) ‘total design method’formail surveys were sent to randomly selected households. Since management agreements in peat meadow areas usually concentrate on the protection of meadow birds and ditch-side vegetation, these elements received most attention in the questionnaires. Except for some minor differences in wording, both studies used the same valuation scenarios. Traditional population characteristics were taken into account, but these variables do not explain why respondents from the same socio-economic group may still hold different beliefs, norms or values and hence have different attitudes and consequently state different WTP amounts. The test results are mixed. The function transfer approach is valid in one case, but is rejected in the 3 other cases investigated in this paper. We provide further evidence that in the case of statistically valid benefits transfer, the function approach results in a more robust benefits transfer than the unit value approach. We also show that the equality of coefficient estimates is a necessary, but insufficient condition for valid benefit function transfer and discuss the implications for previous and future validity testing. Diunduh dari: http://www.fnu.zmaw.de/fileadmin/fnu-files/courses/ere4_val/erebouwerspaninks.pdf Sekala LIKERT DALAM KAJIAN LINGKUNGAN Foto:smno.kampus.ub.febr2012