Login
Section Philosophy. Psychology. Religion

Adaptasi dan Validasi Instrumen School Bystander Behaviour Scale (SBBS) untuk Siswa SMP: Analisis Rasch Model

(Adaptation and Validation of The School Bystander Behaviour Scale (SBBS) Instrumen for Junior High School Students: Rasch Model Analysis)
Vol. 10 No. 2 (2025): December:

Diky Zulkiflismin Zuhri (1), Widyastuti Widyastuti (2)

(1) Universitas Muhammadiyah Sidoarjo, Indonesia
(2) Universitas Muhammadiyah Sidoarjo, Indonesia

Abstract:

General Background Bullying in junior high schools involves not only perpetrators and victims but also bystanders whose responses shape peer dynamics. Specific Background The School Bystander Behaviour Scale (SBBS) was developed to classify students as passive bystanders, defenders, or probully, yet it has not been adapted for Indonesian contexts. Knowledge Gap No prior study in Indonesia has examined SBBS using Rasch Model analysis. Aims This study aimed to adapt SBBS into Indonesian and evaluate its psychometric properties among 251 Grade 7–9 students using proportionate stratified random sampling. Results The adapted scale demonstrated adequate unidimensionality and excellent item reliability, although several items showed misfit statistics and low discrimination, while person reliability remained weak. Wright map analysis revealed item gaps and limited respondent ability variation, indicating the need for item refinement. Novelty This research provides the first Indonesian SBBS adaptation assessed through Rasch Model, offering detailed evidence on item functioning and respondent consistency. Implications The findings support the preliminary use of SBBS for measuring bystander behaviour in Indonesian junior high schools while highlighting the necessity of revising problematic items and improving data collection procedures to strengthen future applications.


Keywords: School Bullying, Bystander Behaviour, Rasch Model, Instrument Adaptation, Junior High Students


Key Findings Highlights:


  1. Several items require revision due to misfit and weak discrimination.




  2. Item reliability was excellent, while respondent consistency remained low.




  3. Wright map revealed gaps in item difficulty across student ability levels.



Downloads

Download data is not yet available.

Pendahuluan

Bystander effect merujuk pada fenomena menurunnya keinginan individu untuk membantu orang lain ketika terdapat bystander lain yang juga bersikap pasif [1]. Kita sering mendapatkan contoh dari fenomena ini, baik yang terjadi depan mata kita sendiri atau yang kita saksikan melalui media sosial dan elektronik. Terdapat empat faktor utama yang melatarbelakangi terjadinya bystander effect yakni: (1) kesadaran diri; (2) isyarat sosial; (3) mekanisme blocking; (4) difusi tanggung jawab . Fenomena bystander effect dapat terjadi pada situasi darurat maupun nondarurat. Respon bystander pada situasi tersebut dapat memberikan dampak yang bervariasi, namun dampak yang paling ekstrim adalah hilangnya nyawa, seperti pada kasus pemerkosaan dan pembunuhan Kitty Genoverse pada tahun 1964 [1]. Penelitian menunjukkan bahwa bystander effect juga terjadi dalam bullying pada siswa sekolah menengah pertama (SMP) . Remaja pada usia ini sedang dalam proses pencarian jati diri, sehingga ketika terdapat bullying, tak jarang mereka bingung bagaimana harus bersikap. Selain itu, bystander yang berasal dari pihak teman sebaya seringkali memiliki anggapan bahwa bullying adalah hal yang wajar dan tidak akan berdampak negatif [2]. Anggapan mengenai tidak adanya dampak negatif ini merupakan sesuatu yang keliru. Hal ini didukung oleh studi bahwa seorang remaja yang menjadi korban bullying dapat menimbulkan dampak negatif berupa perasaan tidak percaya diri, terisolasi, depresi, atau bahkan bunuh diri [3].Hal ini diperkuat dengan penelitian yang menunjukkan bahwa meningkatnya kasus bullying selama periode 2020 hingga 2023 berpengaruh positif terhadap tren bunuh diri remaja korban bullying [4]. Sebagai generasi penerus, tidak seharusnya siswa SMP bersikap pasif ketika menyaksikan adanya bullying yang menimpa teman sekelasnya.

Studi terdahulu menunjukkan bahwa siswa SMP, yang notabenenya merupakan remaja dengan rentang usia 12-15 tahun, rentan menjadi korban atau pelaku bullying [5]. Hal ini didukung dengan penelitian yang menunjukkan bahwa 188 siswa SMP dari 3 sekolah di Surabaya, Jawa Timur, Indonesia pernah menjadi pelaku, korban, ataupun keduanya [6]. Penelitian lebih lanjut menunjukkan bahwa intensitas bullying turut dipengaruhi oleh persepsi negatif pelaku terhadap bystander yang berpikir bahwa bystander akan membiarkan pelaku atau justru mendukung perilaku bullying .

Adanya keterkaitan basis sensitivitas moral, lepasnya moralitas, dan self-efficacy menentukan apakah siswa akan bertindak sebagai bystander, defender, atau probully pada siswa SMP. Penelitian menunjukkan bahwa basis sensitivitas moral berkontribusi negatif terhadap lepasnya moralitas, sehingga siswa yang memiliki basis sensitivitas moral yang rendah akan mengakibatkan tindakan diluar moral yang justru akan cenderung mendukung pelaku bullying. Jika basis sensitivitas moral tinggi namun memiliki self-efficacy yang rendah, siswa akan cenderung bertindak pasif sebagai bystander. Sebaliknya, jika sensitivitas moral tinggi dan disertai dengan self-efficacy yang juga tinggi, siswa akan cenderung bertindak sebagai defender [7]. Penelitian juga menunjukkan bahwa individu dan kelas yang mendukung norma anti-bullying akan cenderung membela korban bullying. Selain itu, diungkapkan bahwa perempuan cenderung lebih mendukung norma anti-bullying,serta memiliki kelepasan moralitas lebih rendah daripada laki-laki .

Penelitian terdahulu mengungkapkan realita bahwa adanya respon aktif bystander berkontribusi terhadap intensitas bullying pada siswa SMP. Perilaku bullying semakin berkurang jika semakin banyak teman sebaya yang membela korban [8]. Hal ini menunjukkan bahwa respon pasif bystander perlu diubah agar dapat mendukung perilaku anti-bullying [9]. Selain itu, penelitian menunjukkan bahwa korban bullying seringkali mencari bantuan pihak lain [10]. Dalam hal ini, bantuan atau kontribusi positif bystander seharusnya diberikan kepada korban bullying. Hal ini dikareanakan penelitian menunjukkan bahwa korban bullying yang mendapat bantuan dari bystander, yang berasal dari pihak teman sebaya, memberikan korban persepsi positif mengenai lingkungan sekolah sehingga akan turut meningkatkan subjective well-being korban . Penelitian juga menunjukkan bahwa adanya dukungan sosial bystander dapat meningkatkan kepercayaan diri korban bullying .

Sebagai upaya mengukur fenomena bystander effect siswa dalam bullying, para peneliti telah merancang instrumen-instrumen penelitian. Instrumen Bystander Intervention Model For Bullying And Sexual Harassment dirancang dengan tujuan untuk mengukur proses struktural intervensi bystander [11]. Instrumen Bullying Participant Behavior Questionnaire (BPBQ) disusun untuk menentukan kecenderungan sikap siswa dengan klasifikasi sebagai bully, assistant, victim, defender, dan outsider di US [12]. Participant Role Questionnaire (PRQ) juga disusun untuk menentukan kecenderungan sikap siswa, akan tetapi memiliki susunan yang berbeda dengan BPBQ, yakni bully, assistant, reinforcer, defender, dan outsider . Instrumen yang diciptakan oleh para peneliti sebelumnya menunjukkan kecenderungan sikap dari perspektif siswa secara keseluruhan dalam kasus bullying. Meski demikian, hampir tidak ada instrumen yang meninjau kecenderungan sikap dalam kasus bullying yang secara spesifik berdasarkan perspektif para siswa bystander.

Instrumen School Bystander Behaviour Scale (SBBS) adalah instrumen yang dapat mengukur kecenderungan sikap siswa dalam kasus bullying yang secara spesifik berdasarkan perspektif para siswa bystander. Instrumen ini dapat mengukur dan mengklasifikasikan kecenderungan sikap siswa sebagai bystander pasif, defender, dan probully. Klasifikasi pada instrumen ini didasarkan dari temuan sebelumnya yang menunjukkan bahwa hubungan antara basis sensitivitas moral, lepasnya moralitas, dan self-efficacy menentukan bagaimana kecenderungan sikap siswa bystander. Instrumen ini dikembangkan di Swedia dengan 347 remaja (141 laki laki dan 206 perempuan) dengan rentang usia 15-20 tahun sebagai partisipan. Partisipan yang dipilih adalah mereka yang pernah menyaksikan atau terlibat dalam bullying di sekolah. Instrumen ini memiliki 8 aitem soal yang dengan menggunakan 5-basis point skala likert sebagai pilihan jawaban. Exploratory Factor Analisis menunjukkan bahwa aitem-aitem dalam instrumen ini memiliki loading factor yang dapat diterima yakni, probully (0,53-0,87), bystander (0,55-0,90), dan defender (0,70-0,80) [7]..

Adaptasi instrumen School Bystander Behaviour Scale (SBBS) pernah dilakukan di Asturias, Spanyol dengan 1,018 siswa sebagai partisipan yang memiliki rentang usia 9-11 tahun. Adaptasi dilakukan dengan mengikutsertakan siswa yang belum pernah menyaksikan bullying, menambahkan 2 aitem (1 aitem bystander dan 1 aitem defender) sehingga jumlah keseluruhan aitem menjadi 10, dan mengubah format respon menjadi dikotomi (Ya/Tidak). Confirmatory Factor Analysis menunjukkan loading factor yang dapat diterima, yakni probully (0,70-0,89), bystander (0,63-0,83), dan defender (0,62-0,71). Reliabilitas final yang dimiliki probully = 0,85, bystander = 0,81, dan defender = 0,75 [13].

Instrumen School Bystander Behaviour Scale (SBBS) belum pernah menjadi subjek penelitian di Indonesia. Hal ini menjadi penting karena bahasa dapat mempengaruhi interpretasi, pengambilan keputusan, dan strategi [14]. Oleh karena itu, skala ini memerlukan adaptasi agar sesuai dengan konteks bahasa Indonesia. Selain itu, penelitian adaptasi instrumen SBBS belum pernah menggunakan pendekatan analisis Rasch Model. Penelitian dengan pendekatan rasch model penting dilakukan karena rasch model dapat mengungkap indeks reliabilitas item setiap level, reliabilitas responden, unidimensionalitas, dan bias pada item . Oleh karena itu, penelitian ini bertujuan untuk mengembangkan instrumen dengan metode adaptasi untuk mengukur kecenderungan sikap siswa bystander pada jenjang pendidikan SMP di Indonesia dengan metode analisis rasch model.

Metode

Penelitian ini merupakan penelitian adaptasi alat ukur dengan pendekatan kuantitatif menggunakan desain forward translation. Untuk melakukan adaptasi alat ukur terdapat beberapa tahap yang harus dipenuhi, yakni: (1) translasi; (2) sintesis; (3) expert committee review [15]. Pendekatan kuantitatif adalah pendekatan yang menggunakan angka-angka dan analisis statistik [16]. Adapun variabel yang terdapat pada penelitian ini adalah bystander effect.

Populasi pada penelitian ini adalah siswa SMP Negeri 2 Pungging yang memiliki jumlah sebanyak 741 siswa. Batasan jumlah sampel pada penelitian ini ditentukan berdasarkan ketentuan 5% margin of error yang dirumuskan. Adapun populasi memiliki tingkatan strata kelas 7, 8, dan 9, sehingga teknik pengambilan sampel yang digunakan adalah proportionate stratified random sampling. Teknik ini sesuai karena target populasi bersifat heterogen dan memiliki strata yang proporsional [17]. Sampel dari masing-masing strata kelas dipilih secara acak dengan pembagian sebagai berikut :

Kelas Jumlah Siswa Jumlah Sampel
7 251 87
8 244 80
9 246 84
Total 741 251
Table 1. Tabel 1. Pembagian jumlah sampel

Ekstraksi data dilakukan dengan instrumen yang disusun oleh peneliti dengan metode adaptasi dari instrumen pengukuran yang disusun oleh Suárez-García, dkk. berdasarkan instrumen asli yang dirancang Thornberg & Jungert yang bernama School Bystander Behaviour Scale (SBBS). Instrumen inidapat mengkategorisasikan tiga jenis perilaku bystander dalam bullyingyakni bystanderpasif, defender, dan probully.Instrumen SBBS memenuhi standar dengan memiliki model-fit (N = 347; CFI = .92; S-BSS = 258.44 df = 144; RMSEA = .048, 90% CI [0.04, 0.06]) dengan loading factor bystander pasif (0,63-0,83), defender (0,62-0,71), dan probully (0,70-0,89) probully[13]. Adaptasi instrumen pada penelitian ini menggunakan butir respon rating scale dengan 4 poin skala Likert dengan skor 1 sebagai nilai minimum dan skor 4 sebagai nilai maksimum. Butir respon diisi dengan ceklist terhadap 4 pilihan pernyataan Sangat Sesuai (SS), Sesuai (S), Tidak Sesuai (TS), dan Sangat Tidak Sesuai (STS).

Aspek dari instrumen yang diadaptasi terbagi menjadi 3, yakni bystanderpasif, defender, dan probully. Ketiga aspek ini terdiri dari beberapa aitem sebagai indikator perilaku yang ditunjukkan oleh tabel di bawah ini :

Aspek Indikator perilaku
Bystanderpasif 1, 7, 8
Defender 2, 3, 4, 6
Probully 5, 9, 10
Table 2. Tabel 2. Aspek dan indikator perilaku pada aitem

Adapun instrumen final hasil adaptasi adalah sebagai berikut :

Angket “Skala Perilaku Siswa BystanderUntuk Siswa Sekolah Menengah PertamaPerundungan (Bullying) adalah istilah untuk menggambarkan situasi dimana seorang siswa menjadi korban berbagai jenis agresi dari waktu ke waktu di sekolah, yang dilakukan oleh siswa lain. Jenis agresi tersebut seperti mengolok-olok, menghina, mengancam, mengucilkan, menyembunyikan barang-barangnya, dst. Dalam situasi perundungan, korban berada dalam posisi yang lebih lemah dibandingkan pelaku (misalnya, lebih pemalu atau memiliki lebih sedikit teman). Jika kamu pernah menemui temanmu menjadi korban perundungan di kelas pada tahun ajaran ini, “apa yang kamu lakukan saat hal itu terjadi?”, tandai pilihan dibawah. Jika kamu belum pernah melihat temanmu menjadi korban perundungan di kelas pada tahun ajaran ini, “apa yang akan kamu lakukan seandainya kamu melihat temanmu menjadi korban perundungan?”, tolong tandai pilihan dibawah.
Table 3. Tabel 3. Instrumen final hasil adaptasi

Teknik analisis data pada penelitian ini menggunakan rasch model untuk mendapatkan informasi mengenai kualitas instrumen yang digunakan. Peneliti menggunakan raschmodel dikarenakan rasch model memenuhi lima standar kriteria, yakni; (1) ukuran linear dengan interval yang sama; (2) proses estimasi yang tepat: (3) dapat menemukan aitem yang tidak tepat (misfits) atau tidak umum (outliers); (4) dapat mengatasi data yang hilang; (5) menghasilkan pengukuran yang replicable [18]. Adapun rekapitulasi data mentah dilakukan dengan bantuan software Microsoft Excel dan analisis data menggunakan rasch model dilakukan dengan bantuan software Winstep

Hasil dan Pembahasan

1. Hasil Penelitian

A. Validitas

Uji validitas instrumen dilaksanakan dengan menganalisis hasil uji unidimensionalitas, item misfit order, Wright map (guna menunjukkan distribusi item-person), serta category function.

a . Unidimensionalitas

Hasil uji unidimensionalitas dalam rasch model menunjukkan apakah instrumen dapat mengukur konstruk yang seharusnya diukur. Dalam hal ini, instrumen yang memiliki unidimensionalitas yang baik merupakan instrumen yang dapat mengukur hanya satu konstruk yang dimaksud saja [19].

Figure 1. Tabel 4. Hasil pengujian unidimensionalitas

Hasil uji unidimensionalitas pada tabel 4 menunujukkan raw variance explained by measures memiliki nilai = 59,9% (50-60%). Raw variance explained by measure merupakan proporsi dari varians total dalam data yang dapat dijelaskan oleh pengukuran yang telah dilakukan [20]. Nilai persentase sebesar 59,9% menandakan bahwa instrumen cukup dapat mengukur konstruk yang seharusnya diukur. Nilai ini juga menunjukkan bahwa varians total data mengenai konstruk yang seharusnya diukur cukup banyak dalam pengukuran yang telah dilakukan. Selain itu, terdapat unexplained variance in 1st-5thcontrast yang menunjukkan residual berupa varians lain yang turut terukur dengan nilai yang tidak boleh melebihi 15% [18]. Nilai unexplained variance pada 1st contrast = 11,7%, 2nd contrast = 4,8%, 3rd contrast = 4,4%, 4th contrast = 4,1%, dan 5th contrast = 3,5%. Berdasarkan hasil tersebut, tidak terdapat nilai yang melebihi 15% pada unexplained variance in 1st-5th contrast. Ini berarti varians lain yang turut diukur oleh instrumen masih dalam batas yang dapat diterima. Lebih lanjut, hal ini juga menunjukkan bahwa instrumen memiliki local independence yang masih cukup tidak terpengaruh dengan varians lain di luar konstruk.

b . Item Mis fit Order

Hasil pada item misfit order yang bertujuan untuk mengevaluasi kecocokan (fit) dari setiap aitem dalam instrumen ini [21]. Outfit MNSQ pada item misfit order menunjukkan deviasi outlier aitem dengan nilai range 0,5 ≤ x ≤ 1,5 pada aitem individual [22].

Figure 2. Tabel 5. Hasil pengujian item misfitorder

Berdasarkan hasil analisis item misfit order pada tabel 5, menunjuukan bahwa nilai Outfit MNSQ pada setiap aitem berada dalam rentang 0,5 ≤ x ≤ 1,5. Outfit MNSQ menunjukkan besar statistik outlier (respon yang ekstrem dan tidak terduga sehingga jauh dari ekspektasi) yang bersifat deskriptif pada rasch model [18]. Dikarenakan semua nilai Outfit MNSQ berada dalam rentang standar, hal ini memiliki arti bahwa semua aitem pada instrumen SBBS yang telah diadaptasi memiliki outlier yang bersifat deskriptif yang dapat diterima oleh rasch model. Adapun aitem yang memiliki nilai Outfit MNSQ terbesar terdapat pada aitem D3 dengan nilai = 1.47.

Outfit ZSTD bertujuan untuk mengidentifikasi outlier aitem yang tidak fit dengan model rasch yang mana memiliki standar nilai -2.0 ≤ x ≤ 2.0 [23]. Outfit ZSTD bersifat inferensial sehingga Outfit ZSTD memberikan pemahaman mengenai signifikansi terhadap aitem yang tidak fit dengan rasch model . Dalam hal ini, hasil penelitian menunjukkan bahwa terdapat 4 aitem yang tidak fit dengan model rasch, yakni aitem B2 (-2,38), B3 (-3,17), D2 (2,91) dan D3 (4,76). Oleh karena itu, aitem B2, B3, D2, dan D4 memerlukan kajian ulang agar dapat memenuhi kriteria OutfitZSTD.

Nilai yang ditunjukkan point measure correlation menunjukkan daya beda aitem dengan range nilai standar = 0,4 ≤ x ≤ 0,85 [24]. Hasil point measure correlation menunjukkan bahwa terdapat beberapa aitem pada instrumen penelitian yang tidak memenuhi standar, yakni aitem B1 (0,17), D1 (0,14), D2 (0,22), D3 (0,15), dan D4 (0,30). Hal ini menandakan bahwa aitem-aitem tersebut memiliki daya beda yang kurang baik sehingga kurang dapat membedakan tingkat kemampuan responden.

JMLE Measure memberikan petunjuk untuk menentukan mana aitem yang paling mudah dan paling sulit disetujui oleh responden. Aitem dengan nilai logit yang tinggi memiliki arti bahwa aitem tersebut lebih sulit untuk disetujui. Hal ini berkorespondensi dengan kemampuan responden di mana responden yang memiliki kemampuan lebih tinggi, cenderung dapat memberikan respon yang memiliki skor tinggi pada aitem yang sulit disetujui [18]. Berdasarkan data JMLE Measure yang didapatkan menunjukkan bahwa nilai rata-rata standar deviasi logit aitem = +145. Adapun nilai logit tertinggi terdapat pada aitem P1 = +194 dan nilai logit terendah terdapat pada aitem D2 = -181. Hal ini memiliki arti bahwa aitem P1 adalah aitem paling sulit disetujui, sedangkan aitem D2 merupakan aitem yang paling mudah disetujui.

c . Wright Map

Hasil Wright map memuat distribusi item-person yang merupakan visualisasi pemetaan untuk mengetahui distribusi tingkat kesulitan aitem dan kemampuan individu yang mana hal ini juga menunjukkan seberapa baik hubungan di antara keduanya. Bagian kanan map memuat aitem yang diujikan, sedangkan bagian kiri memuat responden. Sumbu vertikal menunjukkan tingkat kesulitan aitem yang sesuai dengan tingkat kemampuan responden pada sumbu horizontal. Aitem-aitem yang sulit dan membutuhkan kemampuan tinggi responden terletak di bagian atas map, sedangkan aitem-aitem yang mudah dan tidak membutuhkan kemampuan tinggi responden terletak di bagian bawah map. Selaras dengan tingkat kesulitan aitem, responden yang memiliki kemampuan tinggi terletak di bagian atas map, sedangkan responden yang memiliki kemampuan rendah terletak di bagian bawah map [25].

Figure 3. Gambar 1. Wrightmap

Gambar 1 menunjukkan bahwa terdapat sebaran aitem yang tidak proporsional. Pada kotak merah menunjukkan bahwa terdapat gap berupa kekosongan aitem akan tetapi terdapat responden yang berada dalam range kekosongan tersebut. Hal ini mengakibatkan hasil pengukuran kemampuan beberapa responden menjadi kurang terwakilkan karena aitem yang tersedia belum mencukupi. Sebagai contoh yakni dalam kotak ungu, terdapat beberapa responden yang terletak pada range kekosongan tersebut. Kemampuan responden yang telah diukur dalam kotak ungu menjadi kurang detail dan akurat akibat tidak adanya aitem yang mewakilkan kemampuan responden tersebut. Dalam mengatasi hal ini, diperlukan adanya aitem untuk mengisi gap yang ada. Selain itu, terdapat aitem yang memiliki tingkat kesulitan yang tidak jauh berbeda, yakni aitem D1, D3, dan D4. Selain itu, terdapat pula aitem D2 yang memiliki tingkat kesulitan yang hampir sama dengan aitem D1 dan D3, dan aitem P2 yang hampir sama dengan B1.

Hasil Wright map pada gambar 1 juga menunjukkan sebaran item-person yang tidak merata dengan mayoritas responden terkumpul di bagian bawah map. Hal ini menunjukkan bahwa sedikit responden yang dapat menjawab dengan benar. Adapun responden rata-rata hanya dapat menjawab 2 soal benar (skor 4) dari 10 soal yang diujikan. Jika diperhatikan dengan lebih detail, terdapat 1 responden yang memiliki kemampuan sangat tinggi, yakni responden ke-232 yang terletak pada bagian paling atas map dengan nilai logit +243. Hal ini menandakan bahwa responden ke-232 dapat menjawab mayoritas soal dengan benar. Terdapat pula 5 responden yang memiliki kemampuan sangat rendah, yakni responden ke-107, ke-176, ke-195, ke-220, dan ke-226 yang terletak pada bagian paling bawah map dengan nilai logit = -187. Adapun responden ke-226 hanya dapat menjawab benar pada 2 soal, responden ke-176 dan ke-195 hanya dapat menjawab benar pada 1 soal, dan responden ke-107 dan ke-220 tidak dapat menjawab benar pada semua soal.

Figure 4. Tabel 6. Hasil pengujian person measure

Figure 5. Tabel 6. Hasil pengujian person measure

Dari tabel 6 diketahui bahwa nilai logit rata-rata responden = -45 yang mana hal ini lebih rendah dari nilai logit rata-rata aitem (0,0). Nilai ini juga sesuai dengan gambar 1 di mana nilai mean person (M) berada di bawah mean aitem (+M). Hal ini menandakan bahwa rata-rata responden memiliki kemampuan yang lebih rendah dibandingkan tingkat kesulitan aitem.

d . Category Function

Instrumen yang digunakan dalam penelitian ini menggunakan rating scale, sehingga perlu untuk menilai kualitas butir respon melalui pengujian category function. Category function meniliai kualitas butir respon rating scale yang berkorespondensi dengan tingkat kemampuan responden [26].

Figure 6. Tabel 7. Hasil pengujian category function

Kolom category measure pada tabel 7 menunjukkan bahwa butir respon memiliki nilai category measure yang semakin naik dengan butir respon skor 1 memiliki nilai = -2,71, skor 2 = - 0,88, skor 3 = 0,82, dan skor 4 = 2,82. Nilai ini menunjukkan bahwa kesesuaian respon yang diberikan responden meningkat sesuai dengan rata-rata tingkat kemampuan yang dimiliki, sehingga semakin tinggi kemampuan yang dimiliki responden, maka responden akan semakin cenderung menjawab butir dengan skor 4. Selain itu, nilai dari kolom category measure menunjukkan bahwa butir respon skor 1 hingga skor 4 tertata secara runut.

Kolom observed score count % di tabel 7 menunjukkan bahwa semua butir respon pada instrumen yang diujikan telah terisi. Butir respon dengan skor 1 paling banyak dipilih dengan persentase sebesar 29% dari jumlah keseluruhan, sedangkan butir respon dengan skor 4 paling sedikit dipilih dengan persentase 15%. Ini menunjukkan bahwa responden yang memiliki tingkat kemampuan yang tinggi lebih sedikit daripada responden yang memiliki tingkat kemampuan yang rendah.

Figure 7. Gambar 2. Hasil pengujian empirical item-category function

Hasil uji empirical item-category function pada gambar 2 menunjukkan secara detail bahwa terdapat beberapa pilihan jawaban dengan susunan skor yang tidak berurutan. Aitem yang memiliki susunan skor yang tidak berurutan adalah aitem B1 (1-3-2-4) dan aitem D3 (2-1-3-4). Hal ini menunjukkan arti bahwa aitem B1 dan aitem D3 merupakan aitem yang memiliki respon yang membingungkan responden. Selain itu, mayoritas aitem memiliki range skor yang tidak cukup jauh sehingga kurang dapat membedakan tingkat kemampuan responden.

e . Person Mis fit Order

Hasil pengujian person misfit order menunjukkan responden yang tidak fit dengan rasch model. Untuk menentukan fit atau tidaknya responden, nilai Infit MNSQ dan Outfit MNSQ digunakan sebagai acuan. Baik Infit MNSQ dan Outfit MNSQ harus berada dalam rentang standar ( -1 ≤ x ≤ 1 ) agar seorang responden dinyatakan fit dengan rasch model [27].

Figure 8. Tabel 8. Hasil uji person misfitorder

Tabel 8 menunjukkan bahwa terdapat 62 responden yang tidak fit dengan rasch model. Hasil uji person misift order pada penelitian mengakibatkan adanya noise pada hasil pengukuran. Terdapat 5 hal yang dapat menyebabkan responden tergolong dalam kelompok yang tidak fit dengan model. Menurut Karabatsos (2003) hal tersebut yakni, 1) menyontek; 2) kurang teliti; 3) tebakan yang benar; 4) respon yang berlebihan; 5) menjawab dengan acak [28]. Nilai Infit MNSQ tertinggi (6,43) dan nilai OutfitMNSQ tertinggi (7,28) dimiliki oleh responden nomor 147.

B . Reliabilitas

Hasil uji statistik menunjukkan hasil pengujian reliabilitas pada setiap jenis kelompok aitem. Pengujian ini diperlukan untuk mengetahui kualitas instrumen agar dapat digunakan kapanpun dan dimanapun [29]. Perlu diketahui bahwa terdapat dua jenis reliabilitas pada pengujian reliabilitas menggunakan rasch model, yakni reliabilitas aitem dan reliabilitas person. Reliabilitas aitem menunjukkan konsistensi aitem dalam mengukur kemampuan individu, sedangkan reliabilitas person menunjukkan konsistensi responden dalam memberikan respon pada setiap aitem [30].

Figure 9. Tabel 9. Hasil Pengujian Reliabilitas

Pada hasil uji statistik dalam tabel 9 menunjukkan bahwa nilai reliablitas aitem = 1,00 (> 0,94) dan nilai reliabilitas person = 0,33 (< 0,67). Nilai reliabilitas aitem menandakan bahwa aitem pada instrumen bersifat sangat reliabel. Kemudian, nilai reliabilitas person menandakan bahwa responden memiliki konsistensi jawaban yang lemah. Meski reliablitas aitem menunjukkan angka yang tinggi, perlu diingat bahwa beberapa aitem instrumen memerlukan pengkajian ulang.

Pada hasil uji statistik juga memuat dua jenis nilai separation. Nilai item separation berguna untuk untuk menunjukkan rentang tingkat kesulitan aitem secara keseluruhan pada setiap kelompok aitem [18]. Aitem pada instrumen memiliki nilai item separation = 14,37 (> 5) yang menandakan bahwa aitem pada instrumen ini memiliki rentang tingkat kesulitan yang sangat bervariasi secara umum. Nilai person separation berfungsi untuk mengetahui tingkat variasi kemampuan responden pada setiap kelompok aitem [18]. Hasil uji menunjukkan bahwa responden memiliki nilai person separation = 0,69 (< 2). Hal ini secara umum menandakan bahwa kemampuan yang dimiliki responden kurang variatif.

Infit MNSQ menunjukkan informasi statistik inlier (respon yang relevan dan konsisten dengan kemampuan individu atau disebut range normal dari ekspektasi model). Baik Infit MNSQ dan Outfit MNSQ memiliki nilai ideal = 1,00 [18]. Hasil analisis menunjukkan bahwa nilai item Infit MNSQ = 1.00, Outfit MNSQ = 1.00 dan nilai person Infit MNSQ = 0,99, Outfit MNSQ = 1,00. Dikarenakan kedua hasil pengukuran baik pada aitem dan person, mendekati nilai ideal, dapat disimpulkan bahwa secara umum, seluruh aitem instrumen SBBS dan respon responden memenuhi model rasch dengan baik.

2. Pembahasan

Hasil penelitian menunjukkan bahwa instrumen SBBS yang telah diadaptasi memiliki unidimensionalitas dan local independence yang cukup baik, namun terdapat beberapa aitem yang tidak fit dengan rasch model. Instrumen cukup baik dalam mengukur konstruk yang seharusnya diukur dan cukup tidak terpengaruh oleh varians lain di luar konstruk. Perbandingan dengan hasil uji Confirmatory Factor Analysis juga menunjukkan bahwa instrumen ini memiliki validitas konstruk yang baik dengan nilai loading factor berkisar antara 0,62-0,89. Selain itu, nilai Average Variance Extracted (AVE) pada aspek-aspeknya memiliki nilai bystander = 0,586, defender = 0,430, dan probully = 0,657. Aspek defender memiliki nilai agak rendah (x < 0,5) namun masih dapat diterima karena memiliki composite reliability yang baik dengan nilai 0,751 [13]. Hal ini menujukkan bahwa aitem-aitem pada instrumen tersebut memiliki kontribusi kuat dalam mewakili konstruknya dan sejalan dengan hasil pengujian unidimensionalitas. Meski demikian, beberapa aitem penelitian ini tidak memenuhi pengujian item misfit order karena terdapat beberapa aitem yang memiliki nilai Outfit ZSTD melebihi standar ( x > 2,0), yakni aitem B2 = -2,38, B3 = -3,17, D2 = 2,91, dan D3 = 4,76. Hal ini menunjukkan bahwa aitem-aitem tersebut memiliki statistik outlier yang tinggi dan di luar prediksi rasch model.

Terdapat lima aitem yang memiliki daya beda yang kurang baik, yakni aitem B1, D1, D2, D3, dan D4. Kelima aitem tersebut memiliki nilai point measure correlation di bawah standar (x < 0,4) dengan nilai pada aitem B1 = 0,17, D1 = 0,14, D2 = 0,22, D3 = 0,15, dan D4 = 0,30. Perlu diperhatikan bahwa hasil uji point measure correlation ini telah mengeliminasi semua aitem sikap defender sehingga tidak ada satupun aitem yang tersisa pada aspek tersebut. Hal ini berbeda dengan hasil pengujian Confirmatory Factor Analysis yang menunjukkan bahwa aitem-aitem pada instrumen ini memiliki daya beda yang baik karena memiliki loading factor yang mencukupi [13].

Perbedaan daya beda aitem yang didapatkan berasal dari pemilihan diksi yang kurang sesuai untuk usia responden. Hal ini diperkuat dengan temuan penelitian yang menunjukkan bahwa mayoritas responden memiliki kemampuan lebih rendah dibanding tingkat kesulitan aitem, yang mana hal ini mengindikasikan bahwa mayoritas responden kurang dapat memahami aitem-aitem pada instrumen penelitian. Peninjauan terhadap butir respon pada empirical item-category function juga menunjukkan bahwa butir respon memiliki jarak yang cukup dekat yang mengindikasikan bahwa butir respon kurang dapat membedakan kemampuan responden dengan baik. Selain itu, responden juga menunjukkan kebingungan terhadap butir respon pada aitem B1 dan D3 dikarenakan aitem-aitem tersebut memiliki susunan skor yang terbalik pada hasil uji empirical item-category function. Selain itu, hasil uji person misfit order menunjukkan bahwa terdapat 62 responden yang tidak fit dengan rasch model. Responden yang tidak fit mengakibatkan noise sehingga instrumen mengukur hal-hal lain yang tidak seharusnya diukur.

Meskipun hasil penelitian menunjukkan bahwa beberapa aitem pada instrumen penelitian bersifat kurang valid dan memerlukan pengkajian ulang, aitem pada instrumen yang digunakan dalam penelitian ini memiliki tingkat kesulitan aitem yang baik. Hal ini didasarkan pada nilai item separation = 14,37 (> 5) yang menunjukkan bahwa instrumen penelitian memiliki variasi tingkat kesulitan yang tinggi. Selain itu, instrumen juga bersifat sangat reliabel dengan nilai reliablitas aitem = 1,00 (> 0,94). Ini menunjukkan bahwa instrumen sangat konsisten dalam mengukur kemampuan responden.

Sebagaimana yang telah dibahas sebelumnya, beberapa aitem pada instrumen ini memiliki validitas yang kurang baik dikarenakan pemilihan diksi kurang sesuai untuk usia responden dan adanya noise dari berasal dari responden yang tidak fit dengan rasch model. Oleh karena itu, dibutuhkan pengkajian ulang terhadap aitem-aitem pada instrumen agar dapat memperbaiki masalah ini. Selain itu, peneliti menemukan bahwa terdapat kecurangan dan kebingungan pada diri responden ketika proses pengumpulan data. Pemberian pengawasan dan pemahaman yang lebih baik ketika proses pengumpulan data juga dapat menjadi solusi guna meminimalisir kecurangan dan ketidakpahaman responden terhadap aitem-aitem pada instrumen.

Kesimpulan

Pengembangan instrumen penelitian dengan metode adaptasi terhadap instrumen School Bystander Behaviour Scale (SBBS) untuk mengukur kecenderungan sikap siswa bystander dalam bullying di Indonesia dengan metode analisis rasch model menunjukkan bahwa beberapa aitem pada instrumen SBBS yang telah diadaptasi kurang dapat menunjukkan performa yang baik dikarenakan memiliki validitas yang kurang baik. Meski demikian, secara keseluruhan, instrumen memiliki validitas yang cukup karena bersifat unidimenisional dan cukup memiliki local independence sehingga instrumen dapat menukur konstruk yang dimaksud dan cukup tidak terpengaruh varians lain di luar konstruk. Hasil uji reliabilitas juga menunjukkan bahwa reliabilitas yang dimiliki instrumen tergolong sangat tinggi sehingga instrumen bersifat sangat reliabel serta memiliki aitem dengan tingkat kesulitan yang sangat bervasiasi. Oleh karena itu, direkomendasikan pengkajian lebih lanjut terhadap beberapa aitem agar instrumen ini dapat memberikan sifat psikometrik dan performa yang lebih baik. Pemberian pemahaman dan pengawasan yang lebih baik kepada responden ketika proses pengumpulan data juga dapat menjadi solusi guna meminimalisir ketidakpahaman dan kecurangan yang mungkin dilakukan oleh responden yang mana hal ini akan berkontribusi terhadap berkurangnya noise pada temuan penelitian. Selain itu, direkomendasikan untuk melakukan penelitian Confirmatory Factor Analysis terhadap instrumen yang telah diadaptasi dalam Bahasa Indonesia ini. Penelitian dengan populasi yang berbeda juga disarankan karena nilai dan norma yang berada di suatu daerah dapat berbeda dengan daerah lainnya sehingga dapat mempengaruhi bystander effect.

Ucapan Terima Kasih

Peneliti mengucapkan terima kasih sepenuh hati kepada instansi SMP Negeri 2 Pungging, Mojokerto, atas izin yang diberikan untuk melaksanakan penelitian di sekolah ini dan seluruh siswa SMP Negeri 2 Pungging, Mojokerto, yang bersedia menjadi responden penelitian dan berpartisipasi aktif dalam pengumpulan data.

References

[1] P. Fischer, A. Krueger, T. Greitemeyer, C. Vogrincic, A. Kastenmüller, D. Frey, and M. Heene, “The Bystander Effect: A Meta-Analytic Review on Bystander Intervention in Dangerous and Non-Dangerous Emergencies,” Psychological Bulletin, vol. 137, no. 4, pp. 517–537, 2011.

[2] J. Hudson and A. Bruckman, “The Bystander Effect: A Lens for Understanding Patterns of Participation,” Journal of the Learning Sciences, vol. 13, pp. 165–195, Apr. 2004.

[3] A. Halimah, A. Khumas, and K. Zainuddin, “Bystander Perceptions of Bullying Intensity Among Junior High School Students,” Jurnal Psikologi, vol. 42, p. 129, Aug. 2015.

[4] E. Haru, “Bullying Behavior Among Students,” Jurnal Alternatif Wacana Ilmiah Interkultural, vol. 11, no. 2, 2022.

[5] A. Prasetyo, “School Bullying and Its Impact on Children’s Future,” El-Tarbawi, vol. 4, pp. 19–26, Jan. 2014.

[6] N. Karisma, A. Rofiah, S. Afifah, and Y. Manik, “Adolescent Mental Health and Suicide Trends: Community Roles in Addressing Bullying in Indonesia,” Edu Cendikia Journal of Education, vol. 3, pp. 560–567, Jan. 2024.

[7] W. D. Lestari, T. M. Anggriana, and B. D. Pratama, “Empathy and Bystander Effect on Prosocial Behavior of Junior High School Students,” Proceedings of National Seminar on Guidance and Counseling, vol. 4, no. 1, May 2022.

[8] M. B. A. Tumon, “Descriptive Study of Bullying Behavior in Adolescents,” Calyptra, vol. 3, no. 1, Sept. 2014.

[9] R. Thornberg and T. Jungert, “Bystander Behavior in Bullying Situations: Moral Sensitivity, Moral Disengagement, and Defender Self-Efficacy,” Journal of Adolescence, vol. 36, pp. 475–483, Mar. 2013.

[10] R. Thornberg, T. Pozzoli, and G. Gini, “Defending or Remaining Passive as a Bystander of School Bullying in Sweden,” Journal of Interpersonal Violence, vol. 37, pp. 1–24, Aug. 2021.

[11] C. Salmivalli, “Bullying and the Peer Group: A Review,” Aggression and Violent Behavior, vol. 15, pp. 112–120, Mar. 2010.

[12] S. Padgett and C. Notar, “Bystanders Are the Key to Stopping Bullying,” Universal Journal of Educational Research, vol. 1, pp. 33–41, Aug. 2013.

[13] N. M. D. Sulistiowati et al., “Bullying Behavior and Help-Seeking Among Junior High School Students in Denpasar,” Journal of Psychiatric Nursing, vol. 5, no. 1, Jan. 2022.

[14] S. F. D. Maharani and I. S. Borualogo, “School Climate and Subjective Well-Being of Cyberbullying Victims,” Bandung Conference Series Psychology Science, vol. 2, no. 2, pp. 622–631, July 2022.

[15] R. A. Sestiani and A. Muhid, “Social Support and Self-Confidence of Bullying Survivors: A Literature Review,” Tematik, vol. 2, no. 1, Jan. 2022.

[16] A. Nickerson, A. Aloe, J. Livingston, and T. Feeley, “Measurement of the Bystander Intervention Model,” Journal of Adolescence, vol. 37, pp. 391–400, June 2014.

[17] M. Demaray et al., “Bullying Participant Behaviors Questionnaire (BPBQ),” Journal of School Violence, vol. 15, Dec. 2014.

[18] F. Goossens and T. Olthof, “The New Participant Role Scales,” SAGE Journals, vol. 26, pp. 146–151, Apr. 2017.

[19] Z. Suárez-García, R. Thornberg, and D. Álvarez-García, “Validation of a Scale for Assessing Bystander Responses,” Psicothema, vol. 33, pp. 623–630, Oct. 2021.

[20] A. Costa, M. Vives, and J. Corey, “Language Processing in Decision Making,” Current Directions in Psychological Science, vol. 26, pp. 146–151, Apr. 2017.

[21] Y. E. Suryani, “Rasch Model Application in Evaluating IST,” Psikohumaniora, vol. 3, no. 1, Aug. 2018.

[22] D. E. Beaton et al., “Guidelines for Cross-Cultural Adaptation of Self-Report Measures,” Spine, vol. 25, no. 24, Dec. 2000.

[23] Sugiyono, Quantitative, Qualitative, and R&D Research Methods. Bandung: Alfabeta, 2017.

[24] I. Machali, Quantitative Research Methods. Yogyakarta: UIN Sunan Kalijaga, 2021.

[25] B. Sumintono and W. Widhiarso, Rasch Model for Quantitative Social Research. Surabaya, 2014.

[26] S. Golia and E. Brentari, “Unidimensionality in the Rasch Model,” Statistica, vol. 67, no. 3, pp. 253–261, Sept. 2007.

[27] F. M. Hamzah et al., “Rasch Model Analysis for Instrument Validity,” International Journal of Innovation, vol. 9, no. 7, 2019.

[28] G. Hamdu et al., “Item Quality Analysis Using Rasch Model,” Jurnal Pendidikan Indonesia, vol. 9, no. 1, Mar. 2020.

[29] K. P. Prayoga et al., “Rasch Model for Self-Control Instrument,” G-Couns Journal, vol. 9, no. 1, pp. 367–381, Aug. 2024.

[30] Y. Handayani et al., “Rasch Model for Concept Mastery Test,” Jurnal Ilmu Pendidikan Fisika, vol. 8, no. 2, pp. 226–239, May 2023.

[31] S. Hayati et al., “Rasch Analysis of Tashrif Lughawi Test,” Intelektualita, vol. 13, no. 1, July 2024.

[32] I. F. Apriani et al., “RASCH Model on Arithmetic Skills,” Dwija Cendekia, vol. 7, no. 2, Aug. 2023.

[33] I. Rivaldo et al., “Rasch Model in Chemistry Learning Instruments,” Indonesian Journal of Chemistry Education, vol. 6, no. 1, May 2022.

[34] Y. A. Rahman et al., “Person Fit Analysis Using Rasch Model,” Jurnal Pendidikan Bahasa, vol. 7, no. 2, July 2023.

[35] G. Karabatsos, “Aberrant Response Detection Performance,” Applied Measurement in Education, vol. 16, no. 4, pp. 277–298, 2003.

[36] A. Anggraini and M. Muntazhimah, “Development of Reflective Mathematical Thinking Instrument,” Aksioma Journal of Mathematics Education, vol. 10, no. 4, Dec. 2021.