PENILAIAN BELAJAR

PENILAIAN BELAJAR
A. Penilaian dalam Kelas 
Studi kasus dalam permulaan bab ini menggambarkan tugas dasar guru yang begitu sulit dalam bekerja yaitu penilaian-penilaian dalam kelas melibatkan semua proses alat yang digunakan guru dalam mengambil keputusan tentang kemajuan siswanya.

Termasuk pengamatan terhadap pekerjaan rumah siswa dan pekerjaan di . sekolah, respon siswa dalam menjawab pertanyaan, dan hasil tes yang dibuat oleh guru. Termasuk penilaian yang autentik seperti memperbaiki mesin pada siswa otomotif, mengajarkan kembali topik pada siswa, dan menyediakan bahan pelajaran.  

1. Fungsi Penilaian dalam Kelas  
Selain mengumpulkan informasi dan membuat keputusan tentang kemajuan belajar, penilaian memenuhi dua tujuan penting lainnya: (a) meningkatkan pembelajaran (b) peningkatan motivasi (Crooks, 1988). Belajar dan penilaian memiliki hubungan yang erat. Siswa belajar lebih banyak dalam kelas dimana penilaian adalah bagian integral pengajaran dari pada tanpa penilaian, singkatnya frekuensi penilaian adalah lebih efektif dari pada lamanya. (Bangert — Drowns, Kulik dan Kulik, 1991 Desember 1991; Kika, Molavghlin, dan Dixon, 1992.

Hubungan antara tes dan motivasi kontroversial sebab idealnya, siswa seharusnya termotivasi untuk belaiar dari keinginannya sendiri. Dan juga kritik yang berpendapat bahwa penilaian dapat mengurangi motivasi. Kenyataannya bagaimanapun, bukti bertentangan dengan argumen-argumen ini (Crooks, 1988). Penilaian adalah kendaraan untuk memberikan informasi ini, dan itu memberikan pengaruh yang kuat tidak hanya pada berapa banyak siswa belajar tetapi juga pada cara mereka belajar (Crooks, 1988). 

2. Pengukuran dan Evaluasi 
Dua proses mendasar yang terlibat dalam penilaian adalah pengukuran, yang termasuk semua informasi yang diukumpulkan oleh guru sebagai bagian dari proses penilaian. Dan Evaluasi, mengacu kepada keputusan yang diambil oleh guru dalam dasar pengukuran. 

Proses pemberian tingkatan tugas yang umumnya guru pikirkan sebagai evaluasi. Sebagai bagian proses dan hal lain yang perlu dipertimbangkan yaitu kapan menilai, bentuk penilaian, kapan mengajarkan kembali suatu topik. 

a. Pengukuran Formal dan Informal 
Pengukuran informal adalah pengukuran yang diambil secara insidental (tidak sengaja) seperti mendengar komentar dan jawahan siswa, melihat perhatian siswa. Sedangkan pengukuran formal adalah proses pengumpulan informasi secara sistematis. Tes dan kuis adalah pengukuran formal. Seperti pengamatan guru dalam mengamati banyaknya sit-ups yang siswa dapat lakukan. 

b. Kebutuhan akan Penilaian yang Sistematis 
Pengukuran informal sangat penting dalam membantu guru membuat keputusan instruksional yang sering diperlukan dalam setiap kelas. Kathi menggunakannya dalam membantu membuat keputusan kapan berhenti duduk- bekerja dan kapan waktunya memberi tes. Siapa yang semestinya mereka panggil, dan kapan rnereka seharusnya berhenti dari satu aktifitas dan pindah ke hal lain.

Pengukuran informal mempunyai umpan balik penting, sebab guru tidak mendapatkan informasi cara dari tiap siswa. Mereka tidak tahu tentang kemajuan tiap siswa. Menyimpulkan semua mengerti terhadap suatu ide dengan respon dari hanya beberapa siswa dapat menjadi salah. Tanpa sadar, guru terkadang membuat keputusan penting dengan dasar pengukuran informal. Siswa yang siap menjawab dan mempunyai personalitas sering diberi nilai dari pada mereka yang kurang. Lebih lanjut, siswa yang secara fisik lebih menarik dari pada yang lain dianggap lebih oleh gurunya (Rifts, Patterson, dan Tubbs, 1992).

Mengumpulkan informasi sistimatis tentang kemajuan tiap siswa adalah suatu cara mencegah terjadinya suatu bias. Penilaian sistimatis secara khusus penting pada tingkatan di bawah ”menengah” dimana guru sering mengandalkan penilaian pada penampilan seperti tulisan tangan, identifikasi verbal pada tulisan angka untuk membuat keputusan.  

c. Validitas : Membuat Keputusan tentang Evaluasi yang Tepat 
Validitas menggambarkan hubungan antara informasi yang dikumpulkan dan keputusan yang dibuat dari informasi (Shepard, 1993). Konsep validitas adalah jantung dari kontroversial dalam penilaian. Contoh, banyak kritik berpendapat bahwa tes standar akan menghasilkan bias dan sebagai hasilnya, tidak valid bagi siswa minoritas (Helms, 1992).

Guru yang memberi nilai rendah pada tulisan karena kotor adalah kriteria yang tidak valid. Dan hal ini dilakukan tanpa sadar, tanpa menyadari bahwa dasar penilaian guru pada penampilan bukan isi dari tulisan itu.

Tujuan dari diskusi ini adalah menekankan pada kesadaran dan kehatia-hatian dalam penilaian dibutuhkan dalam proses pengukuran. Guru yang terus mencari cara untuk rneningkatkan penilaian, menganalisa bentuk dari respon siswa, dan merevisi pengukuran mereka dan meningkatkan validitas dari sistem peniaian mereka. Ini adalah bagian dari tingkah laku refleksi. 

d. Reliabilitas: Konsistensi dalam Pengukuran  
Reliabilitas menggambarkan keadaan dimana pengukuran itu konsisten. Pergaruh dari pengskoran terhadap keterpercayaan digambarkan pada esai yang tidak terpercaya. Penelitian menunjukkan perbedaan pengajaran dengan latar berlakang yang sama (Lindeman dan Marenda, 1979). Ketika terjadi ketidak konsistensian kurang terpercaya membuatnya tidak valid.

Pengukuran informal sering tidak terpercaya, sebab, contohnya tidak semua siswa merespon pertanyaan yang sama, ketidakpastian pada wajah seorang siswa tidak bermaksud siswa lain bingung, jawaban yang cepat dan pasti dari seorang siswa tidak berarti seluruh kelas itu mengerti pada topik. Solusinva adalah penggunaan formal dan penilaian yang lebih terpercaya. 

3. Penilaian Tradisional 
Cara guru menilai belajar, dan cara umum sebagai bagian belajar akan terus dinilai, melalui penggunaan tes berantai dari guru. Ketika tes itu tersusun dan didesain dengan baik, menyediakan penilaian yang valid dari banyak aspek kemajuan siswa (Gronlund & Linn, 1995). 
a. Pola Penilaian Guru 
Pola penilaian guru yaitu sebagai berikut: Mengukur Penampilan Guru mengandalkan contoh pekerjaan siswa (kemampuan membentuk angka, menulis surat, mengevaluasi belajar siswa (Marso & Pigge, 1992).

Pengukuran Informal Pengambilan nilai pada pengukuran informal tidak memiliki jadwal yang teratur. Guru terkadang memberi latar belakang dan sosial karakteristik yang lebih pada pendekatan kemampuan. Tes Komersial Ketika mengerjakan tugas, guru sangat tergantung pada tes yang dipersiapkan dan diterbitkan secara komersial. 

b. Membuat Pola-pola Test yang Valid 
Soal menjadi valid, jika siswa mengerti jawaban soal dengan benar dan jika tidak mengerti akan salah. Jika kunci jawaban terdapat pada soal, maka siswa akan menjawab dengan benar tanpa memahami topik. Guru mengerti bahwa mereka mempunyai kesulitan dalam menulis soal yang efektif tapi percaya bahwa masalah dapat dikurangi melalui pelatihan dan kesadaran (Carter, 1986). 

Format soal dibedakan atas dua, pertama format jawaban dipilih yaitu siswa memilih jawaban yang benar dari daftar pilihan (pilihan guru). Benar-salah, menjodohkan, format supply yaitu siswa mengahasilkan jawaban sendiri melengkapi, dan essay (Stiggins, 1994). Kedua, mengukur objektivitas dimana kemampuan orang yang diuji akan mendapatkan skor yang sama. Contohnya pilihan ganda, dimana subjektivitas tes adalah satu yang dipengaruhi oleh pendapat dan penilaian orang yang memeriksa (essay tes). 

c. Item Pilihan Ganda 
Format pilihan ganda adalah salah satu yang paling efektif untuk mempersiapkan item yang valid dan dapat diandalkan pada tingkat berpikir yang berbeda; ini ditunjukkan oleh fakta bahwa kebanyakan tes standar ditulis dalam format ini. Gronlund (1993) menunjukkan bahwa guru harus terlebih dahulu mencoba menulis pilihan ganda dan kemudian beralih ke format lain hanya jika tujuan atau konten memerlukannya

Item pilihan ganda terdiri dari pertanyaan atau pernyataan yang tidak lengkap, dan beberapa alternatif yang mengharuskan siswa untuk memilih yang terbaik. Alternatif yang salah disebut distracters karena mereka dirancang untuk "mengalihkan perhatian" siswa yang tidak mengerti konten yang diukur dalam item.

 d. Item Benar-Salah
Seperti yang kita semua tahu dari pengalaman, format benar-salah melibatkan pernyataan dari berbagai kompleksitas peserta didik harus menilai sebagai benar atau salah. Karena faktor menebak dalam kecenderungan untuk menggunakan barang-barang ini untuk mengukur hasil tingkat yang lebih rendah, item benar-salah harus digunakan dengan hemat (Gronlund & Linn 1995). Seperti dengan format pilihan ganda, pedoman dapat membantu guru meningkatkan efektifitas mereka. 

e. Item Mencocok
Format yang cocok adalah variasi pada pertanyaan pilihan ganda dan paling efektif jika alternatif yang sama yang digunakan dalam serangkaian item (Stiggins, 1994) Beberapa karakteristik item yang sesuai adalah ilustrasi dalam item. Pertama, bahan yang homogen; semua pernyataan yang kiasan, dan hanya kiasan diberikan sebagai alternatif daerah konten lainnya yang item yang sesuai dapat digunakan meliputi orang dan prestasi mereka, peristiwa bersejarah dan tanggal, penulis, dan karya-karya mereka, dan prinsip ilustrasi mereka (Gronlund & Linn, 1995). Homogenitas diperlukan jika semua alternatif yang menjadi masuk akal. Kedua, Anda dapat melihat bahwa hanya ada delapan pernyataan dan lima kemungkinan alternative (angka-angka ini mengurangi kemungkinan benar menebak jawaban), petunjuk-negara bahwa alternatif dapat digunakan lebih dari sekali atau tidak sama sekali, dan seluruh item cocok pada bolak-balik, kebutuhan ini meningkatkan kemungkinan kesalahan disengaja

f. Item Melengkapi 
Item melengkapi termasuk pertanyaan atau pernyataan yang tidak lengkap yang memerlukan pelajar untuk memasok kata-kata yang tepat, angka, atau symbols. Format melengkapi adalah salah satu yang paling populer dengan guru, mungkin karena pertanyaan seperti tampak mudah. Namun, karena penyelesaian untuk format ini memiliki dua kelemahan serius

Pertama, sangat sulit untuk menempatkan frase pertanyaan sehingga, hanya satu jawaban yang mungkin benar. Kedua, kecuali pertanyaan melibatkan solusi untuk masalah, biasanya digunakan untuk mengukur pengetahuan tingkat sederhana

g. Item Essai: Mengukur Hasil yang Komplek
Sering kali dibutuhkan “kemampuan untuk mengatur ide” kemampuan untuk membuat dan mempertahankan suatu argumen. Soal essai memiliki beberapa kelemahan diantaranya yaitu
-Menskor membutuhkan waktu yang banyak.
-Menskor selalu subyektif dan tidak dapat diandalkan.
-Item soal essey sangat dipengaruhi dengan keterampilan menulis. Jika tidak, maka hal itu dapat mengurangi validitas item
-Tata Bahasa, kesalahan ejaan dalam menulis tangan cenderung mempengaruhi skor

Karena soal essai mudah untuk ditulis, mereka sering ambigu dan membuat siswa tidak  menentu bagaimana menanggapi. Karena keterbatasan ini, soal essai harus disediakan lebih kompleks dan tinggi tingkat hasil belajar dan tidak dapat diukur dengan format lain (Gronlund, 1993).

Mungkin komponen yang paling penting yang terlibat dalam mencetak gol adalah menetapkan kriteria penilaian. Kriteria harus disiapkan sebelum mencetak dan diterapkan secara seragam di seluruh proses. Salah satu cara untuk menetapkan kriteria adalah dengan menggunakan rubrik.

Rubrik ini adalah konten gratis, mengacu umum, kriteria organisasi; rubrik yang sama dapat dibangun yang fokus pada konsep atau topik tertentu. Dengan mengacu pada rubrik ini selama penilaian, guru dapat meningkatkan konsistensi dan kehandalan

h. Menggunakan Item Tes yang Disiapkan Komersial 
Seperti yang Anda lihat sebelumnya, banyak guru tergantung pada tes yang termasuk dalam buku pelajaran, panduan guru, dan materi kurikulum lainnya dalam program komersial disiapkan. Meski menggunakan tes ini jelas menghemat waktu, mereka harus digunakan dengan hati-hati untuk setidaknya tiga alasan.
1. Tujuan: tujuan yang dipahami oleh para pengembang kurikulum mungkin tidak sama dengan tujuan yang Anda miliki untuk siswa Anda. Jika tes tidak mencerminkan tujuan dan instruksi dalam kursus Anda, mereka tidak valid.
2. Penekanan: tes mencerminkan penekanan dari pengembang kurikulum, dan bahkan jika tujuan Anda adalah sama dengan mereka, penekanan tercermin pada tes komersial disiapkan mungkin tidak sejajar Anda.
3. Kualitas: Faktor ini mungkin yang paling penting. Banyak tes komersial disiapkan berkualitas rendah dan ditulis pada tingkat yang rendah, menekan daya ingat siswa daripada berpikir tingkat tinggi.

Hasil ini menunjukkan bahwa guru harus berhati-hati dalam menggunakan tes yang disediakan oleh penerbit buku. Mereka sering sedikit, jika ada, lebih baik daripada item guru mempersiapkan diri, dan mereka cenderung tidak kongruen dengan tujuan guru dan instruksi dari item guru disiapkan

 C. Penilaian Otentik 
Seperti yang Anda lihat, penilaian tradisional tetap populer dan banyak digunakan. Meskipun dengan popularitas ini, penilaian tradisional, seringkali dalam berbagai format pilihan, sedang semakin dikritik. Beberapa alasan yang diberikan adalah:
1. Uji konten berfokus pada pengetahuan tingkat rendah, konten diskrit dan keterampilan.
2. Tes mengukur hanya hasil-hasil, tidak memberikan wawasan tentang peserta didik berpikir dan keterampilan pemecahan masalah.
3. Format Tujuan, seperti pilihan ganda, tidak mengukur kemampuan peserta didik untuk menerapkan pemahaman di dunia nyata (herman et al 1992)

Menanggapi kritik tersebut, penggunaan penilaian otentik, atau "pemeriksaan langsung dari prestasi siswa pada tugas-tugas penting yang relevan dengan kehidupan di luar sekolah" (wonthen, 11993, hal. 445), sedang mendesak. Istilah penilaian alternatif, penilaian autentik, dan penilaian kinerja yang digunakan secara bergantian dalam menggambarkan penilaian yang secara langsung mengukur kinerja siswa melalui "kehidupan nyata" tugas (herman et al, 1992; WORTHEN, 1993)
Contoh termasuk:
1. Merancang dan melakukan percobaan untuk mengukur dampak dari berbagai tingkat latihan pada hamster.
2. Menulis esai persuasif
3. Merancang menu untuk satu minggu dari makanan seimbang bergizi.
4. Membuat karya asli dari tembikar.

Selain produk, seperti hasil percobaan, esai, dan potongan tembikar, guru menggunakan penilaian otentik juga tertarik pada proses yang digunakan siswa untuk mempersiapkan produk (Gronlund, 1993). Misalnya, wawancara terstruktur dapat digunakan untuk mendapatkan informasi tentang siswa berpikir saat mereka merancang percobaan mereka.

Penilaian alternatif memiliki setidaknya tiga keuntungan lebih dari pengukuran tradisional dengan kertas dan pensil:
1. Mereka menekankan berpikir tingkat tinggi dan kemampuan memecahkan masalah.
2. Mereka menggunakan aplikasi dunia nyata.
3. Mereka meminta siswa untuk melakukan, membuat, memproduksi, atau melakukan sesuatu
(herman et al, 1992)

Penilaian alternatif yang konsisten dengan pemandangan pembelajaran kontruktivistik, yang mengakui bahwa belajar adalah holistik dan harus kontekstual dalam tugas-tugas otentik (camp, 1992). 

D. Penilaian Kinerja 
Seorang guru sekolah menengah sains menyampaikan bahwa murid-muridnya mengalami kesulitan menerapkan prinsip-prinsip ilmiah untuk acara sehari-hari. Dalam upaya untuk meningkatkan kemampuan mereka, ia berfokus pada masalah sehari-hari (misalnya, mengapa es batu melayang dalam satu cangkir cairan bening tapi tenggelam di lain). Mana siswa harus menyelesaikan dalam kelompok dan mendiskusikan sebagai kelas. Pada hari Jumat, ia menyajikan masalah lain (misalnya, mengapa dua cairan bening dari volume yang sama, jika diletakkan pada keseimbangan, tidak memiliki massa yang sama), dan siswa harus menyelesaikannya dalam kelompok. Saat mereka bekerja, keliling di antara mereka, membuat catatan yang akan digunakan untuk penilaian dan umpan balik.

1.Merancang Penilaian Kinerja
Para ahli telah mengidentifikasi empat langkah dalam merancang penilaian kinerja kelas (berdasarkan pada karya Gronlund, 1993): (a) menentukan hasil yang diinginkan, (b) memilih fokus evaluasi, (c) menentukan tingkat yang tepat sesuai realisme, dan (d) memilih prosedur evaluasi. 

Menentukan Diinginkan Hasil. Langkah pertama dalam penilaian, adalah untuk mengembangkan gagasan yang jelas tentang apa yang Anda coba untuk ukur. Sebuah gambaran yang jelas tentang keterampilan atau proses membantu siswa memahami apa yang diperlukan dan membantu desain guru yang sesuai instruksi. 

Memilih fokus evaluasi. Setelah ditentukan hasil kinerja, guru kemudian harus memutuskan apakah penilaian akan fokus pada proses atau produk. Proses mungkin menjadi fokus awal, dengan pergeseran ke produk setelah prosedur yang dikuasai (Gronlund, 1993). 

Menentukan tingkat yang sesuai realisme. Kekuatan dari penilaian kinerja terletak pada link mereka untuk tugas-tugas yang realistis. Pada akhirnya, para guru ingin siswa untuk menggunakan keterampilan di dunia nyata, waktu, biaya, dan keamanan dapat mencegah "hal yang nyata" bagaimanapun, dan langkah-langkah perantara mungkin diperlukan.

Sebagai contoh, dalam pendidikan driver, tujuannya adalah untuk menghasilkan driver yang aman. Namun, menempatkan siswa dalam lalu lintas untuk menilai seberapa baik mereka berfungsi di belakang kemudi adalah baik realistis dan bijaksana. 

Memilih prosedur evaluasi. Langkah terakhir dalam desain penilaian kinerja adalah memilih (atau membangun) prosedur evaluasi. Realibiliti adalah perhatian utama ketika merancang dan menerapkan prosedur evaluasi; menunjukkan penelitian dan penampilan penilaian sering tidak dapat diandalkan (baxter & Shavelson, 1992; Madaus & tan, 1993).

Untuk mencapai level dari reliabiliti, kriteria didefinisikan dengan baik diperlukan. Kriteria yang efektif memiliki empat elemen (herman et al, 1992).
1. Satu atau lebih dimensi yang berfungsi sebagai dasar untuk menilai kinerja siswa.
2. Penjelasan masing-masing dimensi.
3. Skala nilai-nilai yang masing-masing dimensi berperingkat.
4. Definisi setiap nilai pada skala.

4.2 Metode Evaluasi dengan Penilaian Kinerja
Guru mengamati pengaturan ruang kelas sepanjang waktu. Pengamatan biasanya tidak sistematis, bagaimanapun, dan catatan jarang disimpan. Pengamatan sistematis dimaksudkan untuk memecahkan masalah ini dengan menetapkan kriteria dan mencatat berdasarkan kriteria. Sebagai contoh, seorang guru sains mencoba untuk mengajar siswa pemecahan masalah ilmiah nya mungkin menetapkan kriteria sebagai berikut.
1. Apakah menyatakan masalah atau pertanyaan.
2. Hipotesis Telah dinyatakan
3. Apakah diidentifikasi independen, dependen, dan variabel terkendali.
4. Memiliki dijelaskan data cara akan dikumpulkan
5. Telah memerintahkan dan ditampilkan Data
6. Apakah dievaluasi hipotesis berdasarkan data.

Catatan guru kemudian akan merujuk langsung ke kriteria, membuat mereka cukup konsisten untuk semua kelompok. Catatan dapat digunakan untuk memberikan umpan balik ke siswa dan memberikan informasi yang dapat digunakan dalam perencanaan masa depan.

Daftar-pembanding memperpanjang pengamatan sistematis dengan menetapkan aspek penting dari suatu kegiatan dan dengan berbagi dengan siswa. Daftar periksa deskripsi dari dimensi yang harus ada dalam sebuah kinerja yang dapat diterima tertulis. Poin berbeda dari pengamatan sistematis dalam pengamatan pertunjukan yang diinginkan biasanya "dicentang" daripada dijelaskan dalam catatan. Misalnya, guru sains yang ingin menilai masalah ilmiah kemampuan mungkin mempersiapkan checklist.

Peringkat skala adalah deskripsi dari dimensi dan skala nilai-nilai yang masing-masing dimensi berperingkat ditulis. Mereka memungkinkan informasi yang lebih tepat untuk berkumpul daripada dengan cheklists.

Enam dimensi diidentifikasi, dimensi dijelaskan, dan skala nilai-nilai yang disediakan di mana setiap dimensi dinilai disertakan. Nilai-nilai ini tidak ditentukan. Namun. Sebagai contoh, bagaimana seseorang tahu apakah "masalah Negara atau pertanyaan dengan jelas dan akurat" menjamin peringkat 4 atau 3? Untuk menjadi lengkap, definisi nilai, seperti berikut ini, harus dimasukkan.
Penilaian = 4
Masalah ini dinyatakan dalam bahasa yang jelas, lengkap, dan diamati; berkomunikasi dengan jelas dengan pembaca; menunjukkan memahami konten dengan menentukan arti dan pentingnya masalah; memberikan dasar yang jelas untuk hipotesa solusi.
Penilaian = 3
Masalah dinyatakan wajar jelas. Masalahnya adalah tepat dan signifikan, namun masalah yang lebih signifikan ada dalam konteks topik. Sebuah dasar yang jelas untuk hipotesa solusi disediakan.
Penilaian = 2
Masalah ambigious dinyatakan, dasar solusi hipotesa tidak pasti.
Penilaian = 1
Pernyataan ini dibuat, tetapi tidak jelas apakah itu masalah; pembelajar menunjukkan ragu-ragu tentang hubungan antara masalah dan hipotesis.
 Tidak ada masalah lain

Definitons untuk nilai-nilai dari masing-masing dimensi lain juga akan dijelaskan. Dengan deskripsi ini sebagai panduan, pengamat terlatih dapat mencapai tingkat yang dapat diterima keandalan untuk kedua kinerja siswa dan produk. 

E. Penilaian Portofolio: Melibatkan Siswa di Penilaian Otentik 
Penggunaan Portofolio, bentuk lain dari penilaian alternatif, memiliki keuntungan tambahan yang melibatkan siswa dalam desain, pengumpulan, dan evaluasi produk pembelajaran. Portofolio adalah koleksi pekerjaan yang ditinjau terhadap resiko kriteria yang telah ditetapkan untuk menilai mahasiswa atau program (Herman et al., 1992).
Dua fitur membedakan portopolio dari bentuk-bentuk penilaian:
1. Portopolio mengumpulkan sampel kerja dari waktu ke waktu, mencerminkan perubahan pembangunan.
2. Portopolio melibatkan siswa dalam desain, pengumpulan, dan evaluasi. 

F.     Praktek Penilaian Efektif 
Pada bagian sebelumnya, kami menguji baik penilaian tradisional dan alternatif secara rinci. Namun, meskipun barang-barang yang baik dan ukuran kinerja yang penting, ada lebih banyak penilaian yang efektif. Setiap item harus digabungkan menjadi tes, penilaian kinerja harus dirancang, siswa perlu dipersiapkan, dan penilaian harus penilaian administratif: (a) merancang penilaian, (b) mempersiapkan siswa untuk penilaian, (c) pemberian penilaian, dan (d) menganalisis hasil. 

6.1   Merancang Penilaian 
Dalam merancang penilaian. Tugas pertama adalah untuk memastikan itu konsisten dengan tujuan dan instruksi. Meskipun hal ini tampak jelas, banyak guru gagal untuk melakukannya.

6.2   Tabel Spesifikasi: Meningkatkan Validitas Melalui Perencanaan
Salah satu cara untuk membantu memastikan bahwa tujuan dan tes konsisten adalah mempersiapkan tabel spesifikasi. Sebuah tabel spesifikasi adalah matriks yang berasal dari tujuan guru yang mengklasifikasikan topik diukur pada tes dengan tingkat kognitif, seperti pengetahuan atau hasil yang spesifik.

Tabel spesifikasi dalam matriks topik-kognitif tingkat didasarkan pada tujuan. Anda dapat melihat bahwa guru memiliki campuran item, dengan lebih menekankan ditempatkan pada ciri-ciri fisik dari yang lain. Penekanan ini mencerminkan tujuan guru, yang menekankan pengaruh ciri-ciri fisik pada lokasi kota. Iklim, dan perekonomian daerah. Selain itu, penekanan ini mungkin juga mencerminkan waktu dan usaha yang dihabiskan di kelas pada masing-masing daerah. Memastikan pertandingan ini antara tujuan, instuction, dan prosedur penilaian adalah fungsi utama dari tabel spesifikasi.

6.3   Mempersiapkan Siswa untuk Penilaian
 Dalam mempersiapkan siswa untuk tes, guru memiliki tujuan panjang dan jangka pendek. Jangka panjang, mereka ingin siswa untuk memahami prosedur pengambilan tes dan srategi dan untuk masuk situasi pengujian dengan minimal kecemasan. Jangka pendek, mereka ingin siswa untuk memahami probabilitas yang menguji nilai akurat mencerminkan prestasi siswa.

6.4   Mengurangi Uji Kecemasan
Uji kecemasan adalah relatif stabil, reaksi tidak menyenangkan untuk situasi pengujian yang menurunkan kinerja. Kebanyakan teori uji kecemasan menunjukkan bahwa hal itu terdiri dari dua komponen (Printrich & Schunk, 1996). Komponen emosional yang dapat mencakup gejala fisiologis, seperti tingkat nadi yang lebih cepat, mulut kering, dan sakit kepala, serta perasaan takut dan membantu sesak dan kadang-kadang "akan kosong”. Khawatir, komponen melibatkan pikiran seperti mengkhawatirkan kegagalan (misalnya, orang tua menjadi marah, harus merebut kembali kursus) dan menjadi malu dengan skor rendah. Selama tes, siswa uji-cemas cenderung sibuk dengan uji kesulitan dan sering tidak dapat fokus pada masing-masing item.

6.5   Tes khusus-Prosedur Persiapan
Sebelum tes apapun, guru ingin seyakin mungkin bahwa siswa memahami konten pengujian dan prosedur dan bahwa mereka berharap untuk berhasil pada ujian. Dalam mempersiapkan siswa untuk tes nya, Tanya Erickson melakukan tiga hal penting:
1.Ditentukan secara tepat apa yang akan di tes.
2.Memberikan siswa kesempatan untuk berlatih item dalam kondisi testlike.
3.Didirikan harapan positif pada siswa dan mendorong mereka untuk menghubungkan keberhasilan dan usaha. 

G.   Administrasi Penilaian 
Mari kita kembali lagi ke Tanya Erickson dan kelasnya pukul 10.00 keesokan harinya.
Tanya membuka jendela sebelum sekolah dimulai, tapi dia menutup sekarang karena truk pengiriman mengemudi bolak-balik di luar. Dia telah mempertimbangkan menata ulang meja di ruang tetapi memutuskan untuk menunggu sampai setelah ujian.

"Okey, semua orang," dia menelepon. "Mari kita bersiap-siap untuk tes matematika kami." Dengan itu, para siswa menempatkan buku-buku mereka di bawah meja mereka.

Dia menunggu sejenak, melihat bahwa meja setiap orang jelas, dan mengatakan, "Ketika Anda selesai dengan tes, putar balik, dan saya akan datang dan mengambilnya. Sekarang, lihat papan tulis. Setelah Anda selesai, bekerja pada tugas yang tercantum di sana sampai orang lain selesai. Kemudian kita akan mulai membaca".

Saat ia membagikan tes, katanya, "Jika Anda merasa panas, acungkan tangan Anda, dan saya akan menyalakan AC. Aku menutup jendela karena dari kebisingan luar.

"Bekerja dengan hati-hati," Dia mengatakan setelah setiap orang memiliki salinan tes. "Kami semua sudah bekerja keras, dan saya tahu Anda akan melakukannya dengan baik. Anda memiliki waktu sebanyak yang Anda butuhkan. Sekarang pergi ke depan dan memulai. "

Para siswa cepat mulai bekerja, dan Tanya berdiri di dekat pintu, mengawasi usaha mereka. Setelah beberapa menit, dia melihat Dean berulang kali mencoret-coret di atas kertas dan melirik berkala di sekitar ruangan. Dia pergi ke dia, menempatkan lengan di bahunya, dan berkata, "Sepertinya kau baik-baik saja pada masalah ini," dan dia menunjuk ke beberapa bagian atas kertas. "Sekarang berkonsentrasi harder. Saya yakin Anda dapat melakukan sebagian besar yang lain. "Dia tersenyum menenangkan dan kembali berdiri di dekat pintu.

Tanya bergerak ke chao dalam menanggapi acungan tangannya. "Pensil saya patah, Mrs. Erickson," bisiknya.

"Ambil satu ini," Tanya merespon, menyerahkan satu. Sebagai mahasiswa selesai, Tanya mengambil surat-surat mereka, dan mereka memulai menulis di papan tulis.

Mari kita lihat sekarang bagaimana Tanya diberikan tes. Pertama, ia mengatur lingkungan menjadi nyaman, bebas dari gangguan dan mirip dengan cara seperti itu ketika para siswa belajar keterampilan. Gangguan dapat menekan hasil tes, terutama pada siswa muda atau rendah kemampuan (Trenthem, 1975)

Kedua, Tanya memberi arah yang tepat tentang mengambil tes, mengumpulkan kertas-kertas. dan menghabiskan waktu mereka sesudahnya. Arah ini diperkuat urutan ruang dan selanjutnya mencegah gangguan untuk akhir-menyelesaikan siswa.

Akhirnya, Tanya dimonitor tes selama seluruh waktu siswa bekerja di atasnya. Hal ini tidak hanya memungkinkan dia untuk mendorong siswa yang menjadi hilang atau terganggu tetapi juga berkecil kecurangan. Dalam dunia nyata, sayangnya, beberapa siswa akan menipu jika diberi kesempatan. Namun, faktor iklim kelas dan eksternal, seperti guru meninggalkan ruangan, pengaruh kecurangan lebih bahwa apakah siswa secara inheren cenderung untuk melakukannya (Bushway & Nash, 1977). Pemantauan Hati-hati saat tes juga membantu siswa belajar untuk memantau perilaku uji.

Dalam kasus Tanya, pemantauan itu lebih merupakan bentuk pemberian dukungan dari menjadi anjing penjaga. Ketika ia melihat bahwa Dean terganggu, ia dengan cepat campur tangan, ditawarkan dia dorongan, dan mendesaknya untuk meningkatkan konsentrasinya. Dorongan ini sangat penting untuk berprestasi dan uji-cemas, yang cenderung menjadi terganggu dan memiliki penyimpangan dalam upaya mereka (Nottelman & Hill, 1977) 

H. Hasil Analisis 
Umpan balik memungkinkan siswa untuk mengidentifikasi dan memperbaiki kesalahpahaman umum, pengetahuan tentang hasil adalah salah satu variabel yang mempromosikan motivasi siswa. hampir semua guru memberikan umpan balik setelah tes, dan banyak memakan waktu hingga setengah periode kelas untuk melakukannya (Haertel, 1986).

Selain itu, Tanya membuat komentar positif tentang kinerja umum kelas pada tes. Dalam sebuah studi meneliti faktor ini, siswa yang diberitahu bahwa mereka melakukannya tes dengan baik maka akan lebih baik pada tes berikutnya daripada mereka yang diberitahu mereka lakukan buruk. Akhirnya, Tanya membuat catatan pada tes salinannya dan mengajukan salinan. Catatannya mengingatkannya bahwa kata-kata di salah satu masalahnya adalah menyesatkan, sehingga dia bisa merevisi masalah sebelum ia memberikannya lagi. Ini, ditambah informasi lain yang diperoleh dari tes, akan membantunya dalam perencanaan masa depan dan penilaian. 

i. Menampung Keanekaragaman di kelas: Mengurangi Bias dalam Penilaian 
Ketika guru menilai siswa mereka, mereka mengumpulkan data yang digunakan untuk membuat keputusan tentang kemajuan siswa dan untuk membantu mereka dalam meningkatkan instruksi mereka. Keragaman dalam kelas, bagaimanapun, sering mempersulit proses ini. Seorang guru mungkin memiliki siswa, misalnya, yang tidak terbiasa dengan praktek penilaian standar seperti tes dan kuis. Mereka mungkin tidak memahami tujuan dari penilaian tersebut atau memiliki strategi uji-mengambil efektif. Juga, karena sebagian besar penilaian yang sangat berbasis bahasa, bahasa dapat hadir kendala lain. Pada bagian ini, kita menguji strategi untuk mengakomodasi keberagaman ini.

Pertama, siswa dengan beragam latar belakang mungkin kurang pengalaman dengan prosedur pengujian umum, format tes yang berbeda, dan strategi menguji, sehingga praktek pengujian yang efektif kita bahas di bagian sebelumnya tidak sesuai dengan ukuran untuk mereka. Selain itu, guru dapat menanggapi keragaman dalam item penilaian dengan tiga cara, (a) berhati hati dengan susunan kata dalam item penilaian  (b) membuat ketentuan untuk non-penutur asli bahasa Inggris, dan (c) mengakomodasi keragaman dalam skor. 

j. Koneksi Kelas 
10.1   Memanfaatkan Keanekaragaman dalam Kelas Anda
1. Menyadari efek bahwa keragaman dapat memiliki penilaian.
2. Beradaptasi dengan prosedur pengujian untuk memenuhi kebutuhan semua siswa.
3. Mendiskusikan hasil setelah tes dilaksanakan.
10.2 Merancang Sistem Grading
Merancang sistem grading sangat penting. Beberapa pedoman dapat membantu Anda dalam proses ini.
1. Sistem Anda harus konsisten dengan kebijakan sekolah dan kabupaten.2. Sistem Anda harus dirancang untuk mengumpulkan informasi  sistematis dari setiap siswa.
3. Dalam kebanyakan situasi, pekerjaan rumah harus menjadi bagian integral dari sistem penilaian.
4. Anda harus dapat percaya diri mempertahankan sistem untuk orang tua atau administator jika diperlukan.
Dengan panduan ini dalam pikiran, mari kita lihat unsur-unsur dari suatu sistem yang efektif antara lain evaluasi formatif dan sumatif, tes dan kuis, penilaian alternatif, dan pekerjaan rumah.
10.3 Peningkatan Belajar dan Motivasi
Setelah keputusan dibuat tentang tes, kuis, penilaian alternatif, dan pekerjaan rumah, Anda noe siap untuk merancang anda total sistem penilaian. Pada titik ini, Anda harus membuat dua keputusan: a) apa yang harus dimasukkan dan b) berat untuk menetapkan masing-masing komponen. Sebelumnya, Anda melihat bahwa tes, kuis, penilaian alternatif, dan pekerjaan rumah masing-masing harus dimasukkan dalam kebanyakan kasus. Beberapa guru membangun faktor tambahan, seperti usaha, partisipasi kelas, dan sikap. Praktek ini, meskipun umum di kelas tidak disarankan oleh ahli penilaian (Gronlund & Linn, 1995). Mengumpulkan informasi yang sistematis tentang variabel afektif sulit, sehingga penilaian mereka sangat subjektif. Faktor-faktor seperti usaha, kerjasama, kesiapan, dan kehadiran kelas harus tercermin dalam bagian terpisah dari rapor. 
Baca juga : Penilaian dan pengukuran (KLIK DISINI)  
Perencanaan pembelajaran   
Pengajaran dan pembelajaran  
artikel: PENILAIAN BELAJAR 

0 Response to "PENILAIAN BELAJAR"

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel

close