Đề thi: Kiểm tra năng lực hay đánh đố học sinh?

Trong giáo dục, việc đánh giá chất lượng một đề thi dựa trên nhiều tiêu chí khoa học đã được công nhận rộng rãi. Hai yếu tố then chốt, thường xuyên được nhắc đến trong các lý thuyết, là tính hợp lệ (Validity) và độ tin cậy (Reliability).

Tính hợp lệ, hay Validity, đề cập đến việc đề thi có thực hiện đúng chức năng đánh giá và phân loại học sinh hay không. Một đề thi Văn có thể được đánh giá là “hay” và “gây xúc động”, nhưng nếu nó không có khả năng đo lường năng lực ngôn ngữ và văn học của học sinh, thì đó vẫn là một đề thi kém chất lượng, không phù hợp cho mục đích đánh giá, bất kể dư luận đánh giá nó cao đến đâu.

Độ tin cậy (Reliability) thể hiện tính ổn định của đề thi. Các kỳ thi tiếng Anh quốc tế như Cambridge English hay IELTS thường có cấu trúc và độ dài ổn định. Lượng từ vựng và yêu cầu đối với thí sinh tương ứng với trình độ ngôn ngữ mục tiêu. Điều này giúp giảm thiểu yếu tố may rủi giữa các đợt thi.

Kỳ thi tốt nghiệp THPT là một kỳ thi quốc gia “hai trong một”, vừa xét công nhận tốt nghiệp, vừa là cơ sở xét tuyển đại học. Để đáp ứng yêu cầu này, đề thi cần đảm bảo học sinh trung bình có thể đạt được điểm 5 để tốt nghiệp, đồng thời có khả năng phân hóa ở mức điểm từ 6 đến 10.

Đề thi không nên tạo ra sự may rủi, mà cần đảm bảo sự công bằng cho tất cả thí sinh. Quan điểm “khó thì khó đều” chỉ đúng khi xét riêng từng môn. Nếu đề thi Toán và Tiếng Anh quá khó, thí sinh xét tuyển bằng tổ hợp Toán – Văn – Anh sẽ gặp bất lợi so với thí sinh chọn tổ hợp Toán – Lý – Anh. Tương tự, thí sinh có chứng chỉ IELTS có thể có lợi thế hơn thí sinh không có. Điều này dẫn đến sự không đồng đều về năng lực của sinh viên trúng tuyển, phá vỡ nguyên tắc công bằng trong tuyển sinh.

Ví dụ, đề thi môn tiếng Anh năm nay được nhiều giáo viên đánh giá là có độ khó tương đương trình độ B2 – C1. Bên cạnh đó, thí sinh còn chịu áp lực về thời gian làm bài ngắn hơn so với các kỳ thi Cambridge English hay IELTS, font chữ nhỏ, và lịch thi dồn dập. Trong khi đó, trình độ C1 (Bậc 5 khung năng lực ngoại ngữ quốc gia) là mục tiêu mà giáo viên ngoại ngữ đang hướng tới, và chưa chắc đạt được vào năm 2030. Việc kiểm tra trình độ C1 đối với học sinh phổ thông, vốn chỉ cần đạt trình độ B1, là không phù hợp. Thông thường, nếu mục tiêu là đánh giá trình độ B1, đề thi hiếm khi vượt quá mức B2. Nếu đề thi bao gồm cả trình độ C1-C2, nó có thể đã trở thành đề thi học sinh giỏi.

Giải thích rằng đề thi “cần tạo ra yếu tố bất ngờ để học sinh không học theo lối cũ” là một cách hiểu chưa đúng. Các yêu cầu và hình thức của đề thi cần được công khai từ đầu năm học để học sinh có sự chuẩn bị tốt nhất. Mục tiêu của kiểm tra, đánh giá không phải là tạo ra những tình huống bất ngờ để thử thách khả năng ứng biến của thí sinh.

Để đánh giá độ khó dễ của đề thi, cần xem xét phổ điểm, độ lệch giữa các môn và khả năng phân hóa thí sinh. Nếu chất lượng giáo dục phổ thông không đổi hoặc đang được cải thiện, mà tỷ lệ thí sinh đạt điểm dưới trung bình lại tăng cao bất thường, thì có thể có hai nguyên nhân: hoặc chất lượng giảng dạy chưa đáp ứng yêu cầu tốt nghiệp, hoặc đề thi quá khó.

Một số chương trình giáo dục trên thế giới đã áp dụng các giải pháp hợp lý hơn, như cho phép thí sinh đăng ký thi theo trình độ chuẩn hoặc nâng cao ngay từ đầu. Điều này giúp thí sinh tập trung vào mục tiêu tốt nghiệp hoặc chứng tỏ năng lực để vào đại học. Hệ thống giáo dục Mỹ thậm chí không có kỳ thi tốt nghiệp THPT, mà sử dụng hệ thống tín chỉ. Học sinh được công nhận tốt nghiệp khi hoàn thành đủ số môn và đạt đủ điểm. Để vào đại học, họ cần chứng minh điểm trung bình học bạ (GPA) cao, cùng với điểm thi nâng cao AP.

Bùi Khánh Nguyên

Những phản hồi, thậm chí là than phiền của học sinh về độ khó của đề thi không nên bị xem là tiêu cực. Thay vào đó, đây là cơ hội để xem xét lại sự “vênh” giữa học và thi, giữa thực tế dạy học và kết quả đầu ra, cũng như các vấn đề tiềm ẩn như việc coi trọng ngoại ngữ mà xem nhẹ các môn khoa học cơ bản.

Một đề thi chất lượng cần dựa trên các tiêu chí khoa học, chứ không phải dựa trên độ “hot” hay độ “hay”. Đề thi là một công cụ đánh giá, không phải là một sản phẩm truyền thông.

Admin


Nguồn: VnExpress

Leave a Reply

Your email address will not be published. Required fields are marked *