Từ trước đến nay, các kỳ đánh giá tại Việt Nam, trong đó có các kỳ thi quan trọng đều sử dụng điểm thô để làm kết quả đánh giá cuối cùng. Theo lý thuyết trắc nghiệm cổ điển, điểm thô của một bài thi là tổng điểm của các câu hỏi trong đề thi đó

1. Về chấm điểm TSA tổng

Từ trước đến nay, các kỳ đánh giá tại Việt Nam, trong đó có các kỳ thi quan trọng đều sử dụng điểm thô để làm kết quả đánh giá cuối cùng. Theo lý thuyết trắc nghiệm cổ điển, điểm thô của một bài thi là tổng điểm của các câu hỏi trong đề thi đó. Ví dụ với đề thi có 100 câu hỏi, và mỗi câu hỏi đúng thí sinh đạt được 01 điểm thì nếu thí sinh làm đúng 70 câu hỏi, thí sinh đó sẽ được 70 điểm. Điểm số này được gọi là điểm thô và được sử dụng trong việc xét kết quả cũng như so sánh với điểm của các thí sinh khác.

Hiểu thế nào về phương pháp chấm điểm TSA của Đại học Bách khoa Hà Nội
TS. Đặng Xuân Cương
Tư vấn về đo lường và đánh giá giáo dục

Một trong những nhược điểm của việc sử dụng điểm thô là khó phân biệt được khả năng của các thí sinh có cùng mức điểm thô khi làm cùng một đề thi. Ngoài ra, khi tính điểm năng lực bằng điểm thô, năng lực của thí sinh sẽ thay đổi khi làm hai đề thi có độ khó trung bình khác nhau. Ví dụ, trong một đợt thi, các thí sinh làm đúng 70 câu hỏi bất kì sẽ có cùng điểm thô là 70 điểm. Trong thực tế, các thí sinh này có thể trả lời đúng tập hợp các câu hỏi khác nhau và độ khó của các câu hỏi này trong đề thi cũng khác nhau. Vì vậy, 70 điểm không phản ánh đúng năng lực của các thí sinh này. Để giải quyết vấn đề này, các kì thi quan trọng ở nhiều nước trên thế giới đã sử dụng các lí thuyết đo lường hiện đại hơn để có thể ước lượng năng lực của thí sinh một cách chính xác và tin cậy. Một trong số chúng là lý thuyết ứng đáp câu hỏi. Lý thuyết này đưa ra giả thuyết là mỗi thí sinh trả lời một câu hỏi trong đề thi có một mức năng lực nhất định và thí sinh có năng lực cao sẽ có xác suất trả lời đúng một câu hỏi bất kì cao hơn so với thí sinh có năng lực thấp. Dựa vào lí thuyết này, có thể định lượng được các tham số (độ khó và độ phân biệt) của câu hỏi cũng như năng lực của thí sinh và các yếu tố này độc lập với nhau. Do đó, việc ước lượng năng lực của thí sinh sẽ tin cậy hơn so với cách tính bằng điểm thô.

Kỳ thi Đánh giá tư duy ở Đại học Bách Khoa Hà Nội cũng từng bước sử dụng lý thuyết này trong việc thiết kế đề thi cũng như tính toán điểm số TSA của thí sinh. Với cách tính như vậy, các thí sinh mặc dù có cùng số điểm thô nhưng các điểm ước lượng khả năng là khác nhau, phụ thuộc vào độ khó của các câu hỏi mà từng thí sinh đã trả lời được. Điểm số này sẽ được quy đổi về thang điểm 100. Điều này dẫn đến việc các thí sinh có thể có điểm TSA khác nhau mặc dù có cùng số điểm thô.

2. Về chấm điểm TSA thành phần của từng lĩnh vực

Với cách tính toán theo lý thuyết trắc nghiệm cổ điển như trước đây theo tổng số câu trả lời đúng trong bài thi thì tổng các điểm thành phần của các lĩnh vực sẽ bằng tổng số điểm thô của cả bài thi. Với cách tính điểm thành phần của bài thi TSA, do các điểm số này nằm trên các thang đo riêng biệt nên việc tính toán phép cộng cơ học thuần túy sẽ không còn đúng nữa. Hơn nữa, mục đích của việc cung cấp các điểm TSA thành phần là để mỗi thí sinh có cơ sở xem xét khả năng hiện tại của mình trong từng lĩnh vực và đối chiếu, so sánh với các thí sinh khác trong mỗi lĩnh vực đó. Việc so sánh điểm giữa các lĩnh vực cũng như so sánh điểm TSA của các lĩnh vực và điểm TSA tổng là không có ý nghĩa.

3. Về tính công bằng đối với điểm thi TSA

Một điểm cũng cần chú ý, đó là điểm của các bài thi qua các đợt thi của kỳ thi đều được đưa về cùng một thang đo chung trước khi thực hiện việc so sánh, tuyển chọn và thông báo kết quả thông qua việc sử dụng các kỹ thuật của lý thuyết khảo thí hiện đại. Việc đưa tất cả điểm số TSA của các đợt thi về cùng một thang đo chung một cách khoa học sẽ góp phần tạo ra tính công bằng cho các thí sinh tham gia dự thi.