TS Lê Trường Tùng gợi ý cách phát hiện điểm thi THPT bất thường bằng Excel

(VTC News) - VTC News giới thiệu bài viết của TS Lê Trường Tùng, Chủ tịch HĐQT Đại học FPT hướng dẫn cách phát hiện điểm thi THPT bất thường bằng Excel.

Chỉ bằng công cụ đơn giản Excel, ai cũng có thể làm và chỉ lấy 3 ngưỡng điểm 24, 25.5, 27 cho 3 môn thi của 3 khối thi A, A1, B, TS. Lê Trường Tùng có thể đặt nghi vấn với một số địa phương.

Sẽ phân tích một cách đơn giản nhất toàn bộ dữ liệu thi THPT quốc giá 2018 (khoảng gần 1 triệu thí sinh với hơn 5 triệu bài thi) để định dạng các địa phương là "nghi phạm" gian lận với các giả thiết sau đây:

- Mục tiêu gian lận là nâng điểm phục vụ cho việc thi đại học (không tính mục tiêu khác).

- Nâng cho khá nhiều thí sinh (khoảng 1% trở lên - Hà Giang là 2%).

Với các giả thiết trên, việc gian lận thi cử với số lượng đủ lớn sẽ làm giảm số bài thi điểm thấp và tăng số bài thi điểm cao, dẫn đến tỷ lệ bài thi điểm cao tăng lên đáng kể.

Chưa cần đến các công cụ phân tích dữ liệu, chưa cần đến ngôn ngữ R. Tạm dùng Excel đã.

Chúng ta sẽ phân tích tỷ lệ bài thi điểm cao cho 3 khối chỉ gồm các môn thi trắc nghiệm là thi A, A1 và B. Sẽ chia làm 3 mức điểm cao là 24, 25.5 và 27 ứng với điểm trung bình mỗi môn là 8, 8.5 và 9. Chúng ta không gọi 7 là cao, vì điểm 7 trắc nghiệm mới chỉ tương đương với điểm 6 tự luận (làm được 6 điểm, chọn hú họa trong 4 điểm được 1 điểm nữa, cộng là 7).

TS Le Truong Tung goi y cach phat hien diem thi THPT bat thuong bang Excel hinh anh 1

Hình 1. 

TS Le Truong Tung goi y cach phat hien diem thi THPT bat thuong bang Excel hinh anh 2

Hình 2. 

TS Le Truong Tung goi y cach phat hien diem thi THPT bat thuong bang Excel hinh anh 3

 Hình 3.

Trước hết cho khối A. Trên 3 đồ thị (xem hình 1, hình 2, hình 3) thể hiện tỷ lệ thí sinh đạt 24, 25.5 và 27 trở lên cho toàn quốc và cho 63 tỉnh thành. Đường đỏ nằm ngang là mức của toàn quốc. Như vậy, ta có thể thấy, Hà Giang có tỷ lệ cao vọt trong cả 3 ngưỡng điểm.

Một số quê hương "đất học" có tỷ lệ cao hơn trung bình, có thể bỏ qua. Nhìn kỹ hơn, chúng ta thấy Kon Tum và Điện Biên cao hơn. Với đồ thị cho 27 điểm trở lên, Hòa Bình cũng cần vào danh sách nghi vấn chờ xem xét.

TS Le Truong Tung goi y cach phat hien diem thi THPT bat thuong bang Excel hinh anh 4

Hình 4. 

Trong hình 3 và hình 4, top 4 địa phương có tỷ lệ thí sinh khối A1 từ 25.5 điểm trở lên cao nhất toàn quốc theo thứ tự là Hà Giang, Lai Châu, Hòa Bình, Sơn La. Top 3 tỷ lệ thí sinh 27 điểm trở lên là Hà Giang, Sơn La, Hòa Bình.

TS Le Truong Tung goi y cach phat hien diem thi THPT bat thuong bang Excel hinh anh 5

Hình 5. 

TS Le Truong Tung goi y cach phat hien diem thi THPT bat thuong bang Excel hinh anh 6

 Hình 6.

Chuyển sang khối B (hình 5, hình 6). Trong khối thi này, Kon Tum và Điện Biên đứng đầu trong tỷ lệ thí sinh điểm cao. Các địa phương có tỷ lệ thí sinh khối B đạt 24 điểm trở lên là Kon Tum và Điện Biên. Các địa phương có tỷ lệ thí sinh 25.5 điểm trở lên là Hà Giang, Lai Châu, Kon Tum và Điện Biên. Và đứng đầu các địa phương có thí sinh khối B điểm 27 trở lên là Điện Biên, Hà Giang, Kon Tum, Sơn La.

Phân tích sâu hơn, phân tích điểm thi cho từng môn, phân tích các khối thi khác theo cách trên sẽ có thể rút ra thêm các minh chứng thống kê khẳng định các nghi vấn trên. 

Như vậy, Hà Giang là nghi vấn số 1, nổi trội trong cả 3 khối A, A1, B, được Bộ GD-ĐT kiểm tra và kết luận đúng là có sai phạm; Sơn La xuất hiện trong khối B, khối A1, đang được Bộ GD-ĐT kiểm tra;

Hòa Bình xuất hiện trong khối A, A1: Bắt đầu được báo chí nhắc đến; Lai Châu xuất hiện trong khối A1 và khối B: Cần xem xét;

Kon Tum, Điện Biên xuất hiện trong khối A và thực sự nổi bật trong khối B: Cần nghiêm túc xem xét.

>>> Đọc thêm: Ông Lê Như Tiến: 'Sai phạm chấm thi ở Hà Giang có đường dây đứng sau, cần phải phanh phui'

TS. Lê Trường Tùng
Bình luận
® GƯƠNG MẶT THƯƠNG HIỆU
BIDV Vietinbank Vinamilk Benh vien da khoa Phu Tho Borona
BVB Sungroup Agribank Him Lam Saigon Co.op
vin Vinaphone Agribank Him Lam Novaland
Petro Hung Thinh EVN TTC Land Novaland