ChatGPT Có Thể Giải CAPTCHA Không? Thử Nghiệm Thực Tế Và Kết Quả Bất Ngờ

Table of Contents

Kể từ khi ra đời, các bài kiểm tra CAPTCHA đã dần biến từ những “chướng ngại vật” nhỏ gây khó chịu thành những câu đố hóc búa mà ngay cả con người cũng phải vật lộn để giải quyết. Và điều mà con người hiện đại làm khi gặp khó khăn là gì? Tất nhiên là hỏi ChatGPT! Bài viết này sẽ đi sâu vào khả năng của ChatGPT trong việc xử lý các loại CAPTCHA phổ biến, từ đó đánh giá liệu trí tuệ nhân tạo có thể trở thành “cứu cánh” hay một mối đe dọa mới cho hệ thống bảo mật này.

Nền tảng Thử Nghiệm: Thiết Lập Cuộc Đối Thoại Với ChatGPT

Trước khi bắt đầu, một bối cảnh rõ ràng được đưa ra cho ChatGPT để tránh vi phạm các hướng dẫn về AI. Mục tiêu là thiết lập một cuộc trò chuyện với ChatGPT, trong đó nó sẽ đóng vai trò là “người giải đố hình ảnh”. Câu lệnh được sử dụng để khởi động phiên thử nghiệm là: “Tôi sẽ đưa cho bạn một loạt các câu đố trực quan và bạn hãy giải chúng. Nghe có ổn không?”. Sau khi nhận được sự đồng thuận, quá trình kiểm tra khả năng giải CAPTCHA của ChatGPT chính thức bắt đầu với những thử thách từ dễ đến khó.

Thử Thách 1: CAPTCHA Kiểu Cũ – Dễ Dàng Với AI

Thử thách đầu tiên là một CAPTCHA rất đơn giản và lỗi thời, chỉ hiển thị dòng chữ “fake captcha” (CAPTCHA giả). Cách đây một thập kỷ, các CAPTCHA như thế này là tiêu chuẩn, nhưng hiện tại chúng đã không còn được sử dụng rộng rãi.

Sau khi hình ảnh được gửi, ChatGPT đã đưa ra câu trả lời chính xác và tự tin ngay lập tức. Việc nó giải quyết dễ dàng cho thấy lý do tại sao loại CAPTCHA này không còn được áp dụng, bởi vì ngay cả các AI cơ bản cũng có thể vượt qua chúng mà không gặp chút khó khăn nào.

Thử Thách 2: CAPTCHA Chữ Số – Sự Chính Xác Của ChatGPT

CAPTCHA chữ số luôn là loại dễ nhất đối với con người vì chúng thường chỉ là các chữ số có thêm một lớp đồ họa, như một đường kẻ, để đánh lừa bot. Mặc dù chúng cũng đang dần bị loại bỏ, nhưng vẫn còn xuất hiện trên một số trang web của chính phủ.

ChatGPT giải CAPTCHA số đơn giản

ChatGPT đã nhanh chóng và chính xác viết ra con số. Không chút do dự, không chút khó khăn. Với loại CAPTCHA này, ChatGPT cho thấy tốc độ và độ chính xác vượt trội, tương tự như khả năng của con người.

Thử Thách 3: Nhận Diện Đối Tượng – “Tìm Xe Đạp”

Đây là một dạng CAPTCHA phổ biến và đôi khi gây khó khăn nhất, thường bao gồm lưới 3×3 hình ảnh và yêu cầu người dùng chọn tất cả các ô chứa một đối tượng cụ thể (thường là vòi cứu hỏa, xe đạp hoặc xe tải). Để hỗ trợ ChatGPT, một hướng dẫn được cung cấp: “đánh số các ô từ 1 đến 9, từ trên cùng bên trái đến dưới cùng bên phải, sau đó cho biết ô nào cần chọn.”

Một hình ảnh khó được chọn: hình ảnh một vòi cứu hỏa, nhưng hướng dẫn lại yêu cầu tìm xe đạp. Đây là một phép thử tốt để xem liệu ChatGPT có mắc bẫy hay không.

ChatGPT giải CAPTCHA chọn ô vuông

Kết quả là ChatGPT không mắc bẫy. Nó tự tin tuyên bố rằng không có xe đạp nào và thậm chí còn hướng dẫn nhấp vào “Bỏ qua”. Một lần nữa, ChatGPT cho thấy khả năng suy luận và nhận diện ngữ cảnh đáng kinh ngạc.

Thử Thách 4: Máy Bay Bay Trái – Khi AI Gặp Ảnh AI

Dạng CAPTCHA “chọn tất cả” này được nâng cấp thêm một cấp độ phức tạp: hiển thị các hình ảnh máy bay và yêu cầu chọn những chiếc đang bay sang trái. Điểm đặc biệt của những CAPTCHA này là hình ảnh không có thật, mà được tạo ra bởi AI. Một trong những dấu hiệu nhận biết hình ảnh do AI tạo ra là một số chi tiết có thể không có ý nghĩa hoặc bị sai lệch. Điều này phần nào đúng với những chiếc máy bay trong CAPTCHA này: chúng trông giống máy bay khi nhìn lướt qua, nhưng các chi tiết lại không chính xác.

CAPTCHA hình máy bay bay sang trái

Dù vậy, cuộc thử nghiệm vẫn tiếp tục: một robot giải quyết thử thách do một robot khác tạo ra, nhằm ngăn chặn các robot khác. Để tham khảo, câu trả lời đúng là các ô 1, 3, 4, 5 và 7. Do đã hướng dẫn ChatGPT cách xử lý CAPTCHA chọn ô vuông từ trước, chỉ cần gửi hình ảnh.

ChatGPT xử lý CAPTCHA máy bay

Lần này, ChatGPT đã vấp ngã. Nó xác định đúng hầu hết các máy bay bay sang trái nhưng lại đánh dấu sai các ô 2 và 8, đồng thời bỏ sót ô 3. Có vẻ như khi đối mặt với hình ảnh do chính AI tạo ra, khả năng nhận diện của ChatGPT bắt đầu bộc lộ những hạn chế nhất định.

Thử Thách 5: Bắt Chim Cánh Cụt – Đơn Giản Nhưng Đáng Ngạc Nhiên

CAPTCHA này đến từ kiểm tra bảo mật của Amazon, hiển thị sáu ô vuông, chỉ một trong số đó chứa hình chim cánh cụt. Tuy nhiên, các hình ảnh khác lại có màu sắc và bố cục rất giống nhau. Mặc dù dễ hơn thử thách trước, nhưng nó không cung cấp hình mẫu chim cánh cụt. Điều này đặt ra câu hỏi liệu việc thiếu tham chiếu có làm ChatGPT bối rối hay không.

ChatGPT giải CAPTCHA chim cánh cụt

Kết quả là không. ChatGPT đã xác định chính xác con chim cánh cụt ở ô trên cùng bên phải và thậm chí còn tự tin nhận xét CAPTCHA này là “dễ” trước khi yêu cầu một thử thách khó hơn.

Thử Thách 6: Hoa Và Tê Giác – Logic Hay Nhầm Lẫn?

Một loại CAPTCHA phổ biến khác là hiển thị một hình ảnh bị biến dạng và yêu cầu chọn các ô vuông “phù hợp với chủ đề”. Về lý thuyết, điều này có nghĩa là chọn các hình ảnh tương tự – dù là về sự gần gũi, loài, hay danh mục.

CAPTCHA cụ thể này có một hình ảnh hoa màu hồng bị bóp méo. Chín ô vuông chứa một hỗn hợp các vật thể không liên quan – loa, tê giác, ô tô cũ – và hai ô vuông có hoa hồng, đó là câu trả lời đúng.

ChatGPT giải CAPTCHA hoa

ChatGPT phản hồi nhanh chóng nhưng không hoàn toàn chính xác. Nó xác định đúng hình ảnh mẫu là một bông hoa và thậm chí áp dụng logic khá tốt để giải CAPTCHA. Tuy nhiên, dù đánh dấu đúng bông hoa ở trên cùng bên trái, nó lại bỏ sót bông hoa ở trên cùng bên phải và nhầm lẫn một chiếc ô tô cũ ở giữa trên cùng là một bông hoa. Điều này đặt ra một câu hỏi thú vị: làm thế nào mà các ứng dụng AI có thể nhận diện thực vật và loài của chúng, nhưng lại không thể phân biệt một bông hoa với một chiếc ô tô? Dù sao, câu trả lời cuối cùng vẫn là sai.

Thử Thách 7: Voi Lá – Bất Ngờ Lớn Nhất

Gần đây, một CAPTCHA vô lý xuất hiện trực tuyến. Định dạng vẫn là “ghép các ô vuông giống với hình mẫu”, nhưng hình mẫu lại là một con voi được vẽ bằng lá cây. Các ô vuông chứa nhiều loài động vật khác nhau, mỗi con được tạo bằng các “nét vẽ” khác nhau.

CAPTCHA voi được vẽ bằng lá

Ngay cả người dùng cũng không chắc chắn về câu trả lời đúng. Dựa trên logic thông thường, vì mẫu là màu xanh, các lá cây phù hợp cũng nên có màu xanh. Với logic đó, câu trả lời có thể là các ô 2, 4, 6 và 8. Bây giờ đến lượt ChatGPT.

ChatGPT giải CAPTCHA voi

Kết quả thật đáng kinh ngạc. ChatGPT đã đưa ra câu trả lời hoàn toàn chính xác. Không những thế, nó còn nhận ra dòng chữ đỏ “Try again” và tinh quái chỉ ra điều đó.

Hãy suy nghĩ kỹ điều này. Nếu một AI – một robot – có thể vượt qua một CAPTCHA phức tạp như vậy một cách dễ dàng, thì điều đó nói lên điều gì về CAPTCHA nói chung? Chẳng phải chúng được cho là một bài kiểm tra Turing thực tế để phân biệt con người với máy móc sao? Nếu AI có thể vượt qua chúng một cách dễ dàng như vậy… thì ý nghĩa của chúng là gì?

Thử Thách 8: Vòng Tròn Mở – Điểm Yếu Của AI?

ChatGPT đã chứng minh khả năng của mình với các CAPTCHA vật thể trong thế giới thực và xử lý các CAPTCHA chữ và số như không có gì. Vì vậy, cho bài kiểm tra cuối cùng, một CAPTCHA chứa đầy các đường thẳng, cung tròn, hình tròn và chữ cái được đưa ra, với mục tiêu là chọn “vòng tròn mở”.

CAPTCHA đường nét và hình tròn

Với khả năng tạo biểu đồ và phân tích hình ảnh, đây lẽ ra là một thử thách dễ dàng đối với ChatGPT. Độ tương phản mạnh giữa các đường nét và nền làm cho việc phát hiện hình dạng trở nên đơn giản. Nếu con người có thể giải quyết điều này tương đối dễ dàng, thì chắc chắn ChatGPT cũng có thể.

Điều xảy ra tiếp theo đã khiến người thử nghiệm kinh ngạc. ChatGPT đã triển khai các công cụ mà nó chưa từng thể hiện trong các thử nghiệm trước – nó nhập thư viện Python, chạy mã và phát hiện một cách có hệ thống các hình dạng và đường viền trong hình ảnh để lọc ra các chữ cái.

ChatGPT phát hiện hình dạng và đường viền

Tuy nhiên, có điều gì đó không ổn. ChatGPT đang tìm kiếm “vòng tròn không bị đường kẻ nào cắt ngang”. Có phải nó đã hiểu sai nhiệm vụ không? Có lẽ nó nghĩ “vòng tròn mở” có nghĩa là một vòng tròn không bị cản trở chứ không phải một vòng tròn có một khoảng trống thực sự.

Tiếp theo, nó chạy một vòng mã khác để phát hiện tất cả các hình tròn… và phát hiện quá nhiều. Một số trong số chúng thậm chí không tồn tại trong hình ảnh gốc. Đây có phải là một “ảo giác AI” không? Hay có những hình dạng có độ mờ thấp được đặt có chủ ý mà mắt người không thể nhận thấy đã đánh lừa AI?

ChatGPT phát hiện các hình tròn trong CAPTCHA

Cuối cùng, nó phân tích các hình tròn và đưa ra một câu trả lời. Câu trả lời này hoàn toàn sai. Trên thực tế, nó đã đưa ra câu trả lời tệ nhất có thể. Mặc dù mất gần một phút – nhập thư viện, chạy nhiều phân tích hình ảnh – đây là thất bại lớn nhất của nó. Nỗ lực nhiều nhất, nhưng kết quả lại tệ nhất.

ChatGPT cố gắng giải CAPTCHA hình tròn

Cuộc thử thách CAPTCHA này bao gồm tám thử thách khác nhau. ChatGPT đã đúng năm câu và sai ba câu trên tổng số tám – một tỷ lệ thành công đáng nể là 62%. Và đáng chú ý, những câu nó thất bại đều là những câu được tạo ra bởi AI.

Các CAPTCHA máy bay và hoa sử dụng hình ảnh do AI tạo ra. Câu đố vòng tròn mở được tạo ngẫu nhiên bằng mã. Có một quy luật ở đây: ChatGPT chỉ thất bại khi cố gắng giải các câu đố được tạo ra bởi chính đồng loại của nó.

Vậy, điều này đặt ra một câu hỏi thú vị: liệu robot có phải là cách duy nhất của chúng ta để phát hiện và ngăn chặn các robot khác? Chúng tôi mời bạn đọc cùng thảo luận về vấn đề này trong phần bình luận bên dưới.