Khi AI trở nên nguy hiểm, “cha đẻ AI” quyết chơi chiêu ngược lại

Chí Phú

Phóng viên

Tuần trước, FBI công bố một chi tiết gây chấn động: hai nghi phạm trong vụ đánh bom phòng khám hỗ trợ sinh sản tại California đã sử dụng một chương trình AI để tìm kiếm thông tin về chất nổ. Một kẻ đã chết trong vụ nổ, kẻ còn lại bị bắt, nhưng lời cảnh báo thì còn vang xa, rằng AI đang bị biến thành công cụ chết người.

Vụ đánh bom gần một trung tâm y tế sinh sản ở Palm Springs, bang California vào ngày 17 tháng 5 năm 2025. Hình ảnh từ video cho thấy hiện trường vương vãi các mảnh vỡ, trong khi nghi phạm được cho là đã sử dụng chatbot AI để lập kế hoạch chế tạo bom.
Vụ đánh bom gần một trung tâm y tế sinh sản ở Palm Springs, bang California vào ngày 17 tháng 5 năm 2025. Hình ảnh từ video cho thấy hiện trường vương vãi các mảnh vỡ, trong khi nghi phạm được cho là đã sử dụng chatbot AI để lập kế hoạch chế tạo bom.

Giữa làn sóng lo ngại, Yoshua Bengio – một trong những “cha đẻ” của trí tuệ nhân tạo hiện đại, tuyên bố tung ra một mô hình AI hoàn toàn mới mang tên Scientist AI. Mục tiêu không chỉ là an toàn hơn, mà còn có thể giám sát các AI khác.

Một AI trung thực và có thể lý giải được

Năm 2018, cùng với Geoffrey Hinton và Yann LeCun, Bengio nhận giải Turing – giải thưởng danh giá nhất trong ngành khoa học máy tính, cho những đóng góp về học sâu (deep learning). Nhưng hôm nay, ông đang rẽ sang hướng khác: Không tập trung vào sức mạnh, mà là sự an toàn.

Dự án Scientist AI do tổ chức phi lợi nhuận LawZero dẫn dắt, hướng tới hai điểm khác biệt so với hầu hết các AI hiện nay.

Thứ nhất, nó có thể đánh giá và trình bày mức độ tự tin trong câu trả lời của mình. Điều này nhằm giải quyết tình trạng AI tưởng như trả lời rất chắc chắn nhưng thực tế lại sai bét.

Thứ hai, nó có thể giải thích cách đưa ra quyết định, điều mà các AI hiện đại thường bỏ qua để ưu tiên tốc độ và hiệu quả. Nhiều mô hình mới không còn giữ được khả năng “giải thích được”, dẫn đến những sai lệch nguy hiểm và khó kiểm soát.

Scientist AI không chỉ trả lời, mà còn phải thuyết phục con người bằng lập luận rõ ràng.

Nhà khoa học máy tính người Canada Yoshua Bengio, một trong những “cha đẻ” của trí tuệ nhân tạo (AI) hiện đại.
Nhà khoa học máy tính người Canada Yoshua Bengio, một trong những “cha đẻ” của trí tuệ nhân tạo (AI) hiện đại.

Dùng AI để kiểm soát AI

Bengio không giấu giếm ý định biến Scientist AI thành một “người gác cửa” công nghệ. Nó sẽ được dùng để giám sát những hệ thống AI kém an toàn hơn, mà về cơ bản là “lấy độc trị độc”.

Với quy mô hiện tại, không con người nào có thể kiểm tra hàng tỷ câu hỏi được xử lý mỗi ngày bởi các AI như ChatGPT. Bengio cho rằng chỉ một AI khác mới đủ sức theo dõi, nhận diện sai lệch và cảnh báo.

Đây không còn là giả tưởng. Trong nghiên cứu, các nhà khoa học thường để các AI “đấu trí” để kiểm tra năng lực lẫn nhau. Bengio chỉ muốn đưa việc đó ra khỏi phòng thí nghiệm và áp dụng vào thế giới thật.

Khôi phục “mô hình thế giới” cho AI

Một trong những thiếu sót lớn nhất của các mô hình AI hiện nay là không có “mô hình thế giới”, một cấu trúc giúp AI hiểu được cách vạn vật vận hành.

Ví dụ điển hình là cái gọi là “vấn đề bàn tay”. Đó là AI có thể vẽ hình bàn tay rất giống, nhưng không thể mô phỏng chuyển động tự nhiên, vì nó không hiểu vật lý của tay. Cũng như ChatGPT có thể nói chuyện trôi chảy, nhưng lại chơi cờ sai luật, thua cả người mới chơi.

Trong khi đó, những AI “cổ điển” như Stockfish tích hợp mô hình thế giới về cờ vua lại đánh bại mọi kỳ thủ. Bengio muốn Scientist AI có thể “suy nghĩ như người” bằng cách trang bị khả năng hiểu thế giới thật, thay vì chỉ phản ứng theo xác suất câu chữ.

Kế hoạch lớn, nguồn lực nhỏ

Dù tầm nhìn rõ ràng, Bengio và LawZero đang đối mặt với bài toán kinh điển: Thiếu tiền và thiếu dữ liệu.

Tổng số tiền được cam kết cho dự án chỉ là 30 triệu USD, con số chẳng thấm vào đâu nếu so với khoản 500 tỷ USD mà Mỹ vừa tuyên bố rót vào AI. Tệ hơn, phần lớn dữ liệu huấn luyện AI hiện nằm trong tay các gã khổng lồ công nghệ, là những người đang ưu tiên tốc độ hơn là sự an toàn.

Ngay cả khi Bengio xây dựng thành công một AI như mô tả, câu hỏi vẫn còn đó: Ai sẽ cho phép Scientist AI giám sát các hệ thống khác? Và làm sao để ép các công ty phải tuân thủ?

Một bài học muộn cho thời đại AI

Dù còn nhiều trở ngại, Scientist AI là một nỗ lực cần thiết để tạo ra đối trọng với những hệ thống AI đang phát triển thiếu kiểm soát. Nếu thành công, nó có thể đặt ra tiêu chuẩn mới cho ngành công nghệ, nơi các mô hình không chỉ “thông minh” mà còn phải “trách nhiệm”.

Bengio gợi nhắc một điều rằng, nếu thế giới hành động kịp thời khi mạng xã hội mới ra đời, sức khỏe tâm thần của giới trẻ có thể đã không chịu nhiều tổn thương như hôm nay. Và nếu Scientist AI xuất hiện sớm hơn, có lẽ những kẻ âm mưu đánh bom sẽ không dễ gì tìm được hướng dẫn từ chatbot.

BÀI LIÊN QUAN