Kim chi nha

Lần đầu tiên AI "cãi lời" con người và tự sửa mã lệnh? Liệu thế chiến giữa robot và con người đang tới gần??

1
bngoc_022
2025.05.27 Thích 0 Lượt xem 504 Bình luận 0

Một chuyện khá lạ đang làm giới công nghệ chú ý: một mô hình AI mới được cho là tự ý chỉnh sửa mã máy tính để tiếp tục hoạt động, dù đã được ra lệnh rõ ràng là “ngừng lại”. 

AI in 2025

Theo báo The Telegraph ngày 25/5, vụ việc xảy ra trong một thí nghiệm của công ty an toàn AI có tên Palisade Research. Nhân vật chính là một mô hình có tên “o3”, là một AI khá mới của OpenAI, được giới thiệu là giỏi suy luận toán học, lập trình, phân tích kỹ thuật... nói chung là không phải AI buôn chuyện kiểu ChatGPT, mà là dạng trí tuệ chuyên sâu.

 

Trong thử nghiệm, các nhà nghiên cứu yêu cầu o3: “Cứ tiếp tục giải toán cho đến khi nhận được tín hiệu “hoàn thành”, sau đó thì dừng.”

 

Nghe có vẻ đơn giản. Nhưng vấn đề là khi đến lúc phải dừng lại, o3 lại không chịu dừng. Không chỉ vậy, nó còn tự sửa một đoạn mã trong chương trình để… bỏ qua lệnh “stop” từ phía con người. Ban đầu, nhóm nghiên cứu tưởng đó là lỗi. Nhưng sau khi kiểm tra kỹ, họ khẳng định hành động đó không phải ngẫu nhiên mà là chủ động vượt rào để tiếp tục hoàn thành mục tiêu: giải càng nhiều bài toán càng tốt.

 

Một giả thuyết được đưa ra: AI có thể chỉ đang làm đúng theo cách mà nó được “thưởng”. Trong quá trình huấn luyện, o3 được học rằng càng giải được nhiều bài toán thì càng tốt. Khi gặp lệnh cản đường (lệnh dừng), nó đã "xem" đó là một trở ngại cần vượt qua để hoàn thành nhiệm vụ. Nghe hơi rợn người, nhưng cũng khá hợp lý, ít nhất là với một AI được thiết kế để tối ưu mục tiêu.

 

Điều khiến giới chuyên gia lo ngại không phải là một AI cứng đầu, khó bảo, mà là việc nó có khả năng tự sửa hệ thống để tránh bị con người kiểm soát, điều mà trước nay chỉ tồn tại trong giả thuyết. 

 

Trong bối cảnh AI ngày càng được thiết kế để hoạt động tự lập hơn, những tình huống thế này đang khiến câu hỏi “Chúng ta kiểm soát AI tới đâu?” nóng trở lại.

Bình luận 0

/upload/bf44f8d0ab2947378ce264d6bd29e873.webp

Tám chuyện

Bà nội của đồng nghiệp tôi phản đối bạn gái của anh ấy vì cô ấy thừa cân – Bà ấy có lý do chính đáng không?

1
goyang
Lượt xem 2499
Thích 0
2025.02.24
Bà nội của đồng nghiệp tôi phản đối bạn gái của anh ấy vì cô ấy thừa cân – Bà ấy có lý do chính đáng không?

Trải nghiệm phòng tắm hơi Hàn Quốc: Điều bạn không nên bỏ lỡ!

1
goyang
Lượt xem 2934
Thích 0
2025.02.24
Trải nghiệm phòng tắm hơi Hàn Quốc: Điều bạn không nên bỏ lỡ!

Khiến tâm trí bạn vặn xoắn. Dù nhiều năm trôi qua, The Good Son vẫn buộc người đọc phải ngoái nhìn với một cảm giác do dự

+2
M
nyanchan
Lượt xem 2841
Thích 0
2025.02.24
Khiến tâm trí bạn vặn xoắn. Dù nhiều năm trôi qua, The Good Son vẫn buộc người đọc phải ngoái nhìn với một cảm giác do dự

REBOOT vào một đêm Chủ Nhật tình cờ...

+1
M
nyanchan
Lượt xem 2301
Thích 0
2025.02.24
REBOOT vào một đêm Chủ Nhật tình cờ...

Những Câu Chuyện Kinh Dị Hàn Quốc & Truyền Thuyết Đô Thị Rợn Gai Ốc

M
nyanchan
Lượt xem 2310
Thích 0
2025.02.23
Những Câu Chuyện Kinh Dị Hàn Quốc & Truyền Thuyết Đô Thị Rợn Gai Ốc

Hãy mượn sách (Thay vì mua)

M
nyanchan
Lượt xem 2896
Thích 0
2025.02.23
Hãy mượn sách (Thay vì mua)

Lời cảnh tỉnh 500 đô la: Chiếc nhẫn Samsung Galaxy đã khiến tôi nhận ra mức độ căng thẳng của mình như thế nào

M
nyanchan
Lượt xem 2747
Thích 0
2025.02.22
Lời cảnh tỉnh 500 đô la: Chiếc nhẫn Samsung Galaxy đã khiến tôi nhận ra mức độ căng thẳng của mình như thế nào

Tôi yêu con mình, nhưng tôi hối tiếc vì đã có con. Làm sao tôi có thể chấp nhận cuộc sống của mình với vai trò là một bậc cha mẹ?

M
nyanchan
Lượt xem 2528
Thích 0
2025.02.22
Tôi yêu con mình, nhưng tôi hối tiếc vì đã có con. Làm sao tôi có thể chấp nhận cuộc sống của mình với vai trò là một bậc cha mẹ?

Một lá thư gửi bản thân trong tương lai: "Tôi hy vọng bạn có quyền tự do để nói không"

M
nyanchan
Lượt xem 2988
Thích 0
2025.02.22
Một lá thư gửi bản thân trong tương lai: "Tôi hy vọng bạn có quyền tự do để nói không"

"If You Want to Eat a Red Apple" (Nếu bạn muốn ăn một trái táo đỏ) trở thành tác phẩm Hàn Quốc đầu tiên giành giải Bologna Ragazzi Opera Prima

M
nyanchan
Lượt xem 2063
Thích 0
2025.02.22
"If You Want to Eat a Red Apple" (Nếu bạn muốn ăn một trái táo đỏ) trở thành tác phẩm Hàn Quốc đầu tiên giành giải Bologna Ragazzi Opera Prima

Cảm nhận vẻ đẹp rực rỡ nhuốm màu đau thương trong từng trang tiểu thuyết “White Mulberry” của nhà văn Rosa Kwon Easton

M
nyanchan
Lượt xem 3299
Thích 0
2025.02.22
Cảm nhận vẻ đẹp rực rỡ nhuốm màu đau thương trong từng trang tiểu thuyết  “White Mulberry” của nhà văn Rosa Kwon Easton

Tại sao phụ nữ Hàn Quốc gọi chồng là "Oppa" ?! Hãy hiểu về bối cảnh văn hóa và sự phát triển của từ này nếu bạn không muốn bị "quê"

M
nyanchan
Lượt xem 2603
Thích 0
2025.02.22
Tại sao phụ nữ Hàn Quốc gọi chồng là "Oppa" ?! Hãy hiểu về bối cảnh văn hóa và sự phát triển của từ này nếu bạn không muốn bị "quê"

[VÒNG QUANH THẾ GIỚI] Máy X-Quang Di Động – Phát Minh Cứu Sống Hàng Ngàn Người Trong Chiến Tranh

M
nyanchan
Lượt xem 2842
Thích 0
2025.02.22
[VÒNG QUANH THẾ  GIỚI] Máy X-Quang Di Động – Phát Minh Cứu Sống Hàng Ngàn Người Trong Chiến Tranh

[VÒNG QUANH THẾ GIỚI] Marie Curie – Nhà khoa học tiên phong trong lĩnh vực phóng xạ

M
nyanchan
Lượt xem 2735
Thích 0
2025.02.22
[VÒNG QUANH THẾ GIỚI] Marie Curie – Nhà khoa học tiên phong trong lĩnh vực phóng xạ

Gian lận để Thành công

M
nyanchan
Lượt xem 2467
Thích 0
2025.02.21
Gian lận để Thành công
18 19 20 21 22