Bạn đã biết đến Libratus – trí tuệ nhân tạo chơi Poker thắng các cao thủ poker thế giới
Libratus vào năm 2017 đã gây chú ý vì giành chiến thắng trước các cao thủ poker thế giới. Bài viết dưới đây, mình cùng tìm hiểu về trí tuệ nhân tạo chơi Poker Libratus nhé.
1. Libratus là gì?
Libratus là trí tuệ nhân tạo được tạo ra bởi hai nhà nghiên cứu khoa học tại Đại học Carnegie Mellon. Con robot này được chạy trên một siêu máy tính ở Pittsburgh.
Libratus không sử dụng mạng lưới thần kinh nhân tạo. Nó chỉ chủ yếu dựa trên một hình thức AI – được biết đến với tên “Học tăng cường” (Reinforcement Learning). Hình thức AI này là một phương pháp thử nghiệm và báo lỗi khắt khe. Về cơ bản thì nó có khả tự chơi trò chơi này với bản thân. Và điều này lặp lại hết lần này đến lần khác.
2. Những hệ thống bên trong của Libratus
Libratus học chơi poker hoàn toàn từ đầu. Thông qua một thuật toán có tên gọi Counterfactual Regret Minimization. Thuật ngữ này được hiểu là sự giảm thiểu tổn thất đối chứng. Libratus đã bắt đầu bằng cách chơi ngẫu nhiên. Rồi cuối cùng, sau nhiều tháng luyện tập cùng với hàng nghìn tỷ ván bài poker. Trí tuệ nhân tạo này đã đạt tới trình độ không chỉ thách thức người chơi giỏi nhất.
Thêm nữa Libratus Còn chơi theo cách mà họ không thể làm được, đó chính là chơi với phạm vi đặt cược rộng hơn và ngẫu nhiên hóa các lần đặt cược này. Chính vì thế mà các đối thủ cũng sẽ khó khăn hơn trong việc đoán biết được những con bài mà Libratus đang cầm.
Trong trận đấu ở Pittsburgh, một hệ thống thứ hai của Libratus sẽ phân tích trạng thái của trận đấu và chỉ tập trung vào các chú ý của hệ thống đầu tiên. Chính nhờ vào sự trợ giúp từ hệ thống thứ hai này, mà hệ thống đầu tiên của Libratus sẽ không phải chạy thử toàn bộ các kịch bản có thể mà nó còn có thể khám phá ra trong quá khứ. Hệ thống này này chỉ cần chạy thử qua một vài kịch bản đó. Do đó Libratus không chỉ học trước trận đấu và tiếp tục học ngay cả khi đang chơi.
3. Thành tích của Libratus
Vào năm 2017, Libratus đã tham gia một giải đấu với bốn cao thủ trong bộ môn poker hàng đầu. Đó chính là Jason Les, Dong Kim, Daniel McAulay và Jimmy Chou.
Trong suốt giải đấu, Libratus vào ban ngày đã cạnh tranh với những người chơi. Sau đó, qua đêm, trí tuệ nhân tạo này đã tự hoàn thiện chiến lược của mình bằng cách phân tích lối chơi trước đó cùng với kết quả của ngày hôm đó, bao gồm các trận thua.
Chính vì thế mà Libratus có thể liên tục sửa chữa các điểm không hoàn hảo mà nhóm con người đã phát hiện ra. Libratus được biết đã sử dụng thêm 4 triệu giờ lỗi trên siêu máy tính Bridges để phục vụ cuộc thi.
4. Kết luận
Trên đây là thông tin thú vị về trí tuệ nhân tạo chơi Poker – Libratus. Có thể thấy bộ môn này từ lâu da phổ biến và thu hút rất nhiều sự quan tâm.