Trong bối cảnh AI phát triển nhanh chóng vào năm 2023, nơi tràn ngập những đột phá, AlphaGeometry, nghiene cuwus gần đây của Google DeepMind,[1] có thể chỉ là một giọt nước trong đại dương. Tuy nhiên, việc tìm hiểu sâu hơn sẽ tiết lộ nhiều câu chuyện đa sắc thái đằng sau AlphaGeometry.
1. Khoảng cách giữa AlphaGeometry và một AGI:
Để hiểu được tầm quan trọng của thành tựu AlphaGeometry, trước tiên chúng ta phải nắm được khái niệm AGI. Không giống như các hệ thống AI hẹp hoặc chuyên biệt, AGI là hệ thống được thiết kế để sở hữu khả năng nhận thức chung giống với trí thông minh của con người. Để đạt được mức độ thông minh này không chỉ đòi hỏi việc thông thạo các nhiệm vụ cụ thể; nó đòi hỏi khả năng suy luận, khái quát hóa và thích ứng với nhiều lĩnh vực khác nhau.
Có rất nhiều kỹ năng bao gồm trí thông minh nói chung, bao gồm nhưng không giới hạn ở các kỹ năng lý luận [2]như lý luận logic, lập kế hoạch, lý luận thông thường, lý luận trừu tượng, giải quyết vấn đề, xử lý ngôn ngữ tự nhiên, số học, nhớ lại, trạng thái tinh thầ, lý thuyết của tâm trí, ý thức về chủ thể. Ngoài ra, nó còn mở rộng đến các kỹ năng tương tác trong thế giới thực như khả năng nhận thức, sự khéo léo và thao tác bằng tay, hiểu tầm nhìn, điều hướng, hiểu âm thanh, khả năng di chuyển, phối hợp tay-mắt và phối hợp nhiều tác nhân.
Với rất nhiều kỹ năng được nêu trong danh sách, rõ ràng là khả năng giải quyết vấn đề hình học của AlphaGeometry, mặc dù đáng khen ngợi, [3]chỉ là bề nổi của những gì tạo nên AGI thực sự. AlphaGeometry có thể chứng tỏ khả năng vượt trội trong khả năng suy luận sáng tạo và logic cụ thể cho lĩnh vực của nó, phạm vi toàn diện của AGI bao gồm sự thành thạo trong nhiều lĩnh vực.
Quá trình chuyển đổi từ việc thành thạo một lĩnh vực cụ thể, dù phức tạp đến đâu, sang việc đạt được bộ kỹ năng toàn diện của AGI là một thách thức ghê gớm. Tuy nhiên, thành công được thể hiện bằng cách tiếp cận đổi mới của AlphaGeometry đã vẽ ra một bức tranh đầy hứa hẹn về việc giải quyết một loạt vấn đề rộng hơn trên hành trình hướng tới AGI.
2. Giải mã sự thành công của AlphaGeometry
Mặc dù AlphaGeometry hiện đang vượt trội trong lĩnh vực hình học Olympic chuyên biệt, nhưng việc sử dụng dữ liệu tổng hợp một cách chiến lược, cùng với kiến trúc biểu tượng thần kinh (neuro symbolic), cho thấy một phương pháp giải quyết vấn đề linh hoạt. Khả năng thích ứng này cho thấy các nguyên tắc được áp dụng trong đào tạo AlphaGeometry có thể được mở rộng để giải quyết các thách thức ngoài phạm vi hình học.
2.1. Dữ liệu tổng hợp và quy mô:
Sự phụ thuộc của AlphaGeometry vào dữ liệu tổng hợp nhấn mạnh sự cân bằng chiến lược giữa chất lượng và số lượng trong quá trình đào tạo. Mặc dù dữ liệu tổng hợp có thể không tái tạo được sự phong phú và phức tạp của các tình huống trong thế giới thực, nhưng nó bù đắp bằng số lượng khổng lồ. Sự phong phú này cho phép AI tham gia vào quá trình suy luận tự thử và tìm lỗi trên phạm vi rộng trong một khoảng thời gian đáng kể.
Ưu điểm nằm ở khả năng của AI trong việc lặp lại vô số tình huống, về cơ bản là tiến hành các thí nghiệm của riêng mình và học hỏi từ kết quả. Cơ chế tự cải tiến này, được hỗ trợ bởi bộ dữ liệu tổng hợp khổng lồ bao gồm 100 triệu định lý và bằng chứng, cho phép AlphaGeometry cải tiến các kỹ năng giải quyết vấn đề của mình thông qua việc thử và sai liên tục. Đó là một hành trình khám phá tự động, trong đó số lượng dữ liệu tổng hợp trở thành chất xúc tác cho sự tự hoàn thiện của AI, góp phần nâng cao khả năng giải quyết các vấn đề hình học Olympic và có lẽ đóng vai trò là bước đệm hướng tới AGI.
2.2. Kiến trúc biểu tượng thần kinh:
Cốt lõi thành công của AlphaGeometry là kiến trúc biểu tượng thần kinh đổi mới—sự kết hợp được chế tạo cẩn thận giữa mô hình ngôn ngữ thần kinh (Hệ thống 1 – sáng tạo) và công cụ suy luận biểu tượng (Hệ thống 2 – đáng tin cậy). Sức mạnh tổng hợp về kiến trúc này giải quyết tính hai mặt của lý luận AI, kết hợp cả tư duy sáng tạo và độ chính xác logic.
- Mô hình ngôn ngữ thần kinh (Hệ thống 1 – Sáng tạo):
Trong khuôn khổ biểu tượng thần kinh, mô hình ngôn ngữ thần kinh hoạt động như thành phần sáng tạo. Khía cạnh này của AlphaGeometry được thiết kế để mô phỏng khả năng sáng tạo giống con người, cho phép AI tiếp cận vấn đề một cách linh hoạt và trực giác. Hệ thống sáng tạo này vượt trội trong việc tạo ra những ý tưởng mới lạ và khám phá các giải pháp độc đáo, góp phần nâng cao khả năng thích ứng của AlphaGeometry trong việc xử lý các thách thức hình học Olympic đa dạng.
- Công cụ khấu trừ tượng trưng (Hệ thống 2 – Đáng tin cậy):
Ở phía bên kia của quang phổ là công cụ suy luận mang tính biểu tượng, phản ánh bản chất đáng tin cậy và dựa trên quy tắc của lý luận logic. Hệ thống này vượt trội trong việc áp dụng các nguyên tắc toán học đã được thiết lập, tiến hành các suy luận chính xác và đảm bảo tính chính xác của các giải pháp. Nó đóng vai trò như mỏ neo, cung cấp nền tảng vững chắc cho kết quả đầu ra sáng tạo của mô hình ngôn ngữ thần kinh.
Sự xuất sắc của AlphaGeometry nằm ở sự cộng tác hài hòa giữa hai hệ thống này. Cấu trúc biểu tượng thần kinh tạo ra sự cân bằng tinh tế, tận dụng tính sáng tạo của Hệ thống 1 để có tư duy vượt trội và độ tin cậy của Hệ thống 2 để suy luận logic mạnh mẽ. Sự cân bằng này cho phép AlphaGeometry điều hướng bối cảnh phức tạp của hình học Olympic, thể hiện cách tiếp cận giải quyết vấn đề toàn diện kết hợp đổi mới với độ chính xác.
3. Vượt ngoài sự cường điệu về AGI:
Trong khi giới truyền thông xôn xao có thể cho rằng AlphaGeometry đang trên đà thu hẹp khoảng cách với AGI, bài viết này nhằm mục đích xóa tan mọi quan niệm cường điệu. Khi chúng ta đi sâu vào sự phức tạp trong các khả năng của AlphaGeometry, rõ ràng là hành trình hướng tới AGI còn lâu mới hoàn thành. Tuy nhiên, sự thừa nhận này không làm giảm tầm quan trọng của bước đột phá của AlphaGeometry.
Trong lĩnh vực lý luận phức tạp và trừu tượng, AlphaGeometry tỏa sáng như một công cụ giải quyết vấn đề đáng gờm. Thành công của nó trong việc giải các bài toán Olympic là minh chứng cho những bước tiến đạt được trong việc giải quyết các thách thức đòi hỏi khả năng nhận thức phức tạp. Bước đột phá này, mặc dù không báo trước sự xuất hiện sắp xảy ra của AGI, nhưng cho thấy tiềm năng của AI trong việc giải quyết các vấn đề đòi hỏi khả năng suy luận nâng cao.
Các tác giả của bài nghiên cứu AlphaGeometry đã gợi ý về tiềm năng cải thiện kết quả của họ bằng cách tăng quy mô sức mạnh tính toán, nêu bật vai trò đa sắc thái của phần cứng trong đào tạo AI. Tuy nhiên cần lưu ý rằng việc chỉ dựa vào sức mạnh tính toán ngày càng tăng có thể không phải lúc nào cũng là giải pháp tối ưu, nhưng quan điểm cá nhân của tôi được hình thành bởi cảm giác lạc quan thận trọng.
Tuyên bố thừa nhận tác động của tài nguyên tính toán có vẻ như là một cách đánh giá thấp, đặc biệt là trước những bước tiến nhanh chóng trong công nghệ GPU. Cá nhân tôi tin tưởng mạnh mẽ rằng chúng ta đang ở thời điểm mà sự đột phá trong đổi mới thuật toán, giống như bài báo về cơ chế Chú ý mang tính biến đổi, là rất quan trọng để thúc đẩy AI lên tầm cao mới.
Tuy nhiên, sự ra đời của Nvidia H200, với hiệu suất tăng gấp 8 lần ấn tượng so với GPU V100 được nhóm AlphaGeometry sử dụng, là một tín hiệu vui. Theo quan điểm của tôi, sự tiến bộ về phần cứng này không chỉ thể hiện sức mạnh tính toán ngày càng tăng; nó biểu thị một kỷ nguyên của những khả năng mở rộng để cải tiến và mở rộng khả năng của các mô hình như AlphaGeometry.
Bài viết gốc được tác giả viết bằng tiếng Anh, dùng Google translate lại cho độc giả tiếng Việt, nên có thể có vài điểm không hợp với văn cảnh tiếng Việt: https://medium.com/@phuocnguyen90/alphageometry-bridging-the-gap-to-agi-or-does-it-not-fa8dfb622e13
[1] Trinh, T.H., Wu, Y., Le, Q.V. et al. (2024) Solving olympiad geometry without human demonstrations. Nature 625, 476–482 https://doi.org/10.1038/s41586-023-06747-5
[2] Sun, J., Zheng, C., Xie, E. et all (2023). A Survey of Reasoning with Foundation Models. ArXiv. /abs/2312.11562
[3] Jesus Rodriguez (2024) Inside AlphaGeometry: Google DeepMind’s New Model that Solves Geometry Problems Like a Math Olympiad Gold-Medalist https://pub.towardsai.net/inside-alphageometry-google-deepminds-new-model-that-solves-geometry-problems-like-a-math-dad37976fc39