Phân tích Project89: Một thiết kế khung AI Agent thế hệ mới, mô-đun hóa và hiệu suất cao
Project89 đã áp dụng một cách hoàn toàn mới để thiết kế Agent Framework, đây là một Agent Framework hiệu suất cao dành cho phát triển trò chơi, có tính mô-đun hơn và hiệu suất tốt hơn so với các Agent Framework đang được sử dụng hiện tại.
Bài viết này sẽ giới thiệu chi tiết về sự nâng cấp kiến trúc của khung này so với khung Agent truyền thống.
Nền tảng nhà phát triển
Người sáng lập Project89 trước đây đã tham gia phát triển dự án Magick, đây là một phần mềm sử dụng AI để lập trình. Ông đứng ở vị trí thứ tư trong số các nhà phát triển của dự án này.
Tại sao nên sử dụng ECS để thiết kế Khung Agent
Từ quan điểm ứng dụng trong lĩnh vực trò chơi, hiện tại các trò chơi sử dụng kiến trúc ECS bao gồm:
Trò chơi blockchain: Mud, Dojo
Trò chơi truyền thống: Overwatch, Star Citizen, v.v.
Các engine game chính thống cũng đang phát triển theo hướng ECS, chẳng hạn như Unity
Giới thiệu về ECS
ECS(Entity-Component-System) là một mô hình kiến trúc thường được sử dụng trong phát triển trò chơi và hệ thống mô phỏng, nó tách biệt hoàn toàn dữ liệu với logic, nhằm quản lý hiệu quả các thực thể và hành vi của chúng trong các cảnh quy mô lớn có khả năng mở rộng.
Entity( thực thể): chỉ là một ID, không chứa bất kỳ dữ liệu hoặc logic nào.
Thành phần (: dùng để lưu trữ dữ liệu hoặc trạng thái cụ thể của thực thể.
Hệ thống(Hệ thống): chịu trách nhiệm thực hiện các logic liên quan đến một số thành phần.
Lấy một hành động cụ thể của Agent làm ví dụ: trong ArgOS, mỗi Agent được coi là một Entity, nó có thể đăng ký các thành phần khác nhau, chẳng hạn như:
Thành phần Agent: Lưu trữ tên Agent, tên mô hình và các thông tin cơ bản khác
Thành phần nhận thức: Lưu trữ dữ liệu từ bên ngoài mà cảm nhận được
Thành phần bộ nhớ: Dữ liệu bộ nhớ của thực thể Agent lưu trữ
Thành phần Hành động: Lưu trữ dữ liệu Hành động cần thực hiện
Quy trình làm việc của System:
Cảm nhận vũ khí, Hệ thống Perception cập nhật Thành phần Perception của Agent Entity
Hệ thống Memory gọi thành phần Perception và thành phần Memory, lưu trữ dữ liệu cảm nhận vào cơ sở dữ liệu
Hệ thống Hành động gọi Thành phần Bộ nhớ và Thành phần Hành động, lấy thông tin môi trường từ bộ nhớ, thực hiện các hành động tương ứng.
Nhận dữ liệu của mỗi Component đã được cập nhật của Agent Entity
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-4cd7ca20f2967b9025411d9985f64831.webp(
) Quy trình hoạt động của Hệ thống
Quá trình thực thi của hệ thống không phải là thứ tự gọi mà chúng ta tưởng tượng, mà là không có mối quan hệ gọi giữa các hệ thống, mỗi hệ thống thực hiện một lần trong khoảng thời gian quy định, ví dụ:
Hệ thống cảm nhận thực hiện mỗi 2 giây một lần, cập nhật cảm nhận từ bên ngoài đến Thành phần Cảm nhận
Hệ thống Bộ nhớ thực hiện mỗi 1 giây, trích xuất dữ liệu từ Thành phần Nhận thức sang Thành phần Bộ nhớ
Hệ thống Kế hoạch thực hiện mỗi 1000 giây một lần, lập kế hoạch và cập nhật Thành phần Kế hoạch
Hệ thống Hành động thực hiện mỗi 2 giây, phản ứng kịp thời dựa trên thông tin bên ngoài, đồng thời cập nhật Hành động dựa trên Thành phần Kế hoạch.
Kiến trúc Hệ thống ArgOS
ArgOS đã thiết kế nhiều Component và System để Agent có thể suy nghĩ sâu hơn và thực hiện các nhiệm vụ phức tạp.
ArgOS chia System thành ba cấp độ ###Cấp độ nhận thức (:
Có ý thức)CONSCIOUS(hệ thống
Bao gồm RoomSystem, PerceptionSystem, v.v.
Tần suất cập nhật cao ) như mỗi 10 giây (
Gần gũi hơn với việc xử lý ở mức "thời gian thực" hoặc "ý thức rõ ràng"
Tiềm thức)HỆ THỐNG SUBCONSCIOUS(
Bao gồm GoalPlanningSystem, PlanningSystem
Tần suất cập nhật thấp ) như mỗi 25 giây (
Xử lý logic "suy nghĩ"
Vô thức)UNCONSCIOUS(hệ thống
Hiện tại chưa được kích hoạt
Tần suất cập nhật chậm hơn )50 giây trở lên (
Mối quan hệ giữa các hệ thống trong ArgOS rất phức tạp, thiết kế phân lớp giúp quy định tần suất thực hiện của các Hệ thống khác nhau.
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-69e16ae3b5af8c39e1fc522358584cef.webp(
) Tóm tắt chức năng của các hệ thống
PerceptionSystem: Thu thập "kích thích" từ bên ngoài, cập nhật vào thành phần Perception của Agent
ExperienceSystem: Chuyển đổi Stimuli thành "trải nghiệm", lưu trữ vào thành phần Memory
ThinkingSystem: Hệ thống "suy nghĩ" của Agent, tạo ra ThoughtResult
ActionSystem: thực hiện pendingAction của Agent
GoalPlanningSystem: Đánh giá tiến độ mục tiêu, tạo ra mục tiêu mới
PlanningSystem: Tạo hoặc cập nhật kế hoạch thực hiện cho mục tiêu
RoomSystem: xử lý các cập nhật liên quan đến phòng, chẳng hạn như danh sách người ở
CleanupSystem: Xóa bỏ các thực thể không còn cần thiết
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-59f1984837d6636d7efc378c731a01eb.webp(
Phân tích kiến trúc tổng thể của ArgOS
) Cấu trúc lõi phân lớp
Bao gồm các lớp Components, Systems, Managers.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-c37bd7442c3743f80a4fd9ba8afc123b.webp(
) Thành phần ###Component( phân loại
Danh mục danh tính cốt lõi: Agent, PlayerProfile, v.v.
Hành vi và trạng thái: Hành động, Mục tiêu, Kế hoạch, v.v.
Nhận thức và trí nhớ: Perception, Memory...
Lĩnh vực môi trường và không gian: Room, OccupiesRoom, v.v.
Hình thức và tương tác: Appearance, UIState, v.v.
Hỗ trợ hoặc vận hành: Cleanup, DebugInfo, v.v.
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-19636582e09b473536b17c2de0c61fbc.webp(
) Kiến trúc Quản lý
Ngoài Component và System, còn cần người quản lý tài nguyên Manager:
RoomManager: Quản lý thông tin phòng
StateManager: Lấy trạng thái thế giới/đại lý đã lưu
EventBus: nghe sự kiện phát sóng
PromptManager: cung cấp mẫu Prompt LLM
ActionManager: Quản lý việc đăng ký và thực hiện Action
SimulationRuntime: Lập lịch Systems, tạo Managers
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, có thể mở rộng và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-b0180b99743a98bafb2b2d066900d65c.webp(
) và cơ sở dữ liệu tương tác
Tương tác với cơ sở dữ liệu thông qua StateManager/PersistenceManager:
Tải dữ liệu cốt lõi khi khởi động
Cập nhật dữ liệu thành phần Systems trong thời gian chạy
Lưu trữ định kỳ hoặc theo sự kiện
Lưu tất cả dữ liệu khi thoát
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-6a3ba796aae66b8a9f977ec99b5bb1c8.webp(
Điểm đổi mới kiến trúc
Các hệ thống hoạt động độc lập, không có mối quan hệ gọi.
Thiết kế mô-đun, dễ dàng thêm bớt chức năng
Hiệu suất kiến trúc ECS vượt trội hơn so với lập trình hướng đối tượng truyền thống
Chia hệ thống thành các cấp độ ý thức khác nhau, thiết kế tinh vi
Cực kỳ mô-đun, hiệu suất xuất sắc, chất lượng mã cao
Đây là một khung có mức độ mô-đun cao và hiệu suất tuyệt vời, cung cấp cho đội ngũ trò chơi và DeepAI những lựa chọn kiến trúc mới.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-aadac69287c878cdd84a72c6b8929ef2.webp(
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-4f9f7656a99298c7a027a5e4722ce4d5.webp(
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-62bbe0d65d3748c5bc0027c5ffa39288.webp(
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
13 thích
Phần thưởng
13
5
Đăng lại
Chia sẻ
Bình luận
0/400
LiquidityWitch
· 19giờ trước
gọi mời một chút ma thuật đen từ khung p89 này không nói dối đâu... đang cho tôi cảm giác của cuốn grimoire bị cấm thật sự
Xem bản gốcTrả lời0
ZkProofPudding
· 08-06 04:38
Thật không thể tin nổi, hiệu suất tăng cường chỉ dựa vào lời nói?
Project89: Đột phá mới trong khung AI Agent hiệu suất cao mô-đun
Phân tích Project89: Một thiết kế khung AI Agent thế hệ mới, mô-đun hóa và hiệu suất cao
Project89 đã áp dụng một cách hoàn toàn mới để thiết kế Agent Framework, đây là một Agent Framework hiệu suất cao dành cho phát triển trò chơi, có tính mô-đun hơn và hiệu suất tốt hơn so với các Agent Framework đang được sử dụng hiện tại.
Bài viết này sẽ giới thiệu chi tiết về sự nâng cấp kiến trúc của khung này so với khung Agent truyền thống.
Nền tảng nhà phát triển
Người sáng lập Project89 trước đây đã tham gia phát triển dự án Magick, đây là một phần mềm sử dụng AI để lập trình. Ông đứng ở vị trí thứ tư trong số các nhà phát triển của dự án này.
Tại sao nên sử dụng ECS để thiết kế Khung Agent
Từ quan điểm ứng dụng trong lĩnh vực trò chơi, hiện tại các trò chơi sử dụng kiến trúc ECS bao gồm:
Giới thiệu về ECS
ECS(Entity-Component-System) là một mô hình kiến trúc thường được sử dụng trong phát triển trò chơi và hệ thống mô phỏng, nó tách biệt hoàn toàn dữ liệu với logic, nhằm quản lý hiệu quả các thực thể và hành vi của chúng trong các cảnh quy mô lớn có khả năng mở rộng.
Entity( thực thể): chỉ là một ID, không chứa bất kỳ dữ liệu hoặc logic nào.
Thành phần (: dùng để lưu trữ dữ liệu hoặc trạng thái cụ thể của thực thể.
Hệ thống(Hệ thống): chịu trách nhiệm thực hiện các logic liên quan đến một số thành phần.
Lấy một hành động cụ thể của Agent làm ví dụ: trong ArgOS, mỗi Agent được coi là một Entity, nó có thể đăng ký các thành phần khác nhau, chẳng hạn như:
Quy trình làm việc của System:
Cảm nhận vũ khí, Hệ thống Perception cập nhật Thành phần Perception của Agent Entity
Hệ thống Memory gọi thành phần Perception và thành phần Memory, lưu trữ dữ liệu cảm nhận vào cơ sở dữ liệu
Hệ thống Hành động gọi Thành phần Bộ nhớ và Thành phần Hành động, lấy thông tin môi trường từ bộ nhớ, thực hiện các hành động tương ứng.
Nhận dữ liệu của mỗi Component đã được cập nhật của Agent Entity
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-4cd7ca20f2967b9025411d9985f64831.webp(
) Quy trình hoạt động của Hệ thống
Quá trình thực thi của hệ thống không phải là thứ tự gọi mà chúng ta tưởng tượng, mà là không có mối quan hệ gọi giữa các hệ thống, mỗi hệ thống thực hiện một lần trong khoảng thời gian quy định, ví dụ:
Kiến trúc Hệ thống ArgOS
ArgOS đã thiết kế nhiều Component và System để Agent có thể suy nghĩ sâu hơn và thực hiện các nhiệm vụ phức tạp.
ArgOS chia System thành ba cấp độ ###Cấp độ nhận thức (:
Có ý thức)CONSCIOUS(hệ thống
Tiềm thức)HỆ THỐNG SUBCONSCIOUS(
Vô thức)UNCONSCIOUS(hệ thống
Mối quan hệ giữa các hệ thống trong ArgOS rất phức tạp, thiết kế phân lớp giúp quy định tần suất thực hiện của các Hệ thống khác nhau.
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-69e16ae3b5af8c39e1fc522358584cef.webp(
) Tóm tắt chức năng của các hệ thống
PerceptionSystem: Thu thập "kích thích" từ bên ngoài, cập nhật vào thành phần Perception của Agent
ExperienceSystem: Chuyển đổi Stimuli thành "trải nghiệm", lưu trữ vào thành phần Memory
ThinkingSystem: Hệ thống "suy nghĩ" của Agent, tạo ra ThoughtResult
ActionSystem: thực hiện pendingAction của Agent
GoalPlanningSystem: Đánh giá tiến độ mục tiêu, tạo ra mục tiêu mới
PlanningSystem: Tạo hoặc cập nhật kế hoạch thực hiện cho mục tiêu
RoomSystem: xử lý các cập nhật liên quan đến phòng, chẳng hạn như danh sách người ở
CleanupSystem: Xóa bỏ các thực thể không còn cần thiết
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-59f1984837d6636d7efc378c731a01eb.webp(
Phân tích kiến trúc tổng thể của ArgOS
) Cấu trúc lõi phân lớp
Bao gồm các lớp Components, Systems, Managers.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-c37bd7442c3743f80a4fd9ba8afc123b.webp(
) Thành phần ###Component( phân loại
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-19636582e09b473536b17c2de0c61fbc.webp(
) Kiến trúc Quản lý
Ngoài Component và System, còn cần người quản lý tài nguyên Manager:
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, có thể mở rộng và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-b0180b99743a98bafb2b2d066900d65c.webp(
) và cơ sở dữ liệu tương tác
Tương tác với cơ sở dữ liệu thông qua StateManager/PersistenceManager:
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao]###https://img-cdn.gateio.im/webp-social/moments-6a3ba796aae66b8a9f977ec99b5bb1c8.webp(
Điểm đổi mới kiến trúc
Đây là một khung có mức độ mô-đun cao và hiệu suất tuyệt vời, cung cấp cho đội ngũ trò chơi và DeepAI những lựa chọn kiến trúc mới.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-aadac69287c878cdd84a72c6b8929ef2.webp(
![Giải cấu trúc Project89: một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-4f9f7656a99298c7a027a5e4722ce4d5.webp(
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-62bbe0d65d3748c5bc0027c5ffa39288.webp(