Chương 02

Chương 2: Memory và Skill, hai lớp khiến Hermes khác chatbot

Có hai thứ làm Hermes Agent đáng nghiên cứu hơn hầu hết các chatbot: memory và skill.

Một hệ AI trong doanh nghiệp không thể chỉ thông minh ở từng câu trả lời riêng lẻ. Nó phải tích lũy. Nó phải nhớ những điều đáng nhớ. Nó phải biến cách làm hiệu quả thành quy trình. Nếu không, bạn sẽ mãi phải làm một công việc rất tốn não: onboarding lại AI mỗi ngày.

Memory không phải là lưu tất cả

Nhiều người nghe “AI có memory” sẽ tưởng là lưu toàn bộ lịch sử chat. Cách đó nghe có vẻ mạnh, nhưng thực tế rất dễ tạo ra rác.

Một doanh nghiệp có hàng nghìn tin nhắn, email, file, quyết định, ý tưởng, bản nháp và các đoạn trao đổi nửa chừng. Nếu AI nhét hết vào trí nhớ, nó không thông minh hơn. Nó chỉ bị nhiễu hơn.

Hermes đi theo hướng memory có chọn lọc. Trong research, memory của Hermes được mô tả như một lớp bền vững nhưng có giới hạn, gồm thông tin về user, quy ước làm việc, project, môi trường, tool quirks và những điều đã học được. Các thông tin này được nén lại, cập nhật, thay thế khi trùng lặp, và chỉ giữ những gì có ích lâu dài.

Về mặt vận hành, cách này giống một trợ lý thật. Một trợ lý tốt không ghi lại mọi câu bạn nói. Họ nhớ những thứ giúp công việc lần sau trơn hơn: bạn thích báo cáo ngắn trước, email quan trọng phải kiểm tra người nhận, số liệu phải có nguồn, nội dung marketing không được nói quá, thay đổi production phải có bước duyệt.

Vì sao bounded memory lại quan trọng?

Một chi tiết kỹ thuật rất đáng chú ý trong research là Hermes không coi memory như một kho vô hạn đổ vào prompt. Memory có giới hạn ký tự. Điều này ban đầu nghe có vẻ hạn chế, nhưng lại là thiết kế rất thực dụng.

Khi phần memory được giữ gọn và ổn định, hệ thống có thể nạp nó vào context đầu phiên như một “snapshot” bền vững. Việc này giúp giảm chi phí token, giữ prompt cache tốt hơn và tránh việc hệ thống bị kéo lê bởi hàng đống chi tiết không còn quan trọng.

Với bạn, bài học ở đây là: trí nhớ của AI phải được quản trị giống trí nhớ tổ chức. Cái gì đáng nhớ thì lưu. Cái gì chỉ là tiến độ tạm thời thì không nên biến thành ký ức dài hạn. Cái gì sai hoặc cũ thì phải sửa.

Skill là SOP cho AI

Nếu memory trả lời câu hỏi “người dùng và môi trường này là ai?”, thì skill trả lời câu hỏi “việc này nên làm như thế nào?”.

Trong Hermes, skill là một thư mục có file chính thường gọi là SKILL.md, kèm theo scripts, templates, references hoặc assets nếu cần. Skill không chỉ là một prompt. Nó là procedural memory: tri thức quy trình.

Một skill tốt thường nói rõ:

Khi nào dùng skill này.
Các bước thực hiện.
Lệnh hoặc tool cần gọi.
Các lỗi thường gặp.
Cách kiểm chứng kết quả.

Điều này rất gần với SOP trong doanh nghiệp. Khác ở chỗ SOP truyền thống viết cho người. Skill viết cho agent.

Progressive disclosure: chỉ nạp đúng thứ cần dùng

Một vấn đề lớn của các agent là prompt bloat. Nếu CEO nhồi toàn bộ quy trình, toàn bộ tài liệu, toàn bộ tool instruction vào context, model sẽ vừa tốn token, vừa dễ nhiễu.

Hermes giải quyết bằng progressive disclosure. Đầu tiên agent chỉ thấy danh sách kỹ năng ở mức mô tả ngắn. Khi một skill phù hợp, nó mới nạp toàn bộ nội dung skill. Nếu skill cần tài liệu sâu hơn, agent chỉ mở đúng file tham chiếu cần dùng.

Nói đời thường: giống một nhân viên biết có tủ tài liệu, nhưng không bê cả tủ lên bàn. Khi cần quy trình viết báo cáo tuần, họ rút đúng quy trình đó ra đọc.

Vòng lặp học: làm xong, đóng gói, lần sau làm tốt hơn

Điểm hay của Hermes là sau một task phức tạp, đặc biệt những việc có nhiều bước và nhiều tool call, agent có thể tự đề xuất hoặc tự tạo skill mới. Nếu lần sau dùng skill đó mà gặp lỗi mới, nó có thể patch skill để bổ sung bài học.

Đây chính là ý “self-improving”. Không phải theo nghĩa model tự train lại trọng số ngay lập tức. Thực tế hơn: agent tự cải thiện lớp quy trình, prompt, tool sequence và checklist của mình.

Với doanh nghiệp nhỏ, đây là cơ chế rất mạnh. Vì công ty nào cũng có những việc lặp lại:

Tạo daily brief.
Tổng hợp inbox.
Viết content theo brand voice.
Chuẩn bị họp sales.
Phân tích feedback khách hàng.
Tạo proposal.
Rà KPI tuần.

Nếu mỗi việc làm xong đều để lại một playbook tốt hơn, công ty đang tích lũy năng lực vận hành. Không phải chỉ tích lũy file.

Rủi ro: skill sai cũng có thể được tái sử dụng

Phần này cần nói thẳng. Tự cải thiện không có nghĩa luôn cải thiện đúng. Nếu agent rút ra bài học sai, hoặc tool trả dữ liệu sai, hoặc con người duyệt qua loa, skill được tạo ra có thể đóng gói cả lỗi vào quy trình.

Vì vậy, human approval không phải phần trang trí. Với các workflow quan trọng, skill mới hoặc skill vừa cập nhật cần được người có trách nhiệm xem lại. AI có thể giúp công ty học nhanh hơn, nhưng con người vẫn phải giữ quyền phán xét cuối cùng.

Khi triển khai đúng, memory và skill biến Hermes từ một công cụ trả lời thành một hệ thống tích lũy. Và tích lũy mới là thứ tạo khác biệt dài hạn.

Mục lục Đọc bản gộp