Context Engineering

Nghệ thuật và khoa học của việc tuyển chọn tập token nhỏ nhất có tín hiệu cao để đạt chất lượng reasoning LLM tối đa trong khi giảm thiểu token usage.

Skill Này Làm Gì

Context Engineering giúp bạn thiết kế, debug và tối ưu hóa các agent systems khi giới hạn context cản trở hiệu năng. Nó cung cấp các frameworks để hiểu context degradation, implement các chiến lược compression và xây dựng các kiến trúc multi-agent cô lập công việc hiệu quả.

Hãy nghĩ về nó như người quản lý ngân sách context của bạn — theo dõi usage, phát hiện các degradation patterns và hướng dẫn bạn đến các kiến trúc tối đa hóa chất lượng reasoning trên mỗi token được sử dụng.

Khi Nào Kích Hoạt

Thiết kế hoặc debug agent systems
Giới hạn context cản trở hiệu năng
Tối ưu hóa chi phí hoặc latency
Xây dựng multi-agent coordination
Implement memory systems
Đánh giá hiệu năng agent
Phát triển LLM-powered pipelines

Nguyên Tắc Cốt Lõi

Chất lượng context > số lượng - Tokens tín hiệu cao tốt hơn nội dung đầy đủ
Attention là hữu hạn - U-shaped curve ưu tiên các vị trí đầu/cuối
Progressive disclosure - Load thông tin just-in-time
Isolation prevents degradation - Phân chia công việc qua sub-agents
Đo lường trước khi tối ưu - Biết baseline của bạn

Chiến Lược Bốn Bucket

Write: Lưu context ra ngoài (scratchpads, files)
Select: Chỉ pull context liên quan (retrieval, filtering)
Compress: Giảm tokens trong khi bảo tồn thông tin (summarization)
Isolate: Chia nhỏ qua sub-agents (partitioning)

Các Metrics Chính

Token utilization: Cảnh báo ở 70%, kích hoạt optimization ở 80%
Token variance: Giải thích 80% variance hiệu năng agent
Multi-agent cost: ~15x baseline single agent
Compaction target: Giảm 50-70%, mất <5% chất lượng
Cache hit target: 70%+ cho workloads ổn định

Sử Dụng

Kích hoạt khi hỏi về phần trăm context, rate limits, usage warnings, context optimization, agent architectures hoặc memory systems.

Câu Lệnh Mẫu

“Context usage của tôi hiện tại bao nhiêu? Tôi có nên lo lắng không?”
“Làm thế nào tôi có thể tối ưu hóa agent workflow này để dùng ít tokens hơn?”
“Thiết kế kiến trúc multi-agent để xử lý codebases lớn”
“Tại sao agent của tôi thất bại trên các files lớn?”
“Implement memory system cho kiến thức cross-session”

Quick Reference Topics

Fundamentals: Cấu trúc context, attention mechanics
Degradation: Lost-in-middle, poisoning, debugging failures
Optimization: Compaction, masking, caching, partitioning
Compression: Long sessions, chiến lược summarization
Memory: Cross-session persistence, knowledge graphs
Multi-Agent: Coordination patterns, context isolation
Evaluation: Testing agents, LLM-as-Judge, metrics
Tool Design: Tool consolidation, description engineering