Skip to content
tinAI
Go back

Dirac: OSS coding agent topped Terminal-Bench-2 với 65.2% trên Gemini-3-flash-preview

Bài gốc: Dirac — Accurate & Highly Token Efficient Open Source AI Agent

Tác giả: Max Trivedi (Dirac Delta Labs)

Ngày đăng: Dịch ngày:

TL;DR

Dirac là OSS coding agent fork từ Cline, tập trung vào context curation: dùng hash-anchored parallel edits + AST manipulation để giảm 64.8% API cost so với agent khác trong khi cải thiện accuracy. Trên Terminal-Bench-2 leaderboard cho `gemini-3-flash-preview`, Dirac đạt 65.2% — vượt baseline Google (47.6%) và Junie CLI closed-source (64.3%). Có sẵn VS Code extension và CLI; license Apache 2.0; chính sách "no MCP".

Giới thiệu

Dirac là open-source coding agent xây dựng quanh một quan sát: reasoning ability của LLM giảm khi context dài lên — nên nếu giữ context được curate chặt, accuracy tăng và cost giảm cùng lúc, đồng thời các thay đổi lớn vẫn tractable trong một task.

Dirac là fork của Cline, tối ưu cho bang-for-the-buck: tooling đầy đủ với prompting tối thiểu, không cố ý đi theo hướng minimalist một cách mù quáng.

Tính năng chính

Hash-anchored parallel edits

Thay vì rewrite cả file mỗi lần edit (như nhiều agent khác làm), Dirac dùng hash anchor để xác định vị trí cần edit — cho phép:

AST manipulation

Với refactor task, Dirac parse code thành AST và thao tác trực tiếp trên cây cú pháp thay vì regex/text replace. Kết quả: ít hỏng syntax hơn, áp dụng được change tương tự lên nhiều function/class cùng lúc.

Triết lý “no MCP”

README ghi thẳng: Dirac không dùng MCP (Model Context Protocol). Lý do là họ tin tooling tối ưu hóa được trong code base trực tiếp tốt hơn việc plug-in qua protocol layer thêm.

Kết quả benchmark

Terminal-Bench-2 với gemini-3-flash-preview

AgentScore
Google official baseline47.6%
Junie CLI (closed-source)64.3%
Dirac65.2%

Đạt được không cần AGENTS.md hoặc benchmark-specific hint nào.

Cost reduction

Trên các real-world refactoring task chạy trên public GitHub repo, Dirac giảm trung bình 64.8% API cost so với Cline, Kilo, Ohmypi, Opencode, Pimono, Roo — trong khi đạt 100% accuracy nhất quán.

Cách sử dụng

VS Code Extension

Cài từ VS Code Marketplace.

CLI

npm install -g dirac-cli
dirac auth                                   # authenticate (or use env var)
dirac "Analyze the architecture of this project"

Environment variables (skip auth)

Dirac đọc API key từ env var, tiện cho CI/CD:

Common commands

dirac "prompt"                # interactive task
dirac -p "prompt"             # Plan Mode — xem strategy trước khi execute
dirac -y "prompt"             # Yolo Mode — auto-approve mọi action
git diff | dirac "Review these changes"   # pipe context
dirac history                 # view và resume previous task

Lưu ý

So what cho dev VN

Nếu bạn đang dùng Cline hoặc Roo và thấy bill API cao bất thường, Dirac đáng test thử trên một task refactor representative — nếu cùng workload mà giá giảm 50-70%, payback cho việc switch là vài ngày. Đặc biệt phù hợp với team budget eo hẹp đang chạy Gemini-3-flash-preview hoặc Claude Haiku 4.5 cho coding agent.


Read Original (EN) Quay lại Newsletter