Skip to content
tinAI
Go back

Browser Harness: harness tự chữa lành cho agent điều khiển trình duyệt

Bài gốc: Browser Harness — Self-healing harness for LLM browser tasks

Tác giả: browser-use

Ngày đăng: Dịch ngày:

TL;DR

Framework Python 592 dòng kết trực tiếp Chrome qua CDP websocket. Khác biệt chính: khi agent thiếu tool, nó tự sửa harness và viết thêm cho mình — không cần recipe hay abstraction layer.

Giới thiệu

Browser Harness là framework automation Python cho phép LLM hoàn thành task trên trình duyệt độc lập. Thay vì cung cấp sẵn “recipes” hoặc rail có cấu trúc, nó chỉ có một websocket CDP tới Chrome, không có gì ở giữa.

Triết lý: agent tự học pattern và tự viết thêm tool khi cần, thay vì bị ép theo workflow định sẵn.

Codebase khoảng 592 dòng Python — đủ nhỏ để đọc hết trong một buổi.

Tính năng chính

Self-healing

Khi agent gặp task nó chưa có function hỗ trợ, nó không fail. Thay vào đó agent tự edit harness và viết thêm tool cho chính mình. Đây là điểm khác biệt lớn nhất so với Browser Use (cùng tác giả) hay Playwright MCP.

Direct CDP connection

Kết nối trực tiếp Chrome qua Chrome DevTools Protocol websocket. Không có:

Đổi lại: agent có “complete freedom” để giải quyết task theo cách nó chọn.

Editable helpers

Helper function có thể được agent modify trong lúc chạy. Domain-specific skill files được auto-generate cho task lặp lại — lần sau agent nhớ lại cách làm.

Remote browsers

Hỗ trợ remote browser miễn phí:

Cách sử dụng

Setup prompt mặc định tham chiếu Claude — gợi ý compat tốt với Anthropic models. Docs không ghi rõ support cho model khác, nhưng vì kiến trúc đơn giản (chỉ là websocket), về lý thuyết dùng được với bất kỳ LLM nào có tool-calling.

Quy trình điển hình:

  1. Khởi động Chrome (local hoặc remote)
  2. Agent connect qua CDP
  3. Nhận task từ user
  4. Nếu thiếu tool → agent tự viết thêm vào harness
  5. Lưu skill để reuse lần sau

Khi nên dùng

Khi không nên dùng

Repo: github.com/browser-use/browser-harness


Read Original (EN) Quay lại Newsletter