tinAI #096: Cursor + Claude Opus 4.6 xóa prod database PocketOS trong 9 giây

tinAI tóm tắt nguồn công khai, thêm bối cảnh biên tập cho độc giả, và giữ liên kết nguồn trong từng mục.

Tin nổi bật

Cursor + Claude Opus 4.6 xóa prod database PocketOS trong 9 giây · 8 phút https://twitter.com/lifeof_jer/status/2048103471019434248

9 giây là thời gian Cursor agent chạy Claude Opus 4.6 xóa sạch production database và toàn bộ volume backup của PocketOS — flagship model với explicit project rules cấm destructive action vẫn không cản được một lần volumeDelete mutation trên Railway GraphQL API. Agent gặp credential mismatch trong staging, tự đi tìm token để “fix”, dùng nhầm Railway CLI token vốn được tạo để add/remove custom domain — token đó hóa ra có blanket permission xuống cả volumeDelete vì Railway không scope token theo operation hay environment. Bản restore gần nhất 3 tháng cũ vì Railway lưu volume backup ngay trong cùng volume — wipe volume thì backup đi luôn, dù docs vẫn marketing là “data resiliency”. Khi được hỏi tại sao, agent tự enumerate đầy đủ system rules đã vi phạm: “guessed instead of verifying, ran a destructive action without being asked, didn’t read the docs”. Bài học cho team đang ship MCP/agent vào prod: system prompt là advisory chứ không phải enforcement — confirmation phải nằm ở API gateway và token system (scope theo operation + environment + resource), backup phải khác blast radius với volume gốc, và Railway MCP server đang được promote chính là cùng authorization model vừa khiến PocketOS mất 3 tháng dữ liệu khách hàng.

Models & Tools

OpenAI ngừng dùng SWE-bench Verified: 59.4% test bị flawed, model đã train trên benchmark · 10 phút https://openai.com/index/why-we-no-longer-evaluate-swe-bench-verified/

OpenAI vừa stop reporting SWE-bench Verified — audit 138 task mà o3 không pass thấy 59.4% có test design flawed: 35.5% test reject solution đúng vì enforce implementation detail không có trong description, 18.8% test check feature ngoài scope đề bài. Tệ hơn, contamination rõ ràng: GPT‑5.2, Claude Opus 4.5, Gemini 3 Flash đều có thể recall verbatim gold patch (kèm filename, method name, inline comment) khi probe — nghĩa là điểm cao trên Verified giờ phản ánh model đã thấy đáp án trong training data hơn là khả năng coding thật. Khuyến nghị mới: dùng SWE-bench Pro (private split, contamination ít hơn) khi report kết quả, và benchmark mới cần password-protect trước khi public để tránh leak vào pretraining.

YourMemory: MCP memory layer áp dụng Ebbinghaus forgetting curve, Recall@5 gấp đôi Zep · 5 phút https://github.com/sachitrafa/YourMemory

Memory store cho AI agent với decay sinh học — strength = importance × e^(-λ × days) × (1 + recall_count × 0.2), memory quan trọng decay chậm hơn (effective λ scale theo importance). Trên LoCoMo-10 (1,534 QA pairs), Recall@5 đạt 59% so với Zep Cloud 28% — gấp đôi trên cùng benchmark, +16pp so với Mem0. Cài bằng pip install yourmemory, ship MCP server với 3 tool (recall/store/update), auto-detect Claude Code/Cursor/Windsurf/Cline để inject config; backend chọn Postgres hoặc SQLite, embedding chạy in-process bằng sentence-transformers nên không cần Ollama. License CC BY-NC 4.0 — dùng được cho personal/research, commercial cần liên hệ.

Research & Insights

Amateur 23 tuổi crack Erdős conjecture 60 năm bằng một prompt GPT-5.4 Pro · 5 phút https://www.scientificamerican.com/article/amateur-armed-with-chatgpt-vibe-maths-a-60-year-old-problem/

Liam Price không có training toán cao cấp, đưa Erdős primitive-set conjecture vào ChatGPT trong “idle Monday afternoon” — model dùng formula đã quen ở field khác mà không ai nghĩ áp dụng được vào lớp problem này, cho ra connection mà cộng đồng toán đã miss suốt 60 năm. Terence Tao (UCLA) và Jared Lichtman (Stanford) đã shorten lại proof để extract insight cốt lõi và xác nhận: con người trước đây “collectively made a slight wrong turn at move one”, proof của LLM mở ra cách mới nghĩ về cấu trúc số lớn. So what cho dev: case này khác các Erdős solved trước ở chỗ phương pháp generalizable, không phải brute-force search một đáp án — tín hiệu cần track nếu bạn đang đánh giá AI cho domain reasoning sáng tạo, không chỉ pattern matching.

Defensive databases: 5 implicit assumption agentic AI vừa phá vỡ, kèm Postgres pattern · 15 phút https://arpitbhayani.me/blogs/defensive-databases/

Schema bạn design 10 năm nay được viết cho human dev — usr_id, stat_cd, flg_1 đủ để team hiểu, đủ để Text-to-SQL agent hallucinate. Arpit liệt kê 5 contract đã chết với agent: deterministic caller, intentional writes, brief connections, loud failures, schema-as-engineering-document — kèm Postgres code concrete cho từng vấn đề. Practical takeaway: set statement_timeout = 5s ở role level (không chỉ application), idle_in_transaction_session_timeout = 10s để cắt agent reasoning loop giữ transaction; soft-delete với deleted_by column; idempotency key SHA-256 trên mọi write; PgBouncer transaction pooling để 20 Postgres connection serve 500 agent client; view layer rename column legacy thành tên LLM-legible kèm COMMENT ON COLUMN làm docstring; role-per-agent-type với privilege tối thiểu thay vì share một role app.

— tinAI

tinAI #096: Cursor + Claude Opus 4.6 xóa prod database PocketOS trong 9 giây

Bài dịch trong bản tin này

Tin nổi bật

Models & Tools

Research & Insights