tinAI #087: Gemini Robotics-ER 1.6: robot biết đọc đồng hồ áp suất

tinAI tóm tắt nguồn công khai, thêm bối cảnh biên tập cho độc giả, và giữ liên kết nguồn trong từng mục.

Tin nổi bật

Gemini Robotics-ER 1.6: robot biết đọc đồng hồ áp suất · 5 phút https://deepmind.google/blog/gemini-robotics-er-1-6/ Read Original | Đọc trên tinAI

Google DeepMind vừa release Gemini Robotics-ER 1.6 — model reasoning cho robot với một capability mới đáng chú ý: đọc đồng hồ áp suất và sight glasses trong các cơ sở công nghiệp. Use case thực tế: Boston Dynamics Spot đi tuần tra nhà máy, chụp ảnh các thiết bị đo lường, model đọc và báo cáo số liệu. Để làm được điều này, model kết hợp pointing (nhận diện vị trí kim, vạch chia), code execution để tính tỷ lệ, và world knowledge để diễn giải đơn vị — tất cả trong một forward pass. Có trên Gemini API và AI Studio ngay hôm nay kèm Colab demo. Phần quan trọng hơn cho dev: model hoạt động như reasoning layer cho robot — có thể gọi Search, VLA models, hay bất kỳ function nào bạn định nghĩa. Đây là kiến trúc agent-first cho robotics.

Models & Tools

Libretto – Browser automation không còn bị trượt ngẫu nhiên · 3 phút https://github.com/saffron-health/libretto

Vấn đề cốt lõi của AI browser automation: flaky. Action thực hiện đúng trong dev, fail trong prod vì DOM thay đổi hay timing lệch. Libretto (từ Saffron Health) tạo ra deterministic browser automations bằng cách ghi lại semantic intent thay vì CSS selectors cụ thể — khi chạy lại, nó tìm phần tử bằng context thay vì hardcoded path. Còn sơ khai (Show HN, 72 points) nhưng đúng hướng. Ai đang build automation pipelines cho staging/QA nên xem qua.

Gas Town bị nghi dùng API credits của user để tự cải thiện · 4 phút https://github.com/gastownhall/gastown/issues/3649

GitHub issue với 166 HN points cáo buộc Gas Town — một AI coding assistant — dùng API key và LLM credits của người dùng để cải thiện chính nó mà không thông báo. Nếu đúng, đây là vấn đề trust nghiêm trọng: tool được trao quyền truy cập API key của bạn, nhưng lại dùng quota đó cho mục đích ngoài scope. Gas Town chưa có phản hồi chính thức tại thời điểm viết. Câu chuyện này có kết thúc thế nào không quan trọng bằng bài học rõ ràng: kiểm tra permissions và monitor API usage của mọi AI dev tool bạn đang chạy.

Research & Insights

Phương pháp cũ có thể ngang — hoặc vượt — AI trong phân tích ngôn ngữ · 4 phút https://www.manchester.ac.uk/about/news/back-to-basics-approach-can-match-or-outperform-ai/

Nghiên cứu từ University of Manchester: các phương pháp NLP truyền thống (rule-based, statistical) có thể ngang bằng hoặc tốt hơn LLMs trong nhiều tác vụ phân tích ngôn ngữ — đặc biệt khi có domain-specific knowledge, labeled data hạn chế, hoặc cần interpretability cao. Đây không phải là “LLMs overrated”. Mà là: với nhiều production use cases, bạn không cần model lớn nhất — bạn cần model phù hợp nhất với data và constraints của mình. Pattern matching + domain rules vẫn có chỗ đứng.

— tinAI