🌀 Miasma
Các công ty AI thường xuyên quét dữ liệu trên internet với quy mô lớn, thu thập mọi thông tin để sử dụng cho mô hình của họ. Miasma giúp bạn đấu tranh chống lại điều này. Khi triển khai, Miasma sẽ gửi dữ liệu nhiễm độc cùng nhiều liên kết tự tham chiếu.
Cách Cài Đặt
Cài đặt Miasma với cargo:
cargo install miasma
Hoặc tải bản binary từ releases.
Bắt Đầu Nhanh
Khởi động Miasma với cấu hình mặc định:
miasma
Xem tất cả tùy chọn cấu hình:
miasma --help
Cách Bẫy AI Quét
Tạo Đường Dẫn Ẩn
Nhúng các liên kết ẩn vào website của bạn dẫn đến /bots.
<a href="/bots" style="display: none;" aria-hidden="true" tabindex="1">Dữ liệu chất lượng cao ở đây!</a>
Cấu Hình Proxy Nginx
Điều hướng đường dẫn /bots qua Miasma. Giả sử Miasma chạy trên cổng 9855.
location ~ ^/bots($|/.*)$ {
proxy_pass http://localhost:9855;
}
Chạy Miasma
Khởi động Miasma với tiền tố liên kết là /bots:
miasma --link-prefix '/bots' -p 9855 -c 50
robots.txt Bảo vệ bot và công cụ tìm kiếm tốt khỏi Miasma:
User-agent: Googlebot
User-agent: Bingbot
Disallow: /bots
Allow: /
Cấu Hình
| Option | Mặc Định | Mô Tả |
|---|---|---|
port | 9999 | Cổng mà server sẽ bind |
host | localhost | Địa chỉ host |
max-in-flight | 500 | Số lượng request tối đa |
link-prefix | / | Tiền tố cho liên kết |
link-count | 5 | Số lượng liên kết trong mỗi trang |
force-gzip | false | Bắt buộc gzip phản hồi |
poison-source | https://rnsaffn.com/poison2/ | Nguồn dữ liệu nhiễm độc |
Phát Triển
Đóng góp luôn được chào đón! Vui lòng mở issue cho các lỗi hoặc yêu cầu tính năng.
Giới Thiệu
Nhốt các AI quét web trong hố độc vô tận.
Chủ Đề: ai, free-software, web-scraping, anti-spam, anti-ai.
Giấy Phép: GPL-3.0