Giới thiệu
Các nhà xuất bản tin tức nổi tiếng như The Guardian và The New York Times đang xem xét lại chính sách truy cập đối với Internet Archive do mối lo ngại về khả năng các công ty AI sử dụng nền tảng này để thu thập dữ liệu trái phép.
Tính năng chính
- Bảo vệ nội dung: Các nhà xuất bản đang hạn chế quyền truy cập vào các bài viết của họ thông qua Internet Archive nhằm ngăn chặn AI sử dụng dữ liệu cho mô hình huấn luyện.
- Điều chỉnh API: The Guardian đã thực hiện các bước để loại trừ các API của Internet Archive, đảm bảo URL các bài viết không dễ tiếp cận.
- Phản hồi từ Internet Archive: Nhà sáng lập Brewster Kahle nhấn mạnh rằng việc hạn chế này có thể khiến công chúng giảm khả năng tiếp cận lịch sử thông tin.
Cách sử dụng
Đối với nhà phát triển
- Quan trọng đối với Dev: Các nhà phát triển nên lưu ý về cách quản lý và bảo mật nội dung số khi bị ảnh hưởng bởi những thay đổi từ các nhà xuất bản và tổ chức như Internet Archive.
Ảnh hưởng chung
- Internet Archive: Tiếp tục sử dụng hệ thống lọc và hạn chế tốc độ để ngăn truy cập không hợp lệ, nhưng vấp phải khó khăn khi nhà xuất bản ngăn chặn robot của họ.
- Phản ứng công cộng: Có thể ảnh hưởng đến khả năng truy cập thông tin công khai và lịch sử internet cho cộng đồng do những hạn chế này.