AI BIẾT TUỐT:
GLTR là một công cụ được phát triển bởi phòng thí nghiệm AI của MIT-IBM Watson và HarvardNLP. Công cụ này có thể phát hiện văn bản được tạo tự động bằng cách sử dụng phân tích điều tra. Nó phát hiện khi nào một văn bản được tạo một cách giả tạo bằng cách phân tích khả năng một mô hình ngôn ngữ đã tạo ra văn bản đó.
GLTR phân tích trực quan đầu ra của mô hình ngôn ngữ GPT-2 117M từ OpenAI, cho phép nó xếp hạng từng từ theo khả năng nó được mô hình tạo ra.
Sau đó, công cụ sẽ đánh dấu các từ có khả năng xảy ra nhất bằng màu xanh lá cây, tiếp theo là màu vàng và đỏ, và các từ còn lại có màu tím. GLTR cung cấp chỉ báo trực quan trực tiếp về khả năng xuất hiện của từng từ trong mô hình, giúp dễ dàng xác định văn bản do máy tính tạo ra.
GLTR cũng hiển thị ba biểu đồ tổng hợp thông tin trên toàn bộ văn bản. Biểu đồ đầu tiên cho biết số lượng từ của mỗi danh mục xuất hiện trong văn bản, biểu đồ thứ hai minh họa tỷ lệ giữa xác suất của từ được dự đoán hàng đầu và từ tiếp theo, biểu đồ thứ ba hiển thị sự phân bố theo entropies của các dự đoán.
Bằng cách phân tích các biểu đồ này, GLTR cung cấp thêm bằng chứng về việc liệu một văn bản có được tạo ra một cách giả tạo hay không. GLTR có thể được sử dụng để phát hiện các đánh giá, nhận xét hoặc bài báo giả mạo được tạo bởi các mô hình ngôn ngữ lớn, có khả năng tạo ra các văn bản không thể phân biệt được từ văn bản do con người viết đến người đọc không phải là chuyên gia.
GLTR có thể được truy cập thông qua bản demo trực tiếp và mã nguồn có sẵn trên Github. Các nhà nghiên cứu cũng có thể đọc bài viết demo ACL 2019, bài viết này đã được đề cử cho bản demo hay nhất.
Đánh giá
Chưa có đánh giá nào.