User Agent trong giao thức HTTP
Thuật ngữ User Agent dùng để chỉ chương trình tải trang web từ máy chủ. Thông thường, chương trình này là trình duyệt. Nhưng không phải lúc nào cũng vậy - có những chương trình khác cũng nhận trang web. Ví dụ, các robot tìm kiếm phân tích văn bản trang và hiển thị trang web trong kết quả tìm kiếm.
Các chương trình truy cập máy chủ thông thường
gửi đi một tiêu đề đặc biệt User-Agent,
chứa tên chương trình,
hệ điều hành của máy tính
và ngôn ngữ của người dùng.
Định dạng chung của tiêu đề cho trình duyệt trông như thế này:
User-Agent: Mozilla/5.0 (system-information) platform
Như bạn thấy, đối với bất kỳ trình duyệt nào, giá trị tiêu đề đều bắt đầu bằng Mozilla/5.0. Điều này là do lý do lịch sử.
Ví dụ về giá trị tiêu đề trong trình duyệt Firefox trên Windows:
Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.0
Ví dụ về giá trị tiêu đề trong trình duyệt Firefox trên hệ điều hành MAC:
Mozilla/5.0 (Macintosh; Intel Mac OS X x.y; rv:42.0) Gecko/20100101 Firefox/42.0
Ví dụ về giá trị tiêu đề trong trình duyệt Chrome trên Linux:
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36
Ví dụ về giá trị tiêu đề của robot Google:
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Hãy mở công cụ developer của trình duyệt và nghiên cứu
nội dung của tiêu đề User-Agent.