Hãy cùng tìm hiểu những cách sử dụng WebSite Auditor thông qua những phân tích chi tiết dưới đây.
Site crawling & auditing
Nền tảng của bất kỳ chiến lược SEO nào là sự hiểu biết kỹ lưỡng về tình trạng trang web của bạn.
- Thu thập dữ liệu toàn bộ trang web (bất kể hướng dẫn của robots): Theo mặc định, WebSite Auditor sẽ thu thập dữ liệu các trang và tài nguyên trên trang web của bạn được cho phép đối với tất cả các bot trong robots.txt của bạn.
- Thu thập dữ liệu trang web thay mặt cho Googlebot (hoặc bất kỳ bot nào khác): WebSite Auditor cho phép bạn thu thập dữ liệu các trang web theo hướng dẫn robots.txt cho một bot cụ thể mà bạn chọn.
- Thu thập dữ liệu trang web dưới dạng một user agent cụ thể: Tùy thuộc vào mục đích kiểm tra của bạn, đôi khi bạn có thể muốn sử dụng một user agent cụ thể để thu thập dữ liệu trang web của mình.
- Chỉ thu thập dữ liệu một số trang nhất định trên trang web của bạn: Nếu bạn cần tập trung vào nội dung cụ thể, bạn có thể chỉ thu thập dữ liệu các thư mục và trang đã chọn thay vì toàn bộ trang web.
- Loại trừ một số trang nhất định khỏi quá trình thu thập dữ liệu: Để đảm bảo trình thu thập dữ liệu chỉ tập trung vào các trang công khai quan trọng, đôi khi bạn có thể muốn loại trừ một số trang hoặc thư mục khỏi quá trình thu thập dữ liệu.
- Thu thập dữ liệu một trang web và tất cả các tên miền phụ của nó: Nếu trang web của bạn bao gồm các tên miền phụ, bạn có thể thu thập dữ liệu chúng cùng với miền chính của mình.
- Thu thập dữ liệu một tên miền phụ cụ thể: Trong một tác vụ cụ thể, bạn có thể cần phân tích một tên miền phụ duy nhất của trang web của mình.
- Thu thập dữ liệu trang web AJAX và nội dung động: Rất nhiều trang web có nội dung động như đề xuất được cá nhân hóa và nguồn cấp dữ liệu phương tiện.
- Phát hiện bất kỳ thông số URL không cần thiết nào: Đôi khi các trang của bạn có thêm các bit được thêm vào URL của chúng (như những thứ kỳ lạ bạn thấy sau dấu hỏi chấm).
- Tìm tất cả các trường hợp của các tham số URL cụ thể: WebSite Auditor có thể hữu ích nếu bạn cần lấy danh sách các trang có tham số URL nhất định.
- Thu thập dữ liệu một trang web được lưu trữ trên một máy chủ cũ: Các máy chủ cũ có thể không thể xử lý số lượng yêu cầu đồng thời được gửi bởi các trình thu thập thông tin.
- Thu thập dữ liệu một trang web được bảo vệ bằng mật khẩu: Với WebSite Auditor, bạn có thể thu thập dữ liệu các trang web, một số tên miền phụ hoặc thư mục nhất định yêu cầu xác thực.
- Tìm tất cả các tài nguyên thuộc một loại nhất định: Theo mặc định, WebSite Auditor sẽ thu thập tất cả các loại tài nguyên nội bộ và bên ngoài được sử dụng trên trang web của bạn.
- Kiểm tra các chỉ số Core Web Vitals: Vì các chỉ số Core Web Vitals là một yếu tố xếp hạng quan trọng đối với Google, việc đo lường các chỉ số này sẽ trở thành một phần trong quy trình kiểm tra thường xuyên của bạn.
- Lấy danh sách các trang có lỗi W3C: Nhiều lỗi W3C có thể cản trở nỗ lực SEO của trang web.
- Khám phá các vấn đề về JavaScript và CSS: JavaScript và CSS rất cần thiết để tạo ra trải nghiệm người dùng mượt mà và hiệu suất trang web tuyệt vời.
Response codes and redirects
Các trang bị hỏng và chuyển hướng không chính xác khiến người dùng thất vọng và cản trở SEO, vì vậy việc kiểm tra thường xuyên là rất quan trọng để có một trang web lành mạnh.
- Tìm tất cả các tài nguyên có mã trạng thái 4xx/5xx: Mã trạng thái là thông báo lỗi từ trang web của bạn. Mã 4xx (lỗi máy khách) có nghĩa là có sự cố với yêu cầu của người dùng. Mã 5xx (lỗi máy chủ) cho biết sự cố ở phía cuối trang web của bạn.
- Tìm tài nguyên bị hạn chế lập chỉ mục: Nếu bạn muốn đảm bảo rằng kết quả tìm kiếm chỉ bao gồm các trang có liên quan cho người dùng (không có thông tin cá nhân hoặc nội dung chưa hoàn thành), bạn có thể kiểm tra danh sách các trang bị hạn chế lập chỉ mục.
- Xem tất cả các trang được chuyển hướng trên một trang web: Chuyển hướng không chính xác có thể đưa người dùng đến các trang không liên quan hoặc tạo ra các vòng lặp gây khó chịu.
- Xác định chuỗi chuyển hướng: Chuỗi chuyển hướng dài không tốt cho trang web của bạn vì chúng làm chậm thời gian tải.
- Xem tiêu đề phản hồi HTTP của một trang: Nếu bạn cần thu thập thông tin về hiệu suất máy chủ, chỉ thị bộ nhớ cache và các lỗ hổng bảo mật tiềm ẩn, bạn có thể cần xem tiêu đề phản hồi HTTP.
- Kiểm tra các phiên bản HTTP/HTTPS hoặc www/non-www của trang web: Nếu bạn không duy trì tính nhất quán trong các phiên bản trang web (ví dụ: cả phiên bản www và non-www của trang web đều được lập chỉ mục), bạn có thể gặp phải các vấn đề về nội dung trùng lặp và thứ hạng trang web thấp.
- Lấy danh sách tất cả các trang có rel=”canonical”: Khi có nhiều tài nguyên có nội dung tương tự, việc gán thẻ rel=”canonical” sẽ đảm bảo rằng các công cụ tìm kiếm nhìn thấy tài nguyên chính xác, dự định.
- Lấy danh sách các trang có nhiều URL chính tắc: Trường hợp có nhiều URL chính tắc trên một trang có thể xảy ra khi một số CMS tự động thêm thẻ chính tắc vào các trang của trang web.
- Xác định các trang sử dụng meta refresh: Meta refresh được sử dụng như một kỹ thuật spam phổ biến và không phải là cách chuyển hướng thân thiện với SEO nhất.
- Tìm tất cả các liên kết dofollow bên ngoài từ một trang web: Nếu bạn cần kiểm tra xem mình đang liên kết với ai, bạn có thể nhận được danh sách đầy đủ các liên kết dofollow bên ngoài trong WebSite Auditor.
- Xác định tất cả các liên kết bị hỏng trên một trang web: Các liên kết bị hỏng có thể làm tổn hại đến danh tiếng và SEO của trang web của bạn, khiến người dùng cảm thấy lạc lõng và cho các công cụ tìm kiếm biết rằng trang web của bạn được bảo trì kém.
- Lấy danh sách tất cả các liên kết nội bộ/bên ngoài từ bất kỳ trang nào: Nếu bạn cần lấy danh sách các liên kết đến/từ một trang nhất định, hãy chuyển đến Cấu trúc trang web > Trang.
- Lấy danh sách các liên kết bị hỏng từ một trang cụ thể: Để biết danh sách các liên kết bị hỏng từ các trang cụ thể, hãy chuyển đến Cấu trúc trang web > Trang và chuyển sang tab Liên kết & yếu tố kỹ thuật.
- Nhận chi tiết về bất kỳ liên kết nội bộ/bên ngoài nào: Để biết thông tin chi tiết về bất kỳ liên kết nào, hãy chuyển đến Cấu trúc trang web > Trang và nhấp vào một trong các trang trong bảng.
- Tìm các trang mồ côi: Các trang mồ côi không được liên kết với các trang khác trên trang web của bạn.
- Tìm các trang bị chôn quá sâu trên trang web của bạn: Để dễ dàng phát hiện các trang khó tìm đối với người dùng và công cụ tìm kiếm, bạn có thể sử dụng chỉ số Click Depth.
- Tìm các trang có quá nhiều liên kết gửi đi: Một trang có quá nhiều liên kết gửi đi có thể gây hại cho trang web của bạn theo hai cách. Đối với người dùng, nó quá tải và gây mất tập trung. Đối với các công cụ tìm kiếm, nó có thể trông giống như spam.
Yếu tố khác
Bên cạnh những cách kể trên, cần phải đề cập đồng thời đến:
- Site content: Kiểm tra thường xuyên giúp bạn phát hiện các vấn đề khiến trang web của bạn không thu hút được nhiều lưu lượng truy cập hơn và đạt thứ hạng cao hơn trong tìm kiếm.
- Meta tags & URLs: Thẻ meta thích hợp và URL mô tả giúp cả người dùng và công cụ tìm kiếm hiểu trang của bạn nói về điều gì. Khắc phục sự cố trong các yếu tố này sẽ cải thiện thứ hạng tìm kiếm và mức độ tương tác của người dùng.
- Robots.txt file: Vì tệp robots.txt hướng dẫn các trình thu thập thông tin của công cụ tìm kiếm nên điều quan trọng là phải kiểm tra trạng thái của tệp này thường xuyên. Một tệp bị hỏng hoặc không chính xác có thể vô tình chặn các trang quan trọng không bị lập chỉ mục và làm tổn hại đến khả năng hiển thị.
Với những cách như trên, bạn có thể chủ động sử dụng WebSite Auditor một cách thuận lợi và hiệu quả.