[Phần 2] Tìm hiểu về sơ đồ trang web - RSS Feed

[Phần 2] Tìm hiểu về sơ đồ trang web - RSS Feed

903 | ★★★★☆RSS feed hay Sitemap còn gọi là sơ đồ website là danh sách các trang web được tạo nên nhằm giúp cho trình thu thập dữ liệu web để chúng có thể tìm thấy nội dung web của bạn nhanh chóng và dễ dàng

[Phần 1] Tìm hiểu về sơ đồ trang web hay sitemap - sự cần thiết của sitemap cho Seo web

  7.7. RSS feed

  Bạn phải thêm tất cả thông tin về liên kết cho kênh trong thẻ <channel> và cho mỗi URL trong thẻ <item>:

  Cấu trúc tổng quát của RSS như sau:

  <?xml version="1.0" encoding="UTF-8"?>
  <rss version="2.0">
  <channel>
   <title>Ilook.asia chia sẽ thông tin không giới hạn</title>
   <link>https://ilook.asia/feed</link>
   <description>ilook là một trong những chuyên trang phi thương mại - Ilook chia sẽ miễn phí sách, ebook, mã nguồn mở, source code, template,..tiên phong tại việt nam nói riêng, châu á nói chung. Bên cach đó ilook cũng chia sẽ, đóng góp những kiến thức hữu ích trong các lĩnh vực của cuộc sống như: khoa học,kỹ thuật, văn hóa, nghệ thuật,...nhắm hướng đến đóng góp một phần vào sự phát triển tích cực, bền vững và có ích cho xã hội</description>
   <language>Vn-vi</language>
   <image>
    <url>https://ilook.asia/images/logo.png</url>
    <title>Ilook.asia logo</title>
   </image>
   <item>
    <title>Sách </title>
    <link>https://ilook.asia/sach</link>
    <description>Chia sẽ và download sách miễn phí tại ilook.asia</description>
    <pubDate>Mon,30 Oct 2017 14:00:52 +0000</pubDate>
   </item>
   
  </channel>
  </rss>

  7.8. mRSS extension

  -  Nguồn cấp dữ liệu mRSS giống với một sơ đồ trang web RSS, nhưng chỉ có một sự khác biệt - nó được tạo cho nội dung video. Một ví dụ rất rõ ràng và đầy đủ về mRSS xem Vimeo mRSS feed

  - Cấu trúc tổng quát của mRSS như sau:

  <rss xmlns:media="http://search.yahoo.com/mrss/" version="2.0">
  <channel>
   <title>Ilook.asia chia sẽ thông tin không giới hạn</title>
   <link>https://ilook.asia/feed</link>
   <description>ilook là một trong những chuyên trang phi thương mại - Ilook chia sẽ miễn phí sách, ebook, mã nguồn mở, source code, template,..tiên phong tại việt nam nói riêng, châu á nói chung. Bên cach đó ilook cũng chia sẽ, đóng góp những kiến thức hữu ích trong các lĩnh vực của cuộc sống như: khoa học,kỹ thuật, văn hóa, nghệ thuật,...nhắm hướng đến đóng góp một phần vào sự phát triển tích cực, bền vững và có ích cho xã hội</description>
   <language>Vn-vi</language>
   <image>
    <url>https://ilook.asia/images/logo.png</url>
    <title>Ilook.asia logo</title>
   </image>
    <item>
     <title>Sách </title>
    <link>https://ilook.asia/sach</link>
    <description>Chia sẽ và download sách miễn phí tại ilook.asia</description>
    <pubDate>Mon,30 Oct 2017 14:00:52 +0000</pubDate>
    <media:content>
      <media:player url="https://www.example.com/video/1234"/>
      <media:credit role="author" scheme="https://www.example.com/user12"></media:credit>
      <media:thumbnail height="540" width="960" url="https://www.example.com/video/1234.webp"/>
      <media:title>Sitemaps</media:title>
    </media:content>
   </item>
   
   
  </channel>
  </rss>
  

  7.9. Một website có nhiều sitemap

  Khi bạn sẽ tạo các sơ đồ trang web có cấu trúc tốt, điều này sẽ giúp bạn theo dõi và quản lý việc lập chỉ mục một cách dễ dàng và hiệu quả.

  Search Console sẽ cung cấp thông tin về số lượng URL trong mỗi sơ đồ trang web được lập chỉ mục. Xem bảng điều khiển sơ đồ trang web này là một ví dụ:

   

  Sitemap index trong google search console

  Trong trường hợp website bạn có nhiều danh mục khác nhau, bạn có thể tạo riêng cho từng mục mỗi loại sitemap khác nhau. Sau đó bạn sẽ liên kết các sitemap này lại với nhau  thông qua một file sitemap mà ta gọi là sitemap index. Xem một file sitemap index của ilook.asia như sau:

  <?xml version="1.0" encoding="UTF-8"?>
  <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
  <loc>https://ilook.asia/sitemap/index.xml</loc>
  <lastmod>2018-11-28</lastmod>
  </sitemap>
  <sitemap>
  <loc>https://ilook.asia/sitemap/thuthuat.xml</loc>
  <lastmod>2018-11-28</lastmod>
  </sitemap>
  <sitemap>
  <loc>https://ilook.asia/sitemap/product.xml</loc>
  <lastmod>2018-11-28</lastmod>
  </sitemap>
  <sitemap>
  <loc>https://ilook.asia/sitemap/book.xml</loc>
  <lastmod>2018-11-28</lastmod>
  </sitemap>
  <sitemap>
  <loc>https://ilook.asia/sitemap/video.xml</loc>
  <lastmod>2018-11-28</lastmod>
  </sitemap>
  </sitemapindex>

  8. Những lưu ý quan trọng khi tạo cấu trúc sitemap

  a. Khi bạn sẽ tạo một sơ đồ trang web, bạn phải hoàn thành một số giới hạn và thực hiện theo các quy tắc sau: Sử dụng mã hóa chính xác, thoát ký tự và định dạng URL.

  - Sử dụng mã hóa UTF-8

  - Sử dụng URL tuyệt đối khi tao các url trong sitemap,

  + Ví dụ URL tương đối như: sitemap/sitemap.xml ---> trách sử dụng cho url sitemap

  + Ví dụ URL tuyệt đối như: http://ilook.asia/sitemap/sitemap.xml ---> Nên sử dụng cho url sitemap

  - Bạn có thể nén sơ đồ trang web - sitemap.xml  bằng phương pháp gzip

  - Loại bỏ những ký tự đặc biệt sau:

  Loại ký tự Ký tự đặc biệt Ký tự mã hóa tương ứng
  Ampersand & &amp;
  Single quote &apos;
  Double quote &quot;
  Greater than > &gt;
  Less than < &lt;

  Ví dụ: bạn có url là:

   ------> Ký tự đặc biệt là  (&): http://ilook.asia/thu-thuat/view/tim-hieu-ve-amp-html-amp-html-la-gi-cach-tao-va-su-dung-96.html&lang=en

   ------> Thay thế bằng (&amp;):  http://ilook.asia/thu-thuat/view/tim-hieu-ve-amp-html-amp-html-la-gi-cach-tao-va-su-dung-96.html&amp;lang=en

        -  Loại bỏ dấu hoặc các kí tự non-ASCII: 

  Ví dụ: bạn có url là:

   ------> Url có dấu: http://ilook.asia/thu-thuat/view/tìm hiểu về AMP

   ------> Nê thay thế bằng không dấu:  http://ilook.asia/thu-thuat/view/tim-hieu-ve-amp

  b. Mỗi sơ đồ trang web phải chứa ít hơn 50.000 URL hoặc kích thước tệp không được vượt quá 50MB không nén. (Xem ảnh)

  những giới hạn cần lưu ý khi tạo sitemap

  c. URL nào nên được đặt trong sơ đồ trang web?

  - Việc lựa chọn các URL lý tưởng vào một sơ đồ trang web là một việc khá quan trọng.

  Thực tiễn không tốt là đặt mọi URL của trang web trong sitemap.

  - Bao gồm các trang web bạn muốn xếp hạng trong Google và muốn hiển thị cho người dùng - những trang web quan trọng và chất lượng.

  - Những trang có đặc điểm như bên dưới nên được Loại trừ - không nên đặt vào sitemap:

  --> Những trang có tính chất riêng tư như: Các trang hữu ích, rất cần thiết và hữu ích cho người dùng (xem biểu mẫu, tài khoản, danh sách mong muốn, v.v.)

  --> Bất kỳ chuyển hướng (3xx), trang có khách hàng (4xx) hoặc trang lỗi máy chủ (5xx)

  --> Các URL có thông số hoặc phiên id được sử dụng

  --> URL được tạo bằng cách lọc (không cần thiết cho SEO)

  --> URL trên các tên miền phụ khác hơn sitemap.xml được đặt; nếu bạn có URL trên các tên miền phụ khác, bạn phải đặt một sơ đồ trang web khác ở đó

  --> Trang được Canonicalised

  --> Các trang được phân trang

  --> Trang trùng lặp

  --> Các trang không được robots.txt cho phép: Ví dụ: nội dung file robots.txt có dòng: disable tim-kiem/bimat    ---> Nghĩa là trong sitemap bạn không nên đặt các url liên quan đến tim-kiem/bimat

  --> Các trang có noindex

  d. Kiểm tra lỗi khi tạo sitemap

  Sơ đồ trang web được tạo có thể quá phức tạp và rất dễ mắc lỗi. Sau khi bạn tạo sơ đồ trang web, tôi khuyên bạn nên xác thực nó bằng Trình xác thực Sơ đồ trang web Yandex và sau đó với Google Search Console.

  + Sử dụng Yandex Sitemap Validator:

  - Trình xác thực của Yandex rất dễ sử dụng. Bạn có thể nhập văn bản, URL có sơ đồ trang web hoặc chỉ cần tải lên một tệp.

  - Kiểm tra tính hợp lệ nào:

  --> Kiểm tra sơ đồ trang web XML cơ bản, nguồn cấp dữ liệu RSS và chỉ mục sơ đồ trang web. Thật không may, nó không giúp bạn với các tiện ích mở rộng sơ đồ trang web như Sơ đồ trang web hình ảnh.

  --> Kiểm tra cú pháp XML

  --> Hiển thị kích thước tệp

  --> Hiển thị số lượng liên kết trong sơ đồ trang web

  Trình kiểm tra Sơ đồ trang web Yandex phục vụ kết quả ngay lập tức. Đây là một công cụ tuyệt vời để kiểm tra sơ đồ trang web ban đầu hoặc để kiểm tra sơ đồ trang web của các tên miền mà bạn không sở hữu.

  + Sử dụng Google Search Console

  - Bảng điều khiển tìm kiếm kiểm tra hầu hết mọi thứ, bao gồm tất cả các tiện ích mở rộng sơ đồ trang web, mã trạng thái URL và hơn thế nữa.

  - Đây là giải pháp tốt nhất cho thử nghiệm sơ đồ trang web của bạn. Tuy nhiên, Search Console mất một thời gian để tiếp tục - từ vài giờ đến vài ngày.

   - Bạn không thể kiểm tra đầu vào văn bản hoặc sơ đồ trang web trên các miền bên ngoài. 

  9. Thông báo cho các công cụ tìm kiếm về sơ đồ trang web của bạn khi tạo xong

  Để các công cụ tìm kiếm xử lý sơ đồ trang web, trước hết họ phải tìm hiểu về chúng, nếu không, các sơ đồ trang web sẽ vô ích đối với SEO. Có một số cách để làm điều này:

  Sau đây là các phương thức mà công cụ tìm kiếm sử dụng để tìm và sử dụng sơ đồ trang web của bạn. Bạn có thể kết hợp nhiều hơn một trong các phương pháp sau:

  --> Đặt vị trí sơ đồ trang web tại robots.txt.

  --> Viết vị trí sơ đồ trang web vào mã nguồn.

  --> Gửi sơ đồ trang web thông qua công cụ quản trị trang web của công cụ tìm kiếm.( Search engine’s webmaster tools: --> Google Search Console hoặc Bing Webmaster Tools)

  --> Tự đăng ký với tư cách là nhà xuất bản để sử dụng Sơ đồ trang web Google Tin tức.

  a. Sử dụng file Robots.txt

  Đặt một hay nhiều sơ đồ trang web của trong file robots.txt. Dưới đây là một ví dụ:

  User-agent: *
  Sitemap: http://ilook.asia/sitemap/sitemap.xml
  Sitemap: http://ilook.asia/sitemap/book.xml
  Sitemap: http://ilook.asia/sitemap/thu-thuat.xml
  Sitemap: http://ilook.asia/sitemap/video.xml
  Sitemap: http://ilook.asia/sitemap/sach.xml

  b. Viết vị trí sơ đồ trang web vào mã nguồn.

  Các công cụ tìm kiếm cũng có thể tìm hiểu về sơ đồ trang web của bạn từ thẻ <a> đơn giản liên kết đến đích của sơ đồ trang web, nhưng phương pháp này không đáng tin cậy và không đảm bảo rằng mọi công cụ sẽ tìm thấy nó.

  Nguồn cấp dữ liệu RSS hơi khác một chút và phải được thêm vào mã nguồn. Sau đâ là một ví dụ:

  <link rel="alternate" type="application/rss+xml" href="rss-path">

  c. Search engine’s webmaster tools

  Lưu ý rằng: Không phải tất cả các công cụ tìm kiếm đều có công cụ quản trị trang web riêng của họ (ví dụ coccoc không có trang quản trị). Nếu một sơ đồ trang web XML không cần phải được bảo mật, nó cũng sẽ được liệt kê trong robots.txt.

  + Google Search Console

  - Truy cập  Search Console --> chọn  “Sitemaps” phía dưới mục “Crawl.”

  - Chọn  “Add/Test Sitemap” --> nhập đường dẫn đến sitemap, nhấn nút--> “Test” trước khi nhấn nút --> “Submit”.

  - Sau bước này, bạn có thể xem có bao nhiêu trang web và các tệp khác được tìm thấy trong sơ đồ trang web; nhấp vào “Đóng kiểm tra” và nhấn “Gửi”.

  - Bây giờ, hãy lặp lại quy trình này và sao chép tất cả các sơ đồ trang web mà bạn có từng cái một trong các công cụ quản trị trang web. Nếu sơ đồ trang web được liệt kê trong chỉ mục sơ đồ trang web, bạn chỉ cần gửi chỉ mục.

  Add sitemap to Google Search Console

  Bạn có thể gửi tối đa 500 tệp chỉ mục sơ đồ trang web trong Search Console.

  + Bing Webmaster Tools

  - Truy cập  Bing Webmaster Tools.

  - Chọn Dashboard- > Configure my site -> Sitemap.

  - Nhập đường dẫn đến file sitemap của bạn sau đó nhấn nút "submit"

  Add sitemap in Bing Webmaster tools

  Với Công cụ quản trị trang web Bing, bạn chỉ có thể xem số lượng trang đã gửi, chứ không chỉ số trang được lập chỉ mục. Do đó, việc phân tích dữ liệu không dễ dàng như trong Search Console. Điều này cũng đúng với Yandex

  + Yandex Webmaster Tools (Cần lưu ý Tool này của Nga)

  - Open Yandex Webmaster Tools.

  - Chọn Dashboard -> Indexing -> Sitemaps file.

  - Nhập đường dẫn đến file sitemap của bạn sau đó nhấn nút "add"

  Add sitemap to Yandex Webmaster tools

  d. Đăng ký với tư cách là nhà xuất bản để sử dụng Sơ đồ trang web

  Cho đến khi trang web của bạn được đưa vào Google Tin tức, Google không sử dụng sơ đồ trang web tin tức của bạn. Bạn có thể yêu cầu đưa vào để khai báo  Google News Publisher Center

   

  Register yourself as a publisher to use Google News Sitemap

  Lưu ý rằng Đối thủ cạnh tranh của bạn có thể lạm dụng sơ đồ trang web hiển thị

  Vị trí của sơ đồ trang web trong robots.txt hoặc mã nguồn là công khai. Bất cứ ai cũng có thể tìm thấy nó. Nếu bạn có một sơ đồ trang web có cấu trúc và phức tạp, các đối thủ cạnh tranh có thể dễ dàng lấy dữ liệu có thể sử dụng được, như danh sách các danh mục, thẻ hoặc tất cả các sản phẩm của bạn.

  Mặt khác, ngay cả khi bạn không có sơ đồ trang web hiển thị và đối thủ cạnh tranh muốn dữ liệu đó, họ sẽ nhận được nó. Nhưng họ sẽ phải cố gắng hơn nữa. Để có được và làm sạch dữ liệu, họ phải sử dụng trình thu thập dữ liệu web. Nhưng cách này khó hơn nhiều so với việc phân tích cú pháp các tệp sơ đồ trang web.

  Hãy cẩn thận. Nếu bạn nhận được 99% lưu lượng truy cập của mình từ Google, Bing và các công cụ tìm kiếm khác có công cụ quản trị trang web của riêng họ, hãy xem xét quyền riêng tư của sơ đồ trang web của bạn. Không cần phải liên kết đến sơ đồ trang web của bạn trong tệp robots.txt.

  10. Ping công cụ tìm kiếm ngay sau mỗi lần cập nhật

  Khi thêm trang web mới vào sơ đồ trang web, bạn có thể thông báo cho các công cụ tìm kiếm thông qua cái gọi là “ping”. Họ sẽ biết về những thay đổi ngay lập tức và sau đó họ có thể lập chỉ mục nội dung mới.

  "Ping" sơ đồ trang web của bạn trong công cụ tìm kiếm bằng cách nhập URL tùy chỉnh như sau:

  --> Google: http://www.google.sk/ping?sitemap=http://example.com/sitemap-path.xml

  -->  Bing: http://www.bing.com/ping?sitemap=http://example.com/sitemap-path.xml

  Đối với bất kỳ công cụ tìm kiếm nào khác, hãy thử sử dụng mẫu URL này để bing:

  <searchengine_URL>/ping?sitemap=http://example.com/sitemap-path.xml
  Cách sử dụng Google Meet
  View 1016 - Rating ★★★★☆

  Cách sử dụng Google Meet

  Mô tả: Google meet là hệ thống học tổ chức họp, tổ chức lợp học trực tuyến qua mạng trên nền Web được tích hợp trong bộ G-suite của Google. Bên cạnh Zoom, Microsoft Team thì Google Meet cũng là phần mềm học trực tuyến được rất nhiều giáo viên, học sinh lựa chọn sử dụng.

  [Phần 02]Cách phân biệt và triển khai giữa remarketing và retargeting trong quảng cáo
  View 355 - Rating ★★★★☆

  [Phần 02]Cách phân biệt và triển khai giữa remarketing và retargeting trong quảng cáo

  Mô tả: Retargeting nghĩa là chọn lại mục tiêu(tức là khách hàng) đã chọn trước đó cho mục đích quảng cáo, retargeting lấy khách hàng làm cơ sở quảng cáo. Trong khi Remarketing, nghĩa là tiếp thị lại những khách hàng trước đó, remarketing lấy sản phẩm/dịch vụ làm cở sở quảng cáo

  [Phần 01]Cách phân biệt và triển khai giữa remarketing và retargeting trong quảng cáo
  View 309 - Rating ★★★★☆

  [Phần 01]Cách phân biệt và triển khai giữa remarketing và retargeting trong quảng cáo

  Mô tả: Retargeting nghĩa là chọn lại mục tiêu(tức là khách hàng) đã chọn trước đó cho mục đích quảng cáo, retargeting lấy khách hàng làm cơ sở quảng cáo. Trong khi Remarketing, nghĩa là tiếp thị lại những khách hàng trước đó, remarketing lấy sản phẩm/dịch vụ làm cở sở quảng cáo

  Các mạng quảng cáo ngoài Google Adsense hấp dẫn nhất 2019
  View 1126 - Rating ★★★★☆

  Các mạng quảng cáo ngoài Google Adsense hấp dẫn nhất 2019

  Mô tả: Nếu bạn quan tâm đến đặt quảng cáo trên website/blog để kiếm tiền thì Google AdSense luôn là sự lựa chọn hàng đầu. Trong bài viết này, mình sẽ giới thiệu tới bạn các mạng quảng cáo ngoài Google Adsense được nhiều người yêu thích và tin dùng hiện nay.

  [Phần 2]Ý tưởng sáng tạo kiến tiền trên mạng người làm văn phòng cần biết
  View 2534 - Rating ★★★★☆

  [Phần 2]Ý tưởng sáng tạo kiến tiền trên mạng người làm văn phòng cần biết

  Mô tả: Hiện nay có rất nhiều cách thức đầu tư hoặc kiến tiền trong môi trường trực tuyến hiện nay. Thông qua bài viết Ý tưởng kiến tiền trên mạng sáng tạo mà người làm văn phòng cần biết, chúng tôi hy vọng phần nào sẽ giúp các bạn tăng thêm thu nhập trong công việc.

  [Phần 1]Ý tưởng sáng tạo kiến tiền trên mạng người làm văn phòng cần biết
  View 2640 - Rating ★★★★☆

  [Phần 1]Ý tưởng sáng tạo kiến tiền trên mạng người làm văn phòng cần biết

  Mô tả: Hiện nay có rất nhiều cách thức đầu tư hoặc kiến tiền trong môi trường trực tuyến hiện nay. Thông qua bài viết Ý tưởng kiến tiền trên mạng sáng tạo mà người làm văn phòng cần biết, chúng tôi hy vọng phần nào sẽ giúp các bạn tăng thêm thu nhập trong công việc.

  Chia sẽ cách kiếm tiền online bền vững và kinh nghiệm cần biết
  View 2502 - Rating ★★★★☆

  Chia sẽ cách kiếm tiền online bền vững và kinh nghiệm cần biết

  Mô tả: Hiện có rất nhiều bài viết về thủ thuật việc kiếm tiền trên mạng . Bài viết này chúng tôi xin được chia sẽ cách kiếm tiền online một cách bền vững nhất và kinh nghiệm cần biết trong quá trình thực hiện. Chúc các bạn thành công

  Hướng dẫn cài đặt Adobe Premiere Pro CC 2018 cực đơn giản
  View 1417 - Rating ★★★★☆

  Hướng dẫn cài đặt Adobe Premiere Pro CC 2018 cực đơn giản

  Mô tả: Adobe Premiere Pro CC 2018 là một phần mềm biên tập và chỉnh sữa video chuyên nghiệp hay được dùng trong các studio, chương trình có khả năng ghép sửa, chỉnh màu sắc, lồng nhạc. Sau đâu là phần download và hướng dẫn cài đặt Adobe Premiere Pro CC 2018 cực kỳ dễ dàng