Simple SiteMap Editor(站點(diǎn)地圖編輯器)是一款輕便、便攜、免費(fèi)的應(yīng)用程序,它可以讓你快速、輕松地手動(dòng)編輯sitemap xml文件內(nèi)容,或者創(chuàng)建你自己的新sitemap文件。有需要的小伙伴歡迎來西西下載體驗(yàn)。
軟件簡介:
站點(diǎn)地圖是網(wǎng)站站長通知搜索引擎有關(guān)其站點(diǎn)上可進(jìn)行爬網(wǎng)的頁面的一種簡便方法。Sitemap是最簡單的形式,它是一個(gè)XML文件,其中列出了站點(diǎn)的URL以及有關(guān)每個(gè)URL的其他元數(shù)據(jù)(相對于站點(diǎn)中其他URL的最新更新時(shí)間,通常更改的頻率以及重要性) ),以便搜索引擎可以更智能地抓取該網(wǎng)站。
Web爬網(wǎng)程序通常從站點(diǎn)內(nèi)的鏈接和其他站點(diǎn)發(fā)現(xiàn)頁面。Sitemap補(bǔ)充了這些數(shù)據(jù),以使支持Sitemap的搜尋器可以拾取Sitemap中的所有URL,并使用關(guān)聯(lián)的元數(shù)據(jù)來了解這些URL。使用Sitemaps 協(xié)議不能保證網(wǎng)頁會(huì)包含在搜索引擎中,但是會(huì)為網(wǎng)絡(luò)爬蟲提供提示,以幫助他們更好地爬網(wǎng)您的網(wǎng)站。
Sitemap 0.90是根據(jù) Attribution-ShareAlike Creative Commons許可條款提供的,已得到廣泛采用,包括Google,Yahoo!和Microsoft的支持。
常見問題答疑:
問: 如何在站點(diǎn)地圖中表示網(wǎng)址?
與所有XML文件一樣,任何數(shù)據(jù)值(包括URL)都必須對以下字符使用 實(shí)體轉(zhuǎn)義碼:&符,單引號('),雙引號(“),小于(<)和大于( >)。您還應(yīng)確保所有URL都遵循URI 的 RFC-3986 標(biāo)準(zhǔn),IRI 的RFC-3987標(biāo)準(zhǔn)以及XML標(biāo)準(zhǔn)。。如果您使用腳本來生成URL,則通?梢詫RL作為該腳本的一部分進(jìn)行轉(zhuǎn)義。您仍然需要使實(shí)體逃脫它們。例如,以下python腳本實(shí)體轉(zhuǎn)義了http://www.example.com/view?widget=3&count>2
$蟒蛇Python 2.2.2(#1,F(xiàn)eb 24 2003,19:13:11) >>>導(dǎo)入xml.sax.saxutils>>> xml.sax.saxutils.escape(“ http://www.example.com/view?widget=3&count>2”)
上面示例中的結(jié)果URL為:
http://www.example.com/view?widget=3&count>2
問: 我用來生成站點(diǎn)地圖文件的哪種字符編碼方法有關(guān)系嗎?
是。您的站點(diǎn)地圖文件必須使用UTF-8編碼。
問: 如何指定時(shí)間?
對于此協(xié)議中的lastmod時(shí)間戳和所有其他日期和時(shí)間, 請使用W3C Datetime編碼。例如2004-09-22T14:12:14 + 00:00。
這種編碼使您可以省略ISO8601格式的時(shí)間部分。例如2004-09-22也有效。但是,如果您的網(wǎng)站經(jīng)常更改,建議您將時(shí)間部分包括在內(nèi),以便搜尋器具有有關(guān)您的網(wǎng)站的更完整的信息。
問: 如何計(jì)算lastmod日期?
對于靜態(tài)文件,這是實(shí)際的文件更新日期。您可以使用UNIX date命令獲取此日期:
$ date --iso-8601 = seconds -u -r /home/foo/www/bar.php>> 2004-10-26T08:56:39 + 00:00
對于許多動(dòng)態(tài)URL,您可以根據(jù)基礎(chǔ)數(shù)據(jù)的更改時(shí)間或通過使用基于定期更新的近似值(如果適用)來輕松計(jì)算lastmod日期。甚至使用大概的日期或時(shí)間戳也可以幫助爬網(wǎng)程序避免對未更改的URL進(jìn)行爬網(wǎng)。這將減少Web服務(wù)器的帶寬和CPU要求。
問: 我應(yīng)該在哪里放置我的站點(diǎn)地圖?
強(qiáng)烈建議您將Sitemap放在HTML服務(wù)器的根目錄下;也就是說,將其放在http://example.com/sitemap.xml。
在某些情況下,您可能想針對站點(diǎn)上的不同路徑生成不同的站點(diǎn)地圖-例如,如果組織中的安全權(quán)限劃分了對不同目錄的寫訪問權(quán)限。
我們假設(shè)如果您有權(quán)上傳http://example.com/path/sitemap.xml,那么您也有權(quán)在http://example.com/path/下報(bào)告元數(shù)據(jù)。
站點(diǎn)地圖中列出的所有URL必須與站點(diǎn)地圖位于同一主機(jī)上。例如,如果站點(diǎn)地圖位于http://www.example.com/sitemap.xml,則它不能包含來自http://subdomain.example.com的URL。如果站點(diǎn)地圖位于http://www.example.com/myfolder/sitemap.xml,則不能包含來自http://www.example.com的URL。
回到頂部
問: 我的站點(diǎn)地圖有多大?
站點(diǎn)地圖不得大于50MB(52,428,800字節(jié)),并且最多可以包含50,000個(gè)URL。這些限制有助于確保Web服務(wù)器不會(huì)因提供非常大的文件而陷入困境。這意味著,如果您的站點(diǎn)包含超過50,000個(gè)URL,或者您的站點(diǎn)地圖大于50MB,則必須創(chuàng)建多個(gè)站點(diǎn)地圖文件并使用站點(diǎn)地圖索引文件。即使您的網(wǎng)站很小,也應(yīng)該使用Sitemap索引文件,但計(jì)劃將其擴(kuò)展到50,000個(gè)以上的URL或文件大小為50MB。Sitemap索引文件最多可以包含50,000個(gè)Sitemap,并且不得超過50MB(52,428,800字節(jié))。您還可以使用gzip壓縮站點(diǎn)地圖。
問: 我的網(wǎng)站有數(shù)千萬個(gè)URL。我可以以某種方式僅提交最近更改的那些嗎?
您可以列出少量站點(diǎn)地圖中經(jīng)常更改的URL,然后在 站點(diǎn)地圖索引文件中使用lastmod標(biāo)記來識別那些站點(diǎn)地圖文件。然后,搜索引擎可以僅對已更改的站點(diǎn)地圖進(jìn)行漸進(jìn)爬網(wǎng)。
問: 創(chuàng)建站點(diǎn)地圖后該怎么辦?
創(chuàng)建Sitemap后,請直接向他們提交,對其進(jìn)行ping操作或?qū)itemap位置添加到robots.txt文件中,以 讓搜索引擎知道它。
問: 站點(diǎn)地圖中的網(wǎng)址是否需要完整指定?
是。您需要在URL中包含協(xié)議(例如,http)。如果您的Web服務(wù)器需要一個(gè)斜杠,則還需要在URL中包括一個(gè)斜杠。例如,http://www.example.com/是站點(diǎn)地圖的有效URL,而www.example.com不是。
問: 我的站點(diǎn)同時(shí)具有URL的“ http”和“ https”版本。我需要同時(shí)列出兩者嗎?
否。請?jiān)谀恼军c(diǎn)地圖中僅列出一個(gè)版本的URL。包括多個(gè)版本的URL可能會(huì)導(dǎo)致您的網(wǎng)站不完全爬網(wǎng)。
問: 我網(wǎng)站上的URL中包含會(huì)話ID。我需要?jiǎng)h除它們嗎?
是。在URL中包含會(huì)話ID可能會(huì)導(dǎo)致不完整和多余的網(wǎng)站爬網(wǎng)。
問: 網(wǎng)址在Sitemap中的位置是否會(huì)影響其使用?
否。URL在站點(diǎn)地圖中的位置不太可能影響搜索引擎使用或查看URL的方式。
問: 我網(wǎng)站上的某些頁面使用框架。我應(yīng)該包括框架集URL還是框架內(nèi)容的URL?
請同時(shí)包含兩個(gè)網(wǎng)址。
問: 我可以壓縮站點(diǎn)地圖,還是必須將其壓縮?
請使用gzip壓縮您的站點(diǎn)地圖。請記住,無論是否壓縮,您的站點(diǎn)地圖都不得大于50MB(52,428,800字節(jié))。
問: XML Sitemap中的“優(yōu)先級”提示會(huì)改變我的頁面在搜索結(jié)果中的排名嗎?
Sitemap中的“優(yōu)先級”提示僅表示相對于您自己網(wǎng)站上其他URL的特定URL的重要性,并不意味著對搜索結(jié)果中頁面的排名有任何影響。