什么是網(wǎng)站地圖?站點地圖詳細介紹
什么是網(wǎng)站地圖?站點地圖詳細介紹:網(wǎng)站地圖,又叫站點地圖,它就是一個列出了你網(wǎng)站上所有頁面地址的清單文件,一般來說分為2種,一種是給搜索引擎看的,一種是給用戶看的,前者幫助搜索引擎更好地收錄你的網(wǎng)站,后者幫助用戶更好的了解你的網(wǎng)站整體結(jié)構(gòu)、更快的找到他們想要找的內(nèi)容。本文講的主要是前者。
站點地圖格式
一般有3種格式,txt、xml、html,絕大部分情況下都是用xml格式,百度、谷歌都是支持xml格式。下面簡單介紹3種格式。
txt格式
這種格式最簡單,一般較少采用,示例如下:
http://liuxianan.com/http://liuxianan.com/link.htmlhttp://liuxianan.com/msgboard.html
注意事項:
文本文件每行都必須有一個網(wǎng)址。網(wǎng)址中不能有換行。
不應(yīng)包含網(wǎng)址列表以外的任何信息。
您必須書寫完整的網(wǎng)址,包括 http。
每個文本文件最多可包含 50,000 個網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
文本文件需使用 UTF-8 編碼或GBK編碼。
xml格式
示例sitemap.xml如下:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://liuxianan.com/</loc>
<lastmod>2016-09-06T00:00:16+08:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://liuxianan.com/link.html</loc>
<lastmod>2016-09-06T00:00:16+08:00</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
其中:
loc表示完整網(wǎng)址,必填項,長度不得超過256字節(jié)
lastmod表示本網(wǎng)頁最后修改時間,必須是ISO-8601時間格式,具體這個格式是什么樣的沒整清楚,根據(jù)我的理解,反正就當成是:yyyy-MM-ddTHH:mm:ss+08:00,最后面的+08:00應(yīng)該表示的是東八區(qū);
changefreq 表示更新頻率,可選值:always、hourly、daily、weekly、monthly、yearly、never
priority 用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,可選值 0.0-1.0,一般來說網(wǎng)站首頁1.0,然后二級三級頁面依次降低,具體這個屬性有多重要不太清楚。
以上4項中,除了loc是必填項之外,其它3個都不是必須的,但最好都寫上。
一個sitemap文件包含的網(wǎng)址不得超過 5 萬個,且文件大小不得超過 10 MB。如果您的sitemap超過了這些限值,請將其拆分為幾個小的sitemap。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會因提供大文件而超載。一個站點支持提交的sitemap文件個數(shù)必須小于5萬個
下面從 百度站長平臺 復制的幾項QA:
Q:我提交時填寫的周期是什么含義?
A:百度Spider會參考設(shè)置周期抓取Sitemap文件,因此 請根據(jù)Sitemap文件內(nèi)容的更新(比如增加新url)來設(shè)置。請注意若url不變而僅是url對應(yīng)的頁面內(nèi)容更新(比如論壇帖子頁有新回復內(nèi)容),不 在此更新范圍內(nèi)。Sitemap工具不能解決頁面更新問題。
Q:Sitemap提交后,多久能被百度處理?
A:Sitemap數(shù)據(jù)提交后,一般在1小時內(nèi)百度會開始處理。在以后的調(diào)度抓取中,如果您的sitemap支持etag,我們會更頻繁抓取sitemap文件,從而及時發(fā)現(xiàn)內(nèi)容更新;否則抓取的周期會比較長。
Q:提交的Sitemap都會被百度抓取并收錄嗎?
A:百度對已提交的數(shù)據(jù),不保證一定會抓取及收錄所有網(wǎng)址。是否收錄與頁面質(zhì)量相關(guān)。
Q:我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮?
A:可以。請使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應(yīng)該小于 10MB(10,485,759字節(jié))。
Q:XML格式的 Sitemap 中,“priority”提示會影響我的網(wǎng)頁在搜索結(jié)果中的排名嗎?
A:不會。sitemap中的priority提示只是說明該網(wǎng)址相對于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會影響網(wǎng)頁在搜索結(jié)果中的排名。
Q:網(wǎng)址在 Sitemap 中的位置是否會影響它的使用?
A:不會。網(wǎng)址在 Sitemap 中的位置并不會影響百度對它的識別或使用方式。
Q:Sitemap中提交的url能否包含中文?
A:因為轉(zhuǎn)碼問題建議最好不要包含中文。
html格式
本小結(jié)暫待補充。
sitemap索引格式
如需提交大量sitemap文件,則可將其列在sitemap索引文件中,然后將該索引文件提交。
因為這個我?guī)缀醪粫玫?,所以懶得研究,有興趣的參考這里。
2898站長資源平臺文化藝術(shù)排行榜:http://www.afrimangol.com/webmain/xxyl_whys.htm