站點(diǎn)https化和新浪死鏈處理經(jīng)驗(yàn)分享
站點(diǎn)https化會(huì)對流量產(chǎn)生負(fù)面影響?百度是這么說的
今年5月中旬,百度完成了全站https化。隨后,以維基百科為首的多家網(wǎng)站也表示將實(shí)現(xiàn)全面HTTPS化。HTTPS是以安全為目標(biāo)的HTTP通道,簡單講是HTTP的安全版。百度曾在5月下旬的公告中明確表示“百度視同一個(gè)域名的http版和https版為一個(gè)站點(diǎn),優(yōu)先收錄https版?!币蚨絹碓蕉嗟恼军c(diǎn)也開始考慮Https化問題,但仍有不少站長擔(dān)心“網(wǎng)站https化對站點(diǎn)流量是否會(huì)產(chǎn)生負(fù)面影響、怎樣才能避免這種影響?”等問題。
對此,百度是如何回復(fù)的呢?
問:對于http和https,Baiduspider會(huì)不會(huì)區(qū)別對待?
答:不會(huì)區(qū)別對待。說得再全整專業(yè)一些:Baiduspider在對于http和https站點(diǎn)的調(diào)度和解析方面沒有任何區(qū)別。至于建索引庫,年初的時(shí)候百度進(jìn)行過升級,目前對https站點(diǎn)也是全力支持的。
問:Baiduspider可以抓取https網(wǎng)站嗎?站點(diǎn)https以后應(yīng)該做些什么?
答:在抓取方面,Baiduspider完全支持https鏈接的抓取。站長需要注意的一點(diǎn)是要保證http鏈接到https鏈接良好的重定向(使用301或302),這樣百度可以做到無縫切換。另外可以使用鏈接提交工具提交https鏈接,盡快通知百度。
問:站點(diǎn)切換https以后,新產(chǎn)生的https頁面,百度會(huì)將其視為新頁面重新收錄?重新計(jì)算排名?
答:不是的,不涉及重新收錄的問題。
問:https以后可以使用改版工具向百度提交http與https的對應(yīng)關(guān)系嗎?
答:http站和https站會(huì)被百度視為同一個(gè)站點(diǎn),不屬于改版,不適用改版工具。
問:https以后,排序有可能發(fā)生什么變化?
答:在rank方面,現(xiàn)在對兩種鏈接無區(qū)別對待,從安全性考慮,以后可能會(huì)優(yōu)待https的鏈接。
新浪死鏈處理經(jīng)驗(yàn)分享
新浪穩(wěn)座國家級門戶頭把交椅,誰還敢說自己網(wǎng)站結(jié)構(gòu)的復(fù)雜程度可以超越新浪。于是我們請王久明分享一下新浪在死鏈處理和死鏈預(yù)防(重要頁面因修改而產(chǎn)生死鏈)方面的經(jīng)驗(yàn)。
一、在以下背景下會(huì)較多產(chǎn)生死鏈:
1、時(shí)政新聞的敏感性;
2、來自監(jiān)管的刪除需求;
3、頻道(編輯)自身刪改的需求;
4、搜索方期望資源方主動(dòng)優(yōu)化和定期清除的需求
二、死鏈分類:
由于系統(tǒng)架構(gòu)、歷史遺留問題、多業(yè)務(wù)系統(tǒng)交叉影響等多方面因素,新浪存在如下三種死鏈:
1、協(xié)議死鏈,服務(wù)器端返回HTTP狀態(tài)碼404;
例如:‘誰在偽善’http://news.sina.com.cn/movie/music/1999-06-15/2965.shtml
2,內(nèi)容死鏈,服務(wù)器端返回HTTP狀態(tài)碼200,無法設(shè)置為404;
例如:http://news.sina.com.cn/c/2015-04-23/184531753084.shtml
3,頁面需要用戶和蜘蛛可以正常訪問,但由于刪改或誤操作導(dǎo)致反復(fù)上下線形成協(xié)議死鏈或內(nèi)容死鏈。
例如:http://news.sina.com.cn/2015-12-05/doc-ifxmhqaa9933763.shtml
上線后又下線,后又上線,甚至反復(fù)多次。由于下線期間存在協(xié)議死鏈或內(nèi)容死鏈的情況,導(dǎo)致百度認(rèn)為該頁面應(yīng)該被刪除,不被收錄,且即使后續(xù)重新上線也無法恢復(fù)收錄。對于這種情況,應(yīng)加以預(yù)防。
三、解決方案:
1、協(xié)議死鏈,這個(gè)最符合HTML標(biāo)準(zhǔn)處理方式,站點(diǎn)方面無須多做什么,如果需要百度快速處理可以通過百度站長平臺的死鏈提交工具(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=4#h2_article_title18)進(jìn)行主動(dòng)提交
2,無法設(shè)置協(xié)議死鏈接,僅主體內(nèi)容文本被刪除的內(nèi)容死鏈死鏈,新浪的處理方法是:
1)走事先之制定好的《死鏈標(biāo)準(zhǔn)流程》:用站內(nèi)標(biāo)準(zhǔn)內(nèi)容死鏈模板頁面(告訴用戶該頁無法找到)覆蓋需要?jiǎng)h除的頁面,5秒后跳轉(zhuǎn)到統(tǒng)一的全站導(dǎo)航頁,以減少用戶流失。
2)根據(jù)需要,比如根據(jù)特定關(guān)鍵詞圈定一批最終需要處理為協(xié)議死鏈的敏感頁面,將這些頁面鏈接放到一個(gè)文件里,由專人在服務(wù)器端修改成協(xié)議死鏈。通過百度站長平臺工具進(jìn)行死鏈提交
3,針對反復(fù)上下線導(dǎo)致百度誤判為死鏈的情況,新浪的預(yù)防辦法是:
1)制度上:系統(tǒng)后臺設(shè)置提醒,提醒編輯上線后除非特殊情況不要下線;
2)功能上:這種情況在專題運(yùn)營中最常見,且影響比單篇新聞頁要大,由于我站點(diǎn)運(yùn)營規(guī)定是不能刪除頁面的,因此在系統(tǒng)后臺將“刪除專題(對編輯來說就是刪除該專題)”和“將專題調(diào)整為不對外顯示(對編輯來說不是刪除,而是暫時(shí)下線,調(diào)整為外網(wǎng)用戶無法訪問,可隨時(shí)再次重新上線)”兩個(gè)功能嚴(yán)格區(qū)分開,并提供回收功能。針對“將專題調(diào)整為不對外顯示”這種情況,不再將頁面更新為內(nèi)容死鏈(頁面無法找到),以免被百度誤判。專題頁面仍可訪問,只是站點(diǎn)不設(shè)置入口、不進(jìn)行推廣,用戶沒有訪問來源而已。