搜索優化/動態網站的優化策略

  動態網站的優化策略

  搜索引擎抓取動態網站頁面時面臨的問題

  從用戶的角度看,動態網站非常不錯,豐富了站點的功能,但是對於搜索引擎來說,情況就不同了。根本的問題

  在於“輸入”和“選擇”,動態頁面是在用戶"輸入內容"或者進行“選擇”時動態生成的,但是搜索引擎的“搜

  索機器人”無法“輸入”和“選擇”。比如我們要在當當書店站點查看馮英健的《網路行銷基礎與實踐》一書,

  介紹頁面是動態生成的,URL位址是:http://www.dangdang.com/product_detail/product_detail.as-

  p?product_id=493698這裏在“?”後面的product_id參數值需要我們輸入的,“搜索機器人”可以通過鏈

  接找到http://www.dangdang.com/product_detail/product_detail.asp ;頁面,但是它無法輸入“?”

  後面的product_id參數值,從而無法抓取這個頁面檔。

  另外,對於通過鏈結達到這種帶“?”的頁面,技術上搜索引擎可以抓取,但是一般情況下搜索引擎選擇不去抓

  取,這是為了避免一種叫“搜索機器人陷阱(spider traps)”的腳本錯誤,這種錯誤會讓搜索機器人進行無限

  迴圈的抓取,無法退出而浪費時間。

  

  動態網站的優化策略

  動態網站要被搜索引擎抓取,可以採用內容發佈系統軟體將動態站點轉化成靜態頁面,這種辦法對於頁面發佈後

  變動少的站點比較合適,比如一些新聞類的站點(如新浪的新聞中心:http://news.sina.com.cn/)一般的動

  態網站可以通過下面的辦法讓搜索引擎抓取:

  首先,我們要讓動態頁面的URL位址中沒有“?”,讓動態頁面看上去象“靜態頁面”。看看下面這個頁面

  http://www.amazon.com/exec/obidos/tg/detail/-/043935806X/ ;這明顯是一個動態頁面,但是URL

  位址看上去卻象“靜態頁面”。針對不同的動態技術可以採用下面技術實現:

  ·對於採用ASP技術的動態頁面Exception Digital公司提供一種工具叫著XQASP(http://www.xde.net/p-

  roducts/product_xqasp.htm)可以將“?”替換為“/”。

  ·對於採用ColdFusion技術的站點,需要重新配置伺服器上的ColdFusion,用“/”代替“?”將參數傳輸到

  URL,更詳細的資訊請見http://coldfusion.com/站點。

  ·對於使用Apache伺服器的站點,可以使用rewrite模組將帶參數的URL位址轉換成搜索引擎支援的形式,該

  模組mod_rewrite在Apache伺服器中不是缺省安裝的,詳細的資訊請見http://httpd.apache.org/docs/-

  mod/mod_rewrite.html。

  對於其他的動態技術也能找到對應的方法改變URL的形式。然後,要創建一些靜態頁面指向這些動態頁面(以改

  變過的URL鏈結)。前面說過,搜索引擎機器人並不會自己“輸入”參數,所以要讓上面這些動態頁面被搜索引

  擎抓取,我們還需要告訴機器人這些頁面的位址(也就是參數)。我們可以創建一些靜態的頁面,一般在網路營

  銷中稱“gateway page”(入口頁面),這些頁面上有大量指向這些動態頁面的鏈結。將這些入口頁面的位址

  提交到搜索引擎,這些頁面和鏈結的動態頁面(改變過URL形式)就能都被搜索引擎抓取了。

  

  搜索引擎對動態網站支援的改進

  在我們調整動態站點適應搜索引擎的同時,搜索引擎也在發展。到目前為止,絕大多數的搜索引擎還不支援動態

  頁面的抓取,但是GOOGLE、HOTBOT等和國內的百度開始嘗試抓取動態網站頁面(包括“?”的頁面),這就

  是我們現在在這些搜索引擎進行搜索時,結果中出現動態鏈結的原因。

  這些搜索引擎抓取動態頁面時,為了避免“搜索機器人陷阱”都只抓取從靜態頁面(至少“看上去”是靜態的頁

  面)鏈結到的動態頁面,而從動態頁面鏈結出的動態頁面都不再抓取。所以一個動態站點如果只針對上面這些搜

  索引擎,可以在上面小節介紹方法的基礎上簡化:只用創建一些入口頁面,鏈結很多動態頁面,然後將這些入口

  頁面遞交到這些搜索引擎就可以了。

  對於直接使用動態的URL位址,請注意:

  ·檔URL中不要有Session Id,同時不要用ID作為參數名稱(特別是對於GOOGLE);

  ·參數越少越好,儘量不要超過2個;

  ·能在URL中不用參數儘量不要用,一些參數轉移到其他地方,這樣可以增加動態頁面被抓取的深度和數目。

  

關于“搜索優化/動態網站的優化策略”的用戶留言:

目前暫無留言

新增相關留言