簡析動(dòng)態(tài)頁面會(huì)對(duì)SEO產(chǎn)生什么影響?
設(shè)計(jì)爬蟲時(shí),通常都回避動(dòng)態(tài)網(wǎng)頁(如Charkabarti,Joshi,Punera,&Pennock,2002)。識(shí)別動(dòng)態(tài)網(wǎng)頁時(shí),只要看URL中是否出現(xiàn)問號(hào),含問號(hào)的就是動(dòng)態(tài)網(wǎng)頁。忽略動(dòng)態(tài)網(wǎng)頁是因?yàn)樗鼈內(nèi)菀自斐芍┲胂葳?。蜘蛛陷阱理論上是一個(gè)無限的網(wǎng)頁集合,而蜘蛛不能完整地遍歷這個(gè)集合。在線日歷就是一個(gè)容易被忽略的蜘蛛陷阱,它生成的動(dòng)態(tài)網(wǎng)頁中可以標(biāo)上日期,并包含指向后1天網(wǎng)頁的鏈接。一個(gè)爬蟲從這個(gè)日歷中找到一個(gè)網(wǎng)頁后,便會(huì)無止境地請(qǐng)求后1天的網(wǎng)頁。
動(dòng)態(tài)的頁面(url)屬于蜘蛛陷阱,搜索引擎蜘蛛一旦爬行進(jìn)入,很有可能會(huì)出不來、或是不好流暢的抓取,所以建議網(wǎng)頁是靜態(tài)或是經(jīng)過偽靜態(tài)處理的。
轉(zhuǎn)載請(qǐng)注明出處:
http://keun.com.cn/