簡(jiǎn)析動(dòng)態(tài)頁(yè)面會(huì)對(duì)SEO產(chǎn)生什么影響?
設(shè)計(jì)爬蟲時(shí),通常都回避動(dòng)態(tài)網(wǎng)頁(yè)(如Charkabarti,Joshi,Punera,&Pennock,2002)。識(shí)別動(dòng)態(tài)網(wǎng)頁(yè)時(shí),只要看URL中是否出現(xiàn)問(wèn)號(hào),含問(wèn)號(hào)的就是動(dòng)態(tài)網(wǎng)頁(yè)。忽略動(dòng)態(tài)網(wǎng)頁(yè)是因?yàn)樗鼈內(nèi)菀自斐芍┲胂葳?。蜘蛛陷阱理論上是一個(gè)無(wú)限的網(wǎng)頁(yè)集合,而蜘蛛不能完整地遍歷這個(gè)集合。在線日歷就是一個(gè)容易被忽略的蜘蛛陷阱,它生成的動(dòng)態(tài)網(wǎng)頁(yè)中可以標(biāo)上日期,并包含指向后1天網(wǎng)頁(yè)的鏈接。一個(gè)爬蟲從這個(gè)日歷中找到一個(gè)網(wǎng)頁(yè)后,便會(huì)無(wú)止境地請(qǐng)求后1天的網(wǎng)頁(yè)。
動(dòng)態(tài)的頁(yè)面(url)屬于蜘蛛陷阱,搜索引擎蜘蛛一旦爬行進(jìn)入,很有可能會(huì)出不來(lái)、或是不好流暢的抓取,所以建議網(wǎng)頁(yè)是靜態(tài)或是經(jīng)過(guò)偽靜態(tài)處理的。
轉(zhuǎn)載請(qǐng)注明出處:
http://www.bycyy.com/