荷兰顶级A片巜性生生活_性生交大片免费看A片直播爱奇艺_成人无码区免费A片久久鸭软件_美国A片巜禁忌3_强壮的公次次弄得我高潮A片日本_国产特黄A片AAAA毛片

優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利

公司網(wǎng)站制作爬蟲“黑洞”

日期 : 2020-10-21 18:38:35
       爬蟲“黑洞”。爬蟲在搜集藏文網(wǎng)頁的過程中, 必須考慮可能出現(xiàn)的“黑洞”情況。

       爬蟲黑洞是指, 在抓取一張網(wǎng)頁的鏈接時, 鏈接本身是一個無限循環(huán), 導(dǎo)致爬蟲抓取時跟著循環(huán), 浪費資源。有時一些URL看起來不同, 但實際指向同一張網(wǎng)頁, 也會使爬蟲陷入重復(fù)抓取的境地。

       為了避免爬蟲誤入黑洞, 一般采取兩種策略。一是爬蟲回避動態(tài)網(wǎng)頁, 因為動態(tài)網(wǎng)頁常常會把爬蟲帶入黑洞。識別動態(tài)網(wǎng)頁時, 只需要判斷URL中是否出現(xiàn)問題, 含問號的就是動態(tài)網(wǎng)頁。二是使用Visited表記錄已經(jīng)訪問過的URL, 凡是遇到新的URL存在于Visited表, 就放棄對該URL的繼續(xù)處理。例如:當遇到a→b→c→d→c→e這樣的環(huán)路鏈接, 爬蟲就會掉進去, 反復(fù)抓取c、d對應(yīng)的頁面。使用Visited表, 就能避免這個問題。

相關(guān)文章
北京市| 南江县| 临潭县| 吴忠市| 淮南市| 鄂托克旗| 怀宁县| 宁明县| 洛川县| 合肥市| 寻甸| 筠连县| 巫溪县| 温州市| 廉江市| 武陟县| 栖霞市| 雷波县| 集安市| 九寨沟县| 西丰县| 垣曲县| 寿阳县| 东城区| 泊头市| 读书| 兴化市| 德保县| 屯门区| 凯里市| 六安市| 雷山县| 工布江达县| 股票| 灵璧县| 古浪县| 乐安县| 合山市| 晋宁县| 沅江市| 荆州市|