如何通過網站日志數據分析獲得百度收錄效果?

2019年12月12日 14:42:27 企業站SEO 53次

作為一名專業的SEOER,一般每周都會查看網站的日志數據,通過網站后臺的日志,我們可以及時的看到當天,或者這一周網站的搜索引擎蜘蛛造訪情況:都有哪些蜘蛛訪問過我們的網站?哪些蜘蛛在我們更新文章后,及時抓取了網站的內容,哪些內容蜘蛛提升內容重復,沒有再次抓???等等,這些看似無用的日志數據,經過我們認真分析之后,都知道我們開展網站內容更新,以及查看網站內容為啥不收錄,收錄的不及時,以及有些內容為啥不收錄都有一定的指導價值。一般情況下琪琪SEO在做好網站的SEO優化工作之后,就會進行網站日志數據分析。下面由琪琪SEO為大家詳細介紹一下如何具體開展網站后臺日志數據分析:

如何通過網站日志數據分析獲得百度收錄效果?

1、網站剛上線,看搜索引擎蜘蛛的抓取情況;

2、網站收錄異常,對比日志中蜘蛛的行為情況;

3、解決網站被封問題時,觀察日志情況;

網站日志是網站管理員和搜索引擎對話溝通的途徑。通過日志,了解搜索引擎蜘蛛的訪問情況。

下載日志:

通過 FTP訪問網站的根目錄??梢钥吹揭粋€包含 log的文件夾,這是存放日志的地方。

下載、解壓、打開日志文件。

日志文件內容如:

61.135.168.22 – - [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1″ 200

8450 “-” “Baiduspider+(+)”

(注:百度蜘蛛,這部分為本文添加)

203.208.60.43 – - [11/Jan/2009:04:02:43 +0800] “GET /sns/space-13563-do-friend-view-me.html

HTTP/1.1″

200

5162

“-”

“Mozilla/5.0

(compatible;

Googlebot/2.1;

+)”

(注:Google蜘蛛)

202.160.178.21 – - [11/Jan/2009:04:02:44 +0800] “GET /sns/space.php?uid=323 HTTP/1.0″ 200

7535 “-” “Mozilla/5.0 (compatible; Yahoo! Slurp China;

(注:雅虎蜘蛛)

65.55.220.217

-

-

[11/Jan/2009:04:02:57

+0800]

“GET

/ucenter/avatar.php?uid=12373size=small&type=virtual HTTP/1.1″ 301 – “-” “msnbot-media/1.1

(+)”

(注:MSN蜘蛛)

分析日志:

蜘蛛名稱:百度 ->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao

->YoudaoBot、sogou ->Sogou+get+spider

在日志文件里,搜索以上蜘蛛名稱。就可以看到蜘蛛抓取的痕跡。

我們分析的主要點是,HTTP狀態碼,如以上的 200和 301。

” 200 5162 “代表正常抓取,這次抓取了 5162個字節。

不同的服務器或虛擬主機設置的日志記錄內容不同。

有的如:200 0 33834 237 953我們通過多看幾條記錄,觀察規律,可以判斷第三個數字代表字節數。

有的如:200 0 0或 200 0 64這是沒有記錄抓取字節數。注意:200 0 0和 200 0 64沒代表什

么問題。所謂 200 0 64代表要被 K的言論沒有根據,一般的網站都有 64代碼。

在日志里,發現比較多的 HTTP狀態碼是,200(正常)、304(沒變化)、404(錯誤鏈接)。

304代表,自從上次抓取后,該內容沒有更新。一般情況下,網站的圖片經常會返回該值。

404代表,訪問的這個鏈接是錯誤鏈接。這個錯誤鏈接,一方面來自原本存在后來刪除了網

頁,另一方面可能來自本來就不存在,但其他人外鏈了這么個死鏈接。

返回開篇常見問題解答:

  1、網站剛上線,看搜索引擎蜘蛛的抓取情況;

如果網站提交給搜索引擎2天后,發現日志里蜘蛛不少,并都返回 200,則說明已經可以正常收錄。

只是 Google展示的時間比較快,而百度則需要 20天左右(經驗平均值)展示出來。

  2、網站收錄異常,對比日志中蜘蛛的行為情況;

收錄正常增加時和現在異常時的日志,進行對比分析。如果沒有異常,則應該是搜索引擎展示數據庫出問題所致。

如果蜘蛛爬取量明顯減少,觀察是否外鏈突然減少很多。

如果日志依然,則認為是搜索引擎的展示問題。

解決網站被封問題時,觀察日志情況。

網站被封時,往往日志里有百度蜘蛛,但很少,而且往往只訪問 robots.txt文件和首頁經過這里的建議修改后,再提交給百度,之后的2天觀察日志情況。

如果一直這樣的情況維持 1個月,可以考慮放棄該域名。

如果蜘蛛明顯增加,而且返回 200居多,則收錄的希望很大,時間問題。

FTP的工具下載和使用指南:

日志文件有時非常大,用記事本打不開,可以使用這個工具:

HTTP狀態碼更多知識:

幾大搜索引擎登陸入口:

相關疑問:

1、提供的樣板日志文件里的 是什么?

這是一個瀏覽器插件開發商,日志里有這個代表,采用該插件的用戶訪問過你的網站。這個不用理會。

2、我的網站怎么沒有日志文件?

這個需要主機服務商開通。

我的日志里怎么都沒有蜘蛛?

很大的可能是,主機沒有記錄蜘蛛的功能。請看下同主機下其他站點的收錄情況是否正常。

4、好像日志里收錄了,但不一定展示出來?

是的。我們可以看到百度蜘蛛和 google機器人訪問很頻繁,但不一定他們都展示出來。

這個目前沒有解決辦法。但只要它們頻繁訪問和正常抓取,一切就會很正常。

5、是否有專門分析蜘蛛爬取的工具?

暫時還沒有發現,如果你發現了,請告知。

6、發現日志里蜘蛛情況和之前都一樣,但最近收錄或排名發生變化,是怎么回事?

這應該屬于搜索引擎數據庫變更,可以說沒有具體對網站進行如何改進來挽救的明顯有效措施。

上一篇:WordPress工單支持系統Memoria Ticket System漢化中文版插件
下一篇:琪琪SEO實戰外鏈經驗總結

聲明:本頁內容由好推網絡科技有限公司通過網絡收集編輯所得,所有資料僅供用戶參考;本站不擁有所有權,也不承認相關法律責任。如您認為本網頁中有涉嫌抄寫的內容,請及時與我們聯系進行舉報,并提供相關證據,工作人員會在5個工作日內聯系您,一經查實,本站將立刻刪除涉嫌侵權內容。

相關資訊 Releva ntnews
  1. 我們的承諾
  2. 我們的實力
  3. 我們的未來

站點地圖

Copyright © 2002-2019 企業站SEO 0312mj.cn 版權所有

如何打麻将规则