網站日志里面記錄著每一個訪問信息,保存在服務器原始文件當中。網站日志的信息比較準確和全面。很多做網站優化人員通過外界的工具來獲取數據,其實網站日志就是真實的統計。
一、基本概念
1、網站日志就是一個純文本文件,里面記錄這網站的訪問信息,服務器的動作,每一個文件調用的記錄。
2、網站日志用記事本打開就可以打開查看。
3、虛擬主機一般會提供網站日志下載,云主機和服務器可以直接在相應的文件夾里面查看。
二、案例分享
剛才看了我博客的網站日志,我來分享一下網站的日志數據。
百度指數爬行記錄
Baiduspider/2.0 上圖是百度蜘蛛來爬行的記錄,我們可以看到爬行的時間,蜘蛛的IP地址,還能看到服務器的動作,返回的代碼是否成功可以看返回的是:200,說名抓取成功。
360蜘蛛抓取記錄
360Spider 上圖是360蜘蛛抓取記錄,我們可以看出360的抓取頻率還是挺高的。依然可以看到抓取時間,抓取頁面,IP地址,還有是是否抓取成功,以及抓取所用時間。
谷歌爬蟲抓取記錄
搜狗蜘蛛爬行記錄
上圖是谷歌機器人Googlebot/2.1和搜狗蜘蛛Sogou+web+spider/4.0的網站抓取記錄。同樣記錄抓取網站頁面的信息。
到現在為止網站還在被各大搜索引擎抓取,百度平均每兩小時來一次,360平均每小時來一次,谷歌和搜狗每天來兩次。
三、常見的服務器狀態碼
1、301——永久轉向。
2、302——暫時轉向。
3、304——文件未改變,客戶端緩沖板版本還可以繼續使用。
4、400——非法請求。
5、401——訪問被拒絕,需要用戶名、密碼。
6、403——禁止訪問。
7、500——服務器內部錯誤,通常是程序有錯。
8、503——服務器沒有應答,可能是負載過大等。
總結:
網站日志分析是做網站優化工作的一部分,我們可以比較精準的查看到網站的變化記錄和網站運行是否爭正常,有助于我們優化網站的結構和程序,幫助我們進一步提高網站質量,更好的滿足用戶。當我們把網站的用戶體驗做到較好水平的時候,搜素引擎會認真的保存我們的網頁快照,然后展示給用戶。