中文字幕在线成人aⅴ一区二区,国产精品影视久久久久,91乱码人妻精品一区二区三区,国产精品福利在线观看免费不卡,国产精品白丝av网站在线观看,国产一区欧美精品日韩人妻,国产二级一片内射视频播放

您當(dāng)前的位置主頁 > 網(wǎng)站推廣 > 瀏覽文章

不完美的網(wǎng)站分析數(shù)據(jù):數(shù)據(jù)理想化和訪問者理想化

來源:網(wǎng)站推廣 2012-11-13

快速提升網(wǎng)站銷量,使用365webcall在線客服軟件

一、 技術(shù)理想化

每種數(shù)據(jù)收集方式都有其獨(dú)特的技術(shù)優(yōu)勢(shì),但沒有一種收集方式能完美的捕獲到訪問者在網(wǎng)站上的所有動(dòng)作,每種技術(shù)也都會(huì)由于自身的局限性導(dǎo)致你看到的數(shù)據(jù)是并不完美的數(shù)據(jù)。以計(jì)算頁面停留時(shí)間為例,下圖是一次訪問的時(shí)間記錄:(圖示中時(shí)間皆為進(jìn)入頁面的時(shí)刻)

通常計(jì)算頁面停留時(shí)間的方法為:當(dāng)前頁面的進(jìn)入時(shí)刻與下一頁面的進(jìn)入時(shí)刻差。由此得知上例中頁面的停留分別如下:

頁面A:5分鐘

頁面B:1分鐘

頁面C:4分鐘

頁面D:?

為什么頁面D的停留時(shí)間沒有?沒錯(cuò),無論哪種收集方式都無法捕捉到頁面D的準(zhǔn)確停留時(shí)間,原因很簡單,這些數(shù)據(jù)收集方式都無法捕捉到訪問者離開的時(shí)刻(或者在退出頁停留了半天沒做任何點(diǎn)擊,或者直接關(guān)閉了瀏覽器)。所以不同的工具廠商對(duì)退出頁的停留時(shí)間有不同的定義,有的統(tǒng)一計(jì)算為1分鐘,有的干脆認(rèn)為是0分鐘。

目前主要有下面幾種技術(shù)或限制數(shù)據(jù)的獲取,或混淆現(xiàn)有收集到的數(shù)據(jù)。

1. 緩存

這里說的緩存不是指物理芯片例如CPU的緩存,而是為了節(jié)約網(wǎng)絡(luò)資源,提高瀏覽網(wǎng)頁速度建立的瀏覽器緩存或代理服務(wù)器緩存。簡單的理解這兩種緩存就是,將曾經(jīng)訪問過的網(wǎng)頁內(nèi)容(包括圖片以及cookie文件等)存放在電腦或代理服務(wù)器里。當(dāng)你調(diào)用以前閱讀過的頁面時(shí),可以直接調(diào)出緩存中的內(nèi)容,而不需要再次從網(wǎng)站服務(wù)器上重新傳送數(shù)據(jù)。

下圖就是訪問一個(gè)網(wǎng)站后本地緩存文件夾中留下的文件記錄:

由于當(dāng)訪問者通過本地緩存訪問網(wǎng)站時(shí),并不會(huì)往網(wǎng)站服務(wù)器發(fā)送請(qǐng)求,服務(wù)器中自然也就不存在這次訪問的Log記錄。也就是說通過Web日志收集到的數(shù)據(jù)一定會(huì)丟失這部分流量。

2. 網(wǎng)絡(luò)爬蟲

如果想要講清搜索引擎爬蟲的原理和算法恐怕單開一個(gè)章節(jié)都不夠,而且也不是這本書關(guān)注的內(nèi)容,所以這里就不再贅述。

下面先給出一條網(wǎng)站服務(wù)器Log中的搜索引擎爬蟲記錄:

203.208.60.178 [10/Nov/2011:12:00:00 +0800] “-” “GET /index.php HTTP/1.1″ 200 30000 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +/wangzhanfenxi-shuju-buwanmei

文章編輯: 365webcall網(wǎng)上客服系統(tǒng)(www.365webcall.com)

我的評(píng)論

登錄賬號(hào): 密碼: 快速注冊(cè) | 找回密碼

家居| 浦北县| 高州市| 阆中市| 常山县| 龙井市| 兴城市| 甘孜| 孟津县| 深泽县| 遂平县| 长泰县| 大冶市| 南召县| 安徽省| 县级市| 红安县| 广东省| 张掖市| 临沧市| 平南县| 锦屏县| 图片| 嘉峪关市| 桂东县| 防城港市| 上林县| 肥东县| 金沙县| 延寿县| 阿克苏市| 龙游县| 通榆县| 昭苏县| 晋江市| 拉萨市| 米林县| 景泰县| 韩城市| 星座| 汉寿县|