一段网站流量监测的JS代码

目前遇到一个非常棘手的问题,关于网站流量监测的,而我对如何解决完全没有想法。。
我的js代码地址:http://blog.blacklee.net/uploads/tech/tracker.php

首先简单说一下网站流量监测的基本思路吧
类似于 Google-Analytics ,需要先在被监测网站埋放一个 javascript ,像 ga.js 这样的
这段 js 自动加载执行,读取各个需要的数据,比如 document.referrer 、 cookies 等
然后往 document.body 上添加一个 img 节点,把需要的数据往 img src 的参数里放,向监测服务器发出一个类似的请求:
http://www.google-analytics.com/__utm.gif?utmwv=4.9.1&utmn=176820245&utmhn=www.douban.com&utmcs=UTF-8&utmsr=1440x900&utmsc=24-bit&utmul=zh-cn&utmje=1&utmfl=10.2%20r153&utmdt=%E8%B1%86%E7%93%A3&utmhid=278583876&utmr=-&utmp=%2F&utmac=UA-7019765-1&utmcc=__utma%3D30149280.276662128.1294996086.1300933211.1301276680.16%3B%2B__utmz%3D30149280.1300933211.15.6.utmcsr%3Dtwitter.com%7Cutmccn%3D(referral)%7Cutmcmd%3Dreferral%7Cutmcct%3D%2F%3B&utmu=qBM
后监测服务端分析WEB访问日志,计算数据

我现在的情况是,用了一个 php 生成 javascript:地址 http://blog.blacklee.net/uploads/tech/tracker.php
另此 js 和发出的图片 1.gif ,是位于同一台机器上的
结果是对 tracker.php 这个 js 的请求,总比对 1.gif 这个图片的请求多30%~50%
而预期应该是两者持平的:
[root@centos5 nginx]# grep '/tracker.php' access_2011-03-24.log | wc -l
  39660
[root@centos5 nginx]# grep '/1.gif' access_2011-03-24.log | wc -l
  22050

在 js 里面,我试过用 img 和 iframe 加载图片,效果一样。也试过把 1.gif 改成 __utm.gif ,效果还是一样。。。

困扰多日了,求教。
问题补充
请求图片的地址,每次的参数都不一样,不会有缓存
而且,就算有缓存,WEB服务器的日志里也应当有记录,状态码是304

js加载后自动执行的方法,我也试了直接执行和


if (window.addEventListener) {
window.addEventListener('load', work, false);
} else if (window.attachEvent) {
window.attachEvent('onload', work);
}

这里面的work也就是调用了一个init和submit,没做其它的。
效果没大差别

还有就是,同一网页也放了其它的第三方监测代码,量子统计、百度统计、孔明统计,他们的数据就还好了

另:如何大致检测未加载完成便离开的用户呢?
问题补充
恩,谢谢。
你提到的这几个说法我以前没遇过,长知识了。
回头试验一下你给出的代码~

PS:我这代码目前是放在网页最底部而不在head里

另外我和朋友还试验出了一种情况

var img = new Image();
img.src = "http://xxx";

只设置完img的src后,浏览器(IE8,FF)就去发送请求了。。。
@int08h,你觉得用这个来做手脚靠谱么?

3个回答

我抽空看了一下你的tracker.php,发现这么些问题:
1、javascript的Math.random是不接受seed的,所以Math.random(new Date())其实是没意义的,建议要随机串的话用(Math.random() * 100000).toFixed() + new Date()这样的形式
2、你的img是放在document.body下的,你能保证用户不把tracker.php的引入script标签放在head吗?放在head的话,document.body会报Reference Error,导致1.gif没发送
3、你的onload策略是用来解决document.body的Reference Error问题的,但是中国平均网页的onload时间是在5s以上,这个时间足够让大量用户离开网站了

对于img标签的应用,我建议你这么写:
[code="javascript"]
var img = new Image(),
id = 'img' + new Date();
img.id = id;
img.onload = img.onerror = img.onabort = function() { window[id] = undefined; };
window[id] = img;
img.src = 'http://xxx'; // 此处设置src
[/code]
以上代码需要注意的地方:
1、img.src必须最后设定,不然onload/onerror/onabort可能没用,导致内存无法清理
2、一定要挂到window下,不然如果页面的js执行非常频繁,导致GC很频繁的话,可能这个img的请求没完成的时候img对象被GC了,会导致请求被abort

加载完tracker.php到tracker.php发送1.gif图片请求之间是有时间的,这段时间内用户可能离开网站,根据网站的类型,这个比率可大可小,这个需要你自己检测一下,当然30-50的百分比我确实认为大了点,我没办法看你的1.gif的具体请求信息,难道你不小心加了缓存头?

new Image().src = 'xxx';
这一段确实会发出请求,这是成名已久的日志发送方法,但正如我上文所说,这个Image对象可能碰巧不幸被GC回收,那这个请求就报废(abort)了
所以我给的代码中,先将Image对象挂在了window下,这样这个对象在对象图中就是可达的,不会被GC掉

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
求一段显示论坛楼层数的代码
-
求一段JS或者JQ的点击代码
-
Tampermonkey插件加载一段JS代码问题
-
求一段js或者JQ显示隐藏代码
-
寻一段遍历文件的python代码
-
求一段数据库连接超时的代码
-
写一段能导致内存溢出的代码
-
vs2010 MFC 求一段检测txt文件变化的代码
-
求一段可以打印哈夫曼树的代码,能够在执行时看到的,谢谢!!
-
解密这个钓鱼网站的一段js代码
-
一段JS 代码 好像是关于资源回收的,不懂请教达人,代码贴出
-
阅读一段js关于加密功能的代码,一处不大理解
-
C#解密一段加密后的Js代码
-
一段简单的js代码
-
在java程序中插入一段代码,播放音乐?求详解
-
一段ASP多条件查询的代码.提示FROM子句错误
-
一段javascript代码的理解
-
一段JAVA代码转C#代码问题
-
求一段正则表达式的代码
-
Linux文件操作高频使用命令
文章目录0.新建操作:1.查看操作2.删除操作3.复制操作4.移动操作:5.重命名操作:6.解压压缩操作 0.新建操作: mkdir abc #新建一个文件夹 touch abc.sh #新建一个文件 1.查看操作 查看目录: ll #显示目录文件详细信息 查看文件内容: cat|head|tail命令 cat abc.txt #查看abc的内容 head -5 abc.txt #...
程序员实用工具网站
目录 1、搜索引擎 2、PPT 3、图片操作 4、文件共享 5、应届生招聘 6、程序员面试题库 7、办公、开发软件 8、高清图片、视频素材网站 9、项目开源 10、算法 11、在线工具宝典大全 程序员开发需要具备良好的信息检索能力,为了备忘(收藏夹真是满了),将开发过程中常用的网站进行整理。 1、搜索引擎 1.1、秘迹搜索 一款无敌有良心、无敌安全的搜索引擎,不会收...
史上最详细的IDEA优雅整合Maven+SSM框架(详细思路+附带源码)
网上很多整合SSM博客文章并不能让初探ssm的同学思路完全的清晰,可以试着关掉整合教程,摇两下头骨,哈一大口气,就在万事具备的时候,开整,这个时候你可能思路全无 ~中招了咩~ ,还有一些同学依旧在使用eclipse或者Myeclipse开发,我想对这些朋友说IDEA 的编译速度很快,人生苦短,来不及解释了,直接上手idea吧。这篇文章每一步搭建过程都测试过了,应该不会有什么差错。本文章还有个比较优秀的特点,就是idea的使用,基本上关于idea的操作都算是比较详细的,所以不用太担心不会撸idea!最后,本文
我花了一夜用数据结构给女朋友写个H5走迷宫游戏
起因 又到深夜了,我按照以往在csdn和公众号写着数据结构!这占用了我大量的时间!我的超越妹妹严重缺乏陪伴而 怨气满满! 而女朋友时常埋怨,认为数据结构这么抽象难懂的东西没啥作用,常会问道:天天写这玩意,有啥作用。而我答道:能干事情多了,比如写个迷宫小游戏啥的! 当我码完字准备睡觉时:写不好别睡觉! 分析 如果用数据结构与算法造出东西来呢? ...
BMP、GIF、TIFF、PNG、JPG和SVG格式图像的特点
目录 1、BMP格式图像 2、GIF格式图像 3、TIFF格式图像 4、PNG格式图像 5、JPG格式图像 6、SVG格式图像 7、总结 7.1、有损vs无损 7.2、索引色vs直接色 7.3、点阵图vs矢量图 7.4、总结 一张图片可以储存为多种格式,为什么有的几十KB,有的几百MB,有的静止不动,有的是好几个画面循环播放?在项目开发的过程中经常会读取或保存图像...
高级软件工程师教会我的那些事儿
【CSDN编者按】以人为鉴,可明得失。对于新手程序员来说,面对复杂的开发需求很容易因为经验不足或技术不够娴熟等原因而踩坑。本文的作者表示:坐在高级软件工程师旁边工作或许可以事半功倍!长达一年的观察学习,他收获了包括编写代码、测试、设计、部署以及监控的一系列的长足进步。 声明:本文已获作者翻译授权,原文(https://neilkakkar.com/things-I-learnt-from-...
nginx学习,看这一篇就够了:下载、安装。使用:正向代理、反向代理、负载均衡。常用命令和配置文件
文章目录前言一、nginx简介1. 什么是 nginx 和可以做什么事情2.Nginx 作为 web 服务器3. 正向代理4. 反向代理5. 动静分离6.动静分离二、Nginx 的安装三、 Nginx 的常用命令和配置文件四、 Nginx 配置实例 1 反向代理五、 Nginx 配置实例 2 负载均衡六、 Nginx 配置实例 3 动静分离七、 Nginx 的高可用集群 前言 一、nginx简介...
MySQL数据库—SQL汇总
一、准备 下文整理常见SQL语句的用法,使用MySQL5.7测试,参考了尚硅谷MySQL教程及用例。用例sql: 链接: https://pan.baidu.com/s/1tb3-12MRNFjV8drFlN6wzg&shfl=sharepset 密码: fc2h 为了方便查阅可从右侧目录快速索引 二、DQL(Data Query Language)数据查询语言 1、语句顺序 书写顺序...
黑客入门,从HTB开始
Hack the box 是国外的一个靶机平台,里面的靶机包含多种系统类型,并且里面可以利用的漏洞类型多种多样,有很多靶机其实非常贴近实战情景。因此 HTB 是一个很好的学习渗透测试靶场。 之前在 HTB 也玩过一些机器。里面的机器难度有好几个档次,insane 难度的一般都是极其困难的,这种机器一般让我对着大神的 Writeup 我可能都没有办法复现出来。之前也有在公众号上分享过几篇 H...
动画:用动画给女朋友讲解 TCP 四次分手过程
作者 | 小鹿 来源 | 公众号:小鹿动画学编程 写在前边 大家好,我们又见面了,做为一个业余的动画师,上次的用动画的形式讲解 TCP 三次握手过程再各大平台收到了广大读者的喜爱,说文章有趣、有货、有内容,也受到了很多读者的关注。很多读者留言说什么时候用动画讲一讲 TCP 四次挥手的过程,为了应大家的要求,今天我们就生动有趣的用动画给大家分享 TCP 四次挥手(分手)过程。 动画:用动画给...
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过...
SQL基本语法入门 看这里就够了
SQL执行顺序 第一步:执行FROM 第二步:WHERE条件过滤 第三步:GROUP BY 分组 第四步:执行SELECT 投影列 第五步:HAVING条件过滤 第六步:执行ORDER BY排序 一、创建、删除库 -- 创建新数据库 CREATE DATABASE 数据库名; -- 删除数据库 DROP DATABASE 数据库名; 二、增加 1、添加列名、设置主键、设...
如何优化MySQL千万级大表,我写了6000字的解读
这是学习笔记的第2138篇文章 千万级大表如何优化,这是一个很有技术含量的问题,通常我们的直觉思维都会跳转到拆分或者数据分区,在此我想做一些补充和梳理,想和大家做一些这方面的经验总结,也欢迎大家提出建议。 从一开始脑海里开始也是火光四现,到不断的自我批评,后来也参考了一些团队的经验,我整理了下面的大纲内容。 既然要吃透这个问题,我们势必要回到本源,我把这个...
面试最后一问:你有什么问题想问我吗?
尽管,我们之前分享了这么多关于面试的主题: 高薪必备的一些Spring Boot高级面试题 面试必问:设计模式遵循的面向对象设计原则! 面试必问:怎么保证缓存与数据库的双写一致性? 27道高频Spring面试题,你能答对几个? 唠唠面试常问的:面向对象六大原则 一文高效图解二叉树面试题 Java面试中最高频的那20%知识点是什么? 百度面试题:求数组最大值 ... 然而,最后这个90%可见...
python 程序员进阶之路:从新手到高手的100个模块
在知乎和CSDN的圈子里,经常看到、听到一些 python 初学者说,学完基础语法后,不知道该学什么,学了也不知道怎么用,一脸的茫然。近日,CSDN的公众号推送了一篇博客,题目叫做《迷思:Python 学到什么程度可以面试工作?》,真实反映了 python 程序员在成长过程中的一些困惑。
Python——画一棵漂亮的樱花树(不同种樱花+玫瑰+圣诞树喔)
最近翻到一篇知乎,上面有不少用Python(大多是turtle库)绘制的树图,感觉很漂亮,我整理了一下,挑了一些我觉得不错的代码分享给大家(这些我都测试过,确实可以生成) one 樱花树 动态生成樱花 效果图(这个是动态的): 实现代码 import turtle as T import random import time # 画樱花的躯干(60,t) def Tree(branch, ...
Linux/C/C++ 不可错过的好书
来源:公众号【编程珠玑】 作者:守望先生 ID:shouwangxiansheng 前言 经常有读者让我推荐书籍,这次我就把我私藏的计算机书单分享给你们!不过由于时间匆忙,不会进行更加详细的介绍。 声明 由于每个人的情况不一样,推荐的书并不一定适合你,也不一定适合当前阶段的你,有的书籍可能存在内容重复,所以根据自己的阶段情况进行选择即可。虽说如此,以下书单中提单的书均为优质书籍。...
计算机处理器基础原理笔记
一、CPU指令电路 1. 计算机每执行一条指令的过程,可以分解成这样几个步骤。 (1)Fetch(取得指令),也就是从PC寄存器里找到对应的指令地址,根据指令地址从内存里把具体的指令,加载到指令寄存器中,然后把PC寄存器自增,在未来执行下一条指令。 (2)Decode(指令译码),也就是根据指令寄存器里面的指令,解析成要进行什么样的操作,是MIPS指令集的R、I、J中哪一种指令,具体要操作哪...
单点登录(SSO)
一、SSO(单点登录)介绍 SSO英文全称Single SignOn,单点登录。SSO是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。它包括可以将这次主要的登录映射到其他应用中用于同一个用户的登录的机制。它是目前比较流行的企业业务整合的解决方案之一。 实现机制 当用户第一次访问应用系统1的时候,因为还没有登录,会被引导到认证系统中进行登录;根据用户提供的登录信息,认证...
漫话:什么是 https ?这应该是全网把 https 讲的最好的一篇文章了
今天这篇文章,讲通过对话的形式,让你由浅入深着知道,为什么 Https 是安全的。 一、对称加密 一禅:在每次发送真实数据之前,服务器先生成一把密钥,然后先把密钥传输给客户端。之后服务器给客户端发送真实数据的时候,会用这把密钥对数据进行加密,客户端收到加密数据之后,用刚才收到的密钥进行解密。如图: 当然,如果客户端要给服务器发送数据,也是采用这把密钥来加密,这里为了方便,我采用单方向...
HTML CSS整理笔记
常见字体单位: 1.em 移动端常用的字体尺寸单位,说白em就相当于“倍”,比如设置当前的div的字体大小为1.5em,则当前的div的字体大小为:当前div继承的字体大小*1.5。 但当div进行嵌套时,em始终按当前div继承的字体大小来缩放。 2.rem r是root的意思,即相对于根节点html的font-size进行缩放,当有嵌套关系时,嵌套关系的元素的字体大小始终按照根节点的字体大小...
相关热词 c# 增加元素 c#控制台简单加法 c# 服务端框架 c# 判断事件是否注册 c#中is和has c# udp 连接超时 c#词典 c#实现排列组合 c# oss 上传 c#判断输入的是否为ip