车东 posted a photo:
3083 items (0 unread) in 19 feeds
车东 posted a photo:
Google在线安全实验室绘制了一张恶意软件的分布地图.根据受威胁的网站分布情况分颜色展示,主要集中在中国、美国、德国和俄罗斯,颜色越红表示受灾严重,
绿色表示没有发现来源,
黄色表示低活动率,
橙色表示中等,
红色表示严重.
googleonlinesecurity.blogspot.com/2007/05/introducing-goo...
Google提醒各位浏览者要多加小心.
翻译: www.cnbeta.com/articles/27027.htm
很奇怪从Lilina上订阅的blogger.com发布的内容发布时间总是显示为未来8小时(格林威治)时间,一开始怀疑是atom输出的时区设置问题,但是看了atom.xml的输出,发现是有时区设置的,和其他引用的atom输出的主要区别在于发布时间有毫秒设置:
<published>2007-05-15T14:49:00.000+08:00</published>
Lilina是一个基于MagpieRSS的聚合工具,MagpieRSS中对于atom格式时间的解析是通过rss_utils.inc中的parse_w3cdtf()函数,当时可能没有考虑到秒后面还有毫秒,导致对后面的时区设置解析失败,变成了格林威治时间。修正后的正则表达式和代码如下:可以兼容解析其他标准的ISO 8601时间格式解析。
diff -r1.7 rss_utils.inc
28c28
< $pat = "/(d{4})-(d{2})-(d{2})T(d{2}):(d{2})(:(d{2}))?(?:([-+])(d{2}):?(d{2})|(Z))?/";
---
> $pat = "/(d{4})-(d{2})-(d{2})T(d{2}):(d{2})(:(d{2}))?(.d{3})?(?:([-+])(d{2}):?(d{2})|(Z))?/";
43c43
< array( $match[8], $match[9], $match[10]);
---
> array( $match[9], $match[10], $match[11]);
给Blogger的问题:这个修改有些nerdly吧?文章发表时间有必要精确到毫秒吗?我找到的atom的相关规范是按照ISO 8601格式,也就是:2007-05-15T14:49:00+08:00
运行了一天,这个函数修正没有问题。
MagpieRSS项目已经hosting到了Google上:
[code.google.com]
类似的:从日志统计中发现,spoolsv.exe是最大的用户来源。那么除了spoolsv.exe外,用户还经常搜那些相关的问题呢?查一下“.exe”就可以关联出其他经常被查询的关键词。1 如何炒股 2 如何购买基金 3 如何减肥 4 如何买基金 5 如何看k线图 6 如何打开注册表 7 如何重装系统 8 如何买股票 9 如何制作网页 10 如何进入安全模式
原来spoolsv.exe只是一个此类关键词中流量排名第11位的,通过搜索量状态条可以推算出其他关键词的搜索量。 Google的搜索引擎建议也是包含搜索量因素的排序:1 svchost.exe 2 cmd.exe 3 iexplore.exe 4 alg.exe 5 wuauclt.exe 6 ctfmon.exe 7 explorer.exe 8 taskmgr.exe 9 avp.exe 10 rundll32.exe 11 spoolsv.exe
此外:热榜和搜索风向标也是将比较各种关键词来源趋势的好工具。
;用了fastcgi,对于系统来说也是一个很高的负载。 而且对于AWStats统计来说:即使是404请求,也是计算到来访的独立用户的,这样会造成很多误差:比如去年10月份的统计,很难想想来自于那些国外机房(美国,日本,丹麦)的流量居然占了top 10 IP来源中的9个,让这个TOP 10 IP来源完全失去了意义。404 Document Not Found 276101 95.2 % 1.43 G字节
过滤了404也只是相对接近真实了一点:仍然有大量用于发现trackback侦察机在抓取:主机 (前 10) - 全部列出 - 最近参观日期 - 无法反解译的IP地址 主机 : 0 个解译成功, 164470 无法得知(不能反解网域名称) 119778 参观者 GeoIP Country GeoIP City 网页数 文件数 字节 最近参观日期 38.98.120.69 United States Washington 9207 9308 438.99 M字节 2006年 10月 31日 23:58 8.11.2.79 United States 无法得知 8961 9058 267.84 M字节 2006年 10月 11日 04:13 220.181.18.77 China Beijing 1278 1278 31.18 M字节 2006年 10月 31日 18:59 61.12.159.237 Japan Kami-meguro 1081 1324 24.45 M字节 2006年 10月 29日 10:44 82.103.132.52 Denmark 无法得知 744 744 9.96 M字节 2006年 10月 31日 03:27 61.149.109.88 China Beijing 734 939 22.79 M字节 2006年 10月 03日 01:25 72.21.39.242 United States Frisco 684 710 17.87 M字节 2006年 10月 31日 10:16 220.189.213.3 China Hangzhou 528 11357 31.71 M字节 2006年 10月 31日 20:54 209.67.217.226 United States Dallas 515 515 12.11 M字节 2006年 10月 31日 23:31 64.27.19.254 United States Los Angeles 508 800 52.20 M字节 2006年 10月 31日 23:37
解决方法:在awstats.chedong.conf文件中增加过滤文件配置 1 SkipFiles,过滤所有cgi-bin/mt目录下的访问请求; 2 SkipUserAgents 过滤trackback的空UA侦察机; 配置样例:58.25.99.171 China Shanghai 383 536 11.04 M字节 2007年 5 月 02日 23:23 222.210.108.237 China Beijing 263 263 2.15 M字节 2007年 5 月 02日 16:49 69.46.20.87 United States Tampa 162 162 4.18 M字节 2007年 5 月 02日 22:51 66.232.114.68 United States Tampa 152 152 4.12 M字节 2007年 5 月 02日 09:50 69.46.16.231 United States Tampa 146 146 3.86 M字节 2007年 5 月 02日 23:59 66.232.112.56 United States Tampa 110 110 2.99 M字节 2007年 5 月 02日 00:53 206.51.229.7 United States Tampa 110 110 2.87 M字节 2007年 5 月 02日 01:16 66.98.228.48 United States Houston 100 100 2.29 M字节 2007年 5 月 02日 01:16 201.226.51.7 Panama 无法得知 99 129 2.47 M字节 2007年 5 月 01日 11:48 216.246.78.191 United States Chicago 94 94 4.19 M字节 2007年 5 月 02日 23:53
真实的数字:比绝对值更重要。 关闭了trackback后如何统计来源呢:利用搜索引擎的blogsearch的link:example.com明令是一个比较好的方法。SkipFiles="REGEX[^/cgi-bin/mt/]" SkipUserAgents="-"