关于CNNIC报告的六个疑问和两个反思 - 蓝鸟看世界 - 蓝鸟

(这条文章已经被阅读了 209 次) 时间:2000-07-30 21:05:18 来源:蓝鸟 (bluejay) 原创-IT

关于CNNIC报告的六个疑问和两个反思

(蓝 鸟)

自从6月初网站评选的各种丑闻被媒体曝光之后,我对CNNIC搞网站评选产生了一股极度厌恶的反感情绪。每次打开信箱,只要看到CNNIC和网站发来的信,我连点击一下都不屑,就将它们直接扔进垃圾筒,因为我觉得:第一、看那些信浪费时间,认认真真去填写调查统计表既浪费时间还浪费感情;第二、我对CNNIC和网站已经失去了信任,怕它们滥用我提供的个人信息;第三、如果留下自己的电子邮件或通信地址,它们就会很热心地向我发送大量的垃圾信,那我不是自找麻烦嘛。所以,后来我没有为CNNIC网站评选投上“宝贵的一票”也是很自然的事。

7月27日,匆匆吃过午饭,我还像往常一样连上线,打开OICQ,进行登录。刚一进去,就有一个在网站工作的朋友发来一条消息,“呵呵,今天CNNIC的结果知道了吧”。CNNIC的结果?这似乎本应是网络界一条非常刺激的新闻,就如同高考放榜一般有轰炸力,但我当时除了平淡之外几乎没有什么反应,第一个念头倒是,“呵,CNNIC也够能整的,居然还真把调查统计和网站排名给搞出来了。”

虽说对这条消息感觉索然寡味,但我后来还是到相关网站去看了看,这一看不要紧,六个疑问立即在我的脑子里升腾出来。

六个疑问

疑问一:1690万网民数是如何统计和计算出来的?

CNNIC发布的《中国互联网络发展状况统计报告》中指出:“截止到2000年6月30日止,中国上网计算机数有650万台,上网用户达到1690万。在1690万上网用户中专线上网的用户人数约为258万,拨号上网的用户人数约为1176万,同时使用专线与拨号的用户人数为256万,除计算机外同时使用其它设备(移动终端、信息家电)上网的用户人数为59万。”

这里有两个问题:

第一, 对于专线上网人数、拨号上网人数和其他终端上网人数,CNNIC是如何统计出来的?《报告》中声称:“本次调查采用计算机网上自动搜寻、联机调查和抽样调查(分层和多阶段相结合)等方法,同时采用抽样调查和联机调查是为了对结果进行比较、验证”。 这种统计方法的漏洞有两个:首先,从社会学的角度来看,联机调查是一种被称为方便抽样的方法,属于非概率抽样,样本的代表性不高,很难推论总体。其次,《报告》在没有说明发放抽样调查问卷总数的情况下,得出“抽样调查有效答卷3679份”的结果,如果由此来对总体做出估计,恐怕从统计逻辑上来讲也是欠推敲的。

第二, 根据《报告》公布的专线、拨号、其他终端上网用户的统计数字,我国网民总数似乎应为258+1176-256+59=1237万,而不是258+1176+2567=1690万(或许CNNIC不是将这三个数字简单相加得到1690万的,但除此之外似乎无法通过数字游戏得到1690万的结果)。

去年年底,CNNIC统计出当时中国网民人数为890万,只用了半年的时间,中国网民人数就能几乎翻一番达到1690万?我在OICQ中询问了15个业界朋友,结果没有一个不对此表示怀疑的。越过怀疑,我想起了历史书上记载的“大跃进”:那时侯,农民地里的粮食产量没有增多,但他们为了“超英赶美”早日实现共产主义的宏伟目标,朝中央报的亩产数字却如同打火箭炮一般猛窜。中国的媒体一直都在鼓噪“中国将于某年成为世界第二大互联网市场”,CNNIC应该不是为了早日实现“全民上网”而在制造又一个大跃进吧?

疑问二:CNNIC到底搞了几次调查?

7月27日,《报告》一经发布,作者就发现了两个不同的版本,并且其中有些内容还稍有出入。
新浪网上的《报告》提交者署名为“中国互联网络信息中心”,其中称:“CNNIC在2000年5月22日至2000年6月30日期间进行了网上联机和抽样调查。此次调查得到了国内众多知名ISP、ICP站点的支持,国内的大部分网站均在主页为本次联机调查问卷放置了链接。本次联机调查共收到问卷1629361份,经处理得到有效答卷573902份。抽样调查有效答卷3679份。本次统计数据的截止日期是2000年6月30日。”

而CNNIC网站发布的《报告》中却指出:“CNNIC在2000年6月22日至2000年7月10日期间进行了网上联机和抽样调查。此次调查活动得到了国内众多ISP、ICP等相关单位的支持。本次联机调查共收到问卷245680份,经处理得到有效答卷205724份。”

令人疑惑的是:这两份报告指的似乎不是同一次调查,一个是从5月22日至6月30日,另一个是从6月22日至7月10日;并且调查问卷数也相差甚多,一个是1629361问卷中573902份有效,另一个是245680份问卷中205724份有效。是新浪转抄出错了吗?还是CNNIC在那次舞弊之后又于6月22日重新开展了一次调查?如果是后者,那怎么我们好象不知道这回事呀,媒体似乎也没有报道过呀,CNNIC总不至于搞一次秘密调查吧?!

根据笔者的记忆,CNNIC调查活动是从5月底开始的,6月份网站作弊丑闻曝光之后,引起了媒体和网站的一番爆炒,此后CNNIC虽仍坚持要把调查评比进行到底,但一直保持低调运做。
难道这其中有什么猫腻儿?!

疑问三:调查结果的公信力何在?

如果按照新浪公布的那份《报告》为依据,“本次联机调查共收到问卷1629361份,经处理得到有效答卷573902份。”

在1629361份答卷中有效答卷只有573902份,三分之一稍微强一点,而大部分答卷却都是无效的,不管怎么说,如此高的废票率不可能不让人怀疑统计结果的公信力。

即使按照CNNIC网站公布的《报告》为准,“本次联机调查共收到问卷245680份,经处理得到有效答卷205724份。”这废票率也不低。

此外,有效答卷中水分有多大,恐怕CNNIC自己心里也没数,那么统计结果的真实性也是值得怀疑的。记得6月初的时候,很多网站都在耍花招搞作弊,尽管CNNIC明确表示他们有先进的科技手段、统计学依据和处理方法能够对付网站的作弊,但可惜是,CNNIC从来没有透露过是如何具体操作评选过程的。既然如此,公众对这名“阅卷老师”无法剔除作弊表示怀疑也就不足为怪了。
将近三分之二的废票率,并且有效问卷中也可能存在很大的水分,这些都无法保证调查结果的公信度。

疑问四:网站分类,咋这么玄乎?

稍微注意一下网站的分类排名,就能发现几个很好玩的地方:

其一、以中文网址而闻名的3721.com被分到了“电脑网络”类中,怎么看都有些牵强,而专注于电脑网络领域的几个著名网站(如ChinaByte、eNet、赛迪、Cnet等)却无缘挤身三甲,更是完全出乎我的意料之外。

其二、名不见经传的www.sdrt.com(山东省广播电视厅)居然爆出冷门,晋为“新闻媒体”类第三名,实在是让人大跌眼镜。更令笔者困惑不解的是:主打新闻的东方网(www.eastday.com)得票数为2722,远超过www.sdrt.com的1016票,却没有被分到新闻媒体类,难道这是CNNIC的疏漏不成?

说句大实话,如果1000来票就能进入前三名,那谁要想得个好名次似乎也太容易捣鬼了。恕笔者以小人之心度君子之腹:只要www.sdrt.com的员工每人投自己网站一票估计凑够1016票也绰绰有余。

其三、那么多优秀的大学网站(如清华、北大),在本次网站评选中全军覆没,无一进入科技教育类网站前三名,这也不能不说是本次本次评选的一大冷门。

疑问五:到底是在为网站做排名,还是在为域名做排名?

http://www.tencent.com和www.oicq.com都是OICQ厂家腾讯网站的域名,指向同一个网站,但这次却获得了两个名次,www.tencent.com得到5116票,而www.oicq.com也得到了672票,按照常理,既然是同一个网站,那结果应该是这两个投票数相加再减去同时选这两个域名的投票数,而不应当把这两个域名作为单独的网站列出来。

如果不同的域名就能算不同的网站,那么我认为:www.163.com(网易的另一域名)也能得到不少投票,www.cpcw.com(www.yesky.com以前的域名)的得票数估计也不会低于www.yesky.com。

此外,中华网上海站www.shanghai.china.com获得了1077票,跟www.china.com分了家。如果子站应该单独算的话,那么我相信,拥有9个城市子站的e龙恐怕最少也能分成四五个出现,但报告中e龙却没有出现这种情况,莫非是CNNIC把e龙所有子站得票数全部加到了一起不成?!

或许CNNIC会解释说他们是完全按照反馈卷的答案统计出来的,把不同的域名单列出来是为了反映真实情况。那么,我要说:CNNIC的统计结果太简单化了,把一个有两个以上域名的网站排出好几个名次至少显得有点傻瓜和弱智。

疑问六:CNNIC到底是在搞中国网站评选,还是在搞全球网站评选?

《报告》的“中国互联网络网站影响力调查名单”中既有中国网站,也不乏大名鼎鼎的Yahoo!、Hotmail、ESPN.com、NBA.com、CNN.com等美国英文网站。所以,笔者就有些想法了:第一,既然搞中国网站评选,在咱们自己的圈子里比就行了,不要把人家美国的网站也给拉过来,CNNIC的这种超常发挥未免显得有些“离题”。第二,如果是公众投票中有很多人选美国网站,按照规定应该把那些票视为无效处理,即使当成有效票,最后的统计结果出来之后也应该把美国网站剔除掉,因为CNNIC没有把“命题范围”定义在全球。

根据疑问五和疑问六,笔者认为,CNNIC的统计数据没有经过合理的、必要的处理,显得很粗糙,难道这就是CNNIC的“科学”和“严谨”?

两个反思

对《报告》稍做分析之后,笔者就解读出了不少疑问,透过这些或大或小的疑问,笔者对网络现状调查和网站评选也进行了很认真但却仍显浅薄和可笑的反思。

反思一:如何增强调查和排名的公信度?

对于这个反思,笔者有几点个人的见解:

首先,CNNIC组织网络调查和网站评选不应当受到指责。曾有人认为CNNIC是“非赢利性政府机构”,不应当参加商业性的网络调查和网站评选,而应当像外国那样由第三方公司组织实施。我认为这种提法是有问题的:一、中国现在恐怕还没有哪个第三方公司有这样的威信和实力;二、第三方公司开展此类活动甚至会遭到更多的诟病,一个典型的例子就是网大对中国大学进行排名,但却被起诉,难道谁能保证第三方公司搞网站排名就不会以“名誉侵权罪”被起诉?

其次,CNNIC应认真学习那些世界著名市场调查公司的统计方法,并将自己采用的统计方法公开和透明化,而不是一边口口声声说自己采用的统计方法是科学和合理的,另一边却搞黑箱操作,不让别人知道自己的具体操作方法和流程。

第三,对网站排名要端正态度,把分类理清晰。笔者注意到,本次《报告》摒弃了以前“十佳网站”的说法,而改用“中国互联网络影响力XX网站”,这就是一个进步。但如果以网络流量、网站营收等因素而不单单以投票为衡量指标,结果就会更科学、更合理一些。

反思二:如何体现调查和排名的价值与意义?

为什么要开展网络调查和网站评选?笔者认为,其意义应该体现在三个方面:

首先,根据调查所得的统计信息和网站排名,国家能够动态地掌握网络在我国的发展情况,以便做出有针对性的正确决策。根据前几次调查统计结果,国家针对我国网络速度太慢、费用过高等问题,分别采取了带宽扩容、降低相关接入费用等措施,大大地改善了网络拥塞、收费过高等不合理状况。

其次,企业能够根据调查获悉中国的网络国情,进一步加强自己的产品和服务定位。通过调查和排名,国内网站可以了解企业和网民最需要什么,以及自己在整个大环境中所处的位置。根据统计调查和行业比较,及时发现自身的不足,学习优秀网站的长处,使自己做得更好,从而使得整个互联网产业得到良性的发展。

第三,在网络发展还处于幼稚期的阶段,确立一批定位不同的优秀网站,为我国广大网民上网提供有价值的参考信息,同时也把它们推向世界,先巩固国内地位,再扩大国际影响,以使我国网站能够逐步增加知名度和影响力,推动我国互联网产业的发展。

总之,开展网络调查和网站评选,一定要做到能够科学地反映真实情况,不然的话,所有的努力都会失去本应有的意义,还劳民伤财,对互联网产业发展起不到任何积极作用。

或许,一切都会好起来的······

关于CNNIC报告的六个疑问和两个反思 - 安宁 - 2000-07-31 08:51:09

对于疑问二,你应该知道CNNIC此次调查分两阶段,这两个报告是分别针对两阶段而言的。 文章不错,但是有些东西要调查清楚再说话哦。

Re:关于CNNIC报告的六个疑问和两个反思 - 张翼轸 - 2000-07-31 11:02:17

很高兴在问题一中能引用我的<业余水平的CNNIC调查>一文的观点,但希望能够注明出处.谢谢!