曾两度出任英国首相的本杰明·迪斯雷利有句名言,“世界上有三种谎言:谎言、该死的谎言,还有统计数据。”事实上,统计数据本身并无罪,可人们往往喜欢滥用统计工具来支撑自己的立场,而不是反映真实情况。
如今,来自于方方面面的统计数据、调查数据越来越多,并日益影响到普通人的生活和心态。面对海量的数据,该如何分析辨别?记者采访了有关专家。
正点率、物价涨幅怎么和我感受不同?
统计数据常是“一篮子”项目的全国综合水平,往往与个人感受不一致;某些指标或算法有特定的含义
去年下半年以来,看着菜价、肉价一路飙升,退休职工田英开始关心起CPI。不过每个月和自己的家庭账本“对账”时,田英总会很疑惑:“我账本里的肉价、菜价都翻一两倍了,房租也涨了两成,可当月CPI还是个位数,这统计局的数据是不是造假了?”
和田英一样对官方数据抱有怀疑的还有常在京沪之间出差的薛先生。根据中国民用航空局的统计,2010年民航航班正点率为75.5%,可这个数据与薛先生的感受大相径庭。“怎么可能这么高?我去年跑上海,就没一次准点过!尤其是世博会期间,航班延误一般都要两三个小时!”
为什么这些权威部门的统计数据,与百姓的生活体验不一致呢?
一是人们往往喜欢用少数商品的价格水平或服务水平,与相关部门统计的“一篮子”商品或服务项目的综合平均水平相比较。比如田英的账本仅记录了自己家附近农贸市场的菜价和自家的房租变化。而统计局公布的CPI构成分八大类262个基本分类,价格往往有升有降,而且各分类的权重也不同。
二是人们往往喜欢用某一地域的价格水平或服务水平,与全省、全国的平均水平相比较。比如,薛先生就是用自己经历的某一条航线某几个航班的准点率,与全国范围所有航线所有班次的正点率相比较。
三是人们对某一调查的样本及统计口径不了解。统计口径是指统计数据所采用的标准,包括统计方式、统计范围等指标。统计方法又包括抽样调查、全面统计等。不同的统计口径会导致完全不同的统计结果。例如,今年5月国家统计局公布的“2010年城镇居民人均居住月支出111元”就是个狭义口径,购建房款支出不包含在内,只统计实际发生的房租、供暖费、维修费等现金支出。而且该调查样本有80%以上是自有住房户,20%是租房户,因此样本中的“零房租”大大拉低了最终的平均支出水平。
清华大学新闻与传播学院教授金兼斌长期研究媒介调查与统计方法。他认为,“有些指标的定义或者算法,民众可能不太清楚。例如物价指数是一个有多个子指标计算合成的综合指标。但如果人们只关注或比较关注其中个别指标,则两者的涨跌状况有时会有出入。因此,在有关部门不断完善统计方法的同时,也需要提高民众的统计素养和科学素养。”
目前,统计部门对外公布的各种报告中,都会附有该项调查的统计口径、统计样本、统计方法以及具体名词的解释,以便研究机构或大众媒体更科学地解读和运用数据。比如目前的“城镇登记失业率”,这项统计针对的是非农业户口、在一定的劳动年龄内、有劳动能力、无业而要求就业并在当地就业服务机构进行求职登记的人员,不包括农村劳动力、国有及集体企业下岗职工,以及未主动登记的其他城镇失业人员;“城镇职工平均工资”,包括了工资、津贴、奖金,以及个人应交纳的养老、医疗、住房等个人账户的基金和税金。
不过也有人建议,这些民生调查的统计口径与样本应继续完善,使之更合乎现实国情。例如,城镇居民人均居住月支出调查中80%的样本为自有房住户,这一比例是否偏高?如果以该统计数据为参考,那么各地是否会丧失巩固房地产调控政策、大力发展保障房的动力?如果“失业率”的统计口径与方法能随着时代发展而不断完善,是不是就会使感觉自己“被就业”的人群相应减少呢?
仅凭平均数可能会被误导?
平均数不能代表一组数据,更不能反映一组数据间有多大差异,还会受到极端值的巨大影响
大学生小仇还没毕业,就掉进了“平均数的陷阱”。她曾到一家展会公司求职,被老板告知企业平均工资为3000元,她的实习起薪是800元。后来她托熟人一打听,发现公司业务员的薪水都是1000元,便去找老板理论。
老板给她算了一笔账:公司业务员10名,薪水1000元;业务经理5名,薪水2000元;部门主管6名,薪水2500元;副总经理拿10000元,总经理拿24000元。由于收入差距悬殊,全体人员一平均,平均工资确实是3000元。而对于小仇这样的求职者而言,一组数据中出现最多的数值众数,即大多数员工的工资1000元,以及一组数据从小到大排列位于中间的数值中位数,即员工中等工资2000元,可能比平均数更具有参考价值。
实际上,小仇的经历也反映了目前统计数据无法反映社会收入分配差距的问题。2010年我国城镇非私营单位在岗职工年平均工资为37147元。其中,最高工资行业与最低工资行业年平均工资之比为4.7∶1;最高工资行业金融业中,非私营单位与私营单位在岗职工年平均工资之比为2.6∶1。由于行业差距、地域差距,以及同行业中不同企业、同企业中不同级别的收入差距,导致低收入群体在看到37147元时,往往产生“被增收”的感觉,而高收入人群看到37147元时,又觉得该数值被严重低估。
由于可以简洁地反映样本总体的情况,统计中的“平均数”无处不在。然而平均数也具有误导性,常会掩盖原始数据的信息,还会受到极端值的巨大影响。比如在中小学里,班级平均分往往会因为一两名不及格的学生而大幅下滑,因此总有老师会愤懑地说:“真是一颗坏小豆,毁了一锅粥”。再比如,在各种体育、文艺比赛中,往往会“减去一个最高分、再减去一个最低分”,这也是因为将少数异常值去掉后计算出的平均值具有更好的代表性与稳定性。
“仅靠平均数不能反映一组数据间有多大差异。平均数通常需要与标准偏差结合起来报告或考察,才能得出相对全面的分布描述。”金兼斌认为,人们对统计数据产生误读或误解,往往是因为有关部门发布这些调查数据时,只报告了平均数,而没有解释相关指标的分布差异情况。“那些与平均数水平差别较大的民众,会觉得调查结果与他们实际感受有出入,进而认为数据有问题。”
实际上,统计是无限接近现实,却不能代替现实,很多统计数据只能反映宏观趋势的变化,不适合作为个体选择的参考。比如,统计部门公布的商品住房销售均价、销售额与销售面积,在研究一个区域的经济、产业走势上的作用突出,对单一购房者,这种“均价”在判断房价走势、决定是否该买房等方面,没有太多参考价值。
哪些调查的“百分比”不可信?
样本容量小、抽样不科学,一些街边问卷与网上调查的结果不可偏听偏信
“89.3%的人坦言物价上涨影响生活”、“一半人认为房屋单位售价在5000元以下最能接受”……每天电视、报纸、网络都在刊登着各种调查机构的调查结果,这些耸动视听的“百分比”调查结果真的反映了现实情况吗?
张小姐曾经供职于北京一家小型的信息咨询公司。她接到的第一份工作就是问卷调查都市人群的牙齿保健行为。但令她不解的是,公司并没有采取严格的抽样方法,而是让员工和临时志愿者去城市商圈、地铁站等处,临时找人填写问卷。而且问卷中的一些问题,受访人可能不会真实回答。“比如您现在存在哪些口腔问题,我想不会有人主动选择口臭一项。而且上班时间逛商场的人群是否就能代表这个都市的基本面,我也很怀疑。”
金兼斌认为,统计数字误导最常见来自抽样问题。抽样调查首先要保证一定的样本容量。另一方面,样本能很好地代表总体,避免调查受到社会倾向的影响。“例如,恐怕很少有人愿意填写问卷承认自己歧视农民工,但实际言行显然是另一回事。”
不仅是街头问卷调查,很多所谓的网上民意调查的结果也值得商榷。例如今年8月,中国青年报社会调查中心的一项网络调查显示,83.2%的受访者确认现在社会谣言很多,其中34.4%的人表示“非常多”。大量媒体据此撰文“八成民众认为现在社会谣言很多”。实际上,该调查是仅对1714人进行的在线调查,而且参与者最可能是上述网站的常客以及曾经历过该话题的人群。媒体的结论显然有以偏概全之嫌。
网络调查是一种计算机辅助的信函访问方式。通过电子邮件和互联网页面,被调查者可以轻松而不受拘束地完成调查,提高了调查的便捷性。但网络调查不能实现人口全覆盖,且受到虚拟匿名等局限,真实性很难鉴别。
“目前很多网上调查,包括一些调查机构发布的调查,有时从抽样方案上看是一个非概率调查,样本对总体没有代表性。对于谁有资格参加调查不加设计和筛选,得到的样本不管多大,都属于方便样本,调查所得到的意见和看法,只能反映调查参加者这部分人群的意见和看法。”金兼斌说,“因此这样的调查结果是不可以推广应用到样本以外的人群的;但从对结果的解释和得出的结论上,这些调查又恰恰试图去作过分的推广或推论。”
如今,在日常社会生活中,特别是描述经济增长、宣传商品价值乃至吸引眼球时,“百分数”也常常被滥用,以掩盖样本容量过小的事实。比如,广告中常常出现“80%的测试人员”一致认可某种牙膏、某种咖啡的质量,而参加测试的人员可能只有5个人。再比如河南某媒体报道“九成家长愿孩子当班干部、近半孩子不愿当班干部”,这一调查结果被广为传播,但其实只调查了30个孩子及家长。
“百分数不仅被当作催人入眠的安眠药,还被用做使人激动不已的兴奋剂。正如一架望远镜,如果人们没有正确地使用,那么,它既可以把小东西变成大东西,也可以把大东西变成小东西。”德国学者瓦尔特·克莱默在《统计数据的真相》一书中这样表述,“滥用百分数往往只有一个目的:用百分数比例来隐藏基础数据。因此公众应尽可能关注基础数据,规避百分数的欺骗性。”
为什么统计数据会打架?
统计方法不同以及行政干预会导致数据打架,这提示统计制度及其方法改革的必要性
2007年4月,北京市国土资源和房屋管理局发布该市一手房的销售均价每平方米环比下降400元,几天后,当地统计部门公布新建商品住房售价环比上涨1.2%。
同一指标,为何统计数据差距如此之大?
主要还是统计方法不同。前者是以3月份备案的住房销售总额和销售面积相除,得出的平均交易价;而后者,考虑到大城市房屋有高中低档之分,地段差别较大,普通住宅价格相对低但购买者多,豪宅单价高但购买者少,因此对不同房价赋予了不同权重,按加权指数计算。
除了统计方法,行政干预也是造成数据打架的原因。以备受关注的GDP核算为例:目前,我国GDP核算采取分级独立核算体制,国家和地方分别核算GDP。为什么近5年每年各地公布的GDP汇总数据,都会高于全国呢?除了重复统计等因素外,也不排除某些地方GDP虚报。因为目前GDP核算还牵扯到政绩考核,因此存在地区GDP核算易受地方干预等弊端。
为避免数据打架,提高统计数据质量和公信力,我国统计制度方法改革势在必行。今年起,国家统计局开始推进统计改革,建立统一的基本单位名录、统一的一套表调查制度、统一的数据采集处理软件平台和统一的联网直报系统,最终将实现各级统计机构在线同步接收、审核和共享原始数据,确保数据的真实准确、完整及时。
“无论是调查研究机构还是媒体,从关键概念的测量、抽样的设计、样本量的要求、数据的采集,到数据的分析、结果的解读,都应该遵循基本的科学性原则。只有这样,调查结果才是可信、有效的;也只有通过扎实、科学的研究与解读,才能逐渐建立其社会公信力。”金兼斌说。