首页>>科研动态>>科研快讯

国际统计学会第58届大会纪要
2011-10-24  

全球统计研究的多元化应用与实践性发展

——国际统计学会第58届大会纪要 

吴翌琳 李伟 

  国际统计学会(International Statistical Institute, ISI)第58届大会于2011821-26日在爱尔兰首府都柏林召开。ISI成立于1885年,每两年召开一届的世界统计大会是国际统计学界最高水平的统计学术会议。来自120多个国家和地区的2300多名代表参加这次世界统计盛会,其中,来自中国大陆的作者共69人。

  大会共挑选了1746位作者的论文,这些论文构成了大会的273个专题。在20个平行分会场里,各国代表围绕273个专题展开了演讲和讨论。演讲的内容涵盖了统计的发展史、基础统计理论前沿、统计在社会经济各方面的应用、统计软件的应用、政府统计和官方统计的发展、统计教育普及等多个领域。组委会还在第三天特别设立了”水资源日”,旨在鼓励统计学家关注气候变化与环境统计和可持续发展的统计测度。本届大会论文论题范围广泛,不少研究成果代表了统计科学的最高水平和最新动态,本文将对其中比较新颖并且对中国统计发展有借鉴意义的专题进行介绍。

  一、统计学的历史与发展

  本届大会特别关注统计学的历史与发展主题,设立了四个分会场专门对此话题展开讨论,与会者怀念已故统计学家、学习当今著名统计学家,并展望统计学的新发展与挑战。

  以”对统计学的过去、现在和未来的思考”为题的分会场,邀请了三位世界著名统计学家从各自角度对统计学的演变与发展作了广泛而深入的讨论。

  Cox比例风险模型、Box-Cox变换等统计方法的提出者David Cox爵士(英国,University of Oxford)报告题目是”目前统计理论的挑战”。他指出,过去的100年统计方法和理论有了重大发展。这些发展是由于不断扩大的应用领域的挑战,测量、数据采集和分析以及它们之间平衡的技术快速演变引起的。从粒子和天体物理学到遗传学和公共事务的许多方面产生的非常大量的数据,使新的统计方法成为当前统计科学面临的重大挑战。

  著名的稳健统计学家Peter J. Huber(瑞士)的报告为”数据分析的理论与实践绪论”。作者从过去50年从事数据分析和统计中看到,一个实际数据分析家必须结合以下四个领域:战略思维、处理大量而不同类的数据集、为统计计算提供适当的语言支持、处理复杂的近似模型(approximate models)。因果模型、缺失数据分析系统理论和方法、EM算法等的提出者Donald B. Rubin(美国,Harvard University)的报告题目为”统计领域的演变”,作者回顾了统计学从其早年时到现在的演变,并着重讨论了贝叶斯(Bayesian)、因果关系(causality)、设计(design)和模拟(simulation)。

  二、基础统计的前沿进展

  基础统计方面,本届大会对数理统计的关注较多,专题涵盖了模型选择与变量筛选、聚类方法、贝叶斯统计、因果推断、社会网络等诸多领域,纵向数据作为统计模型的前沿,也得到深入的讨论。

  (一)数理统计的新挑战

  来自美国、西班牙、意大利等世界各地的统计学家,对数理统计理论及其应用的当前问题和最新发展作了广泛讨论,议题包括:数学类型(mathematical type)的新发展,如随机矩阵(random matrices)、自由概率(free probability)、细胞自动机(cellular automata)、Levy过程;组合与实验设计的发展;生物科学应用的新兴领域;计算中随机算法(randomized algorithms)使用的相关问题;组合或象征性(symbolic nature)的计算性发展;网络模型(Network models),机器学习(machine learning)等。

  模型选择与变量筛选方面,Rui Wang, Stephen W. Lagakos(美国,Harvard School of Public Health)的报告,提出了一种基于限制置换方法(Restricted Permutation Methods)的变量筛选方法,并提供了相应的理论论证和应用指导。Hannes Leeb(奥地利,University of Vienna)、Adityanand Guntuboyina(美国,Yale University)报告了”单变量正态均值压缩估计”。在线性回归的框架下,研究给定相应新解释变量和训练集的条件下新反应变量均值的估计。Yuhong Yang(美国,University of Minnesota)的”基于模型选择的高维回归自适应估计”构建了当q[0, 1]整个范围时能同时达到最小最大(minimax)收敛速度的基于模型选择的估计量,并讨论了如何基于参数化指数(parametricness index)区分q=0(严格稀疏)的情况。

  在贝叶斯方向,Surya T. Tokdar(美国,Duke University)的”高斯过程先验密度回归”探讨了高斯过程在条件密度的贝叶斯分析中用作先验分布的理论性质,将重标度的高斯过程模型(rescaled Gaussian process models)嵌入半参数密度回归模型(semi-parametric density regression models)以实现局部调节(local coordinate)。Subhashis Ghosal(美国,North Carolina State University)以”无限维后验分布的收敛性”为题,概述了十年来无限维后验分布收敛性的最显著发展,特别强调了后验分布不费力地选择正确模型和适应未知光滑度(level of smoothness)的能力。

  在因果推断领域,Judea Pearl, Elias Bareinboim(美国,University of California Los Angeles)的报告以”外部有效性和可传送性”为题,定义了”可传送性”(transportability)或”外部有效性”(external validity)。基于在感兴趣的总体间表达异同的”选择图”(selection diagrams),作者提出了决定目标总体的因果关系能否从不同总体的实验发现进行推断的程序。如果可以,该程序将给出需做的实验和观测研究。Miguel Hernan(美国,Harvard School of Public Health)的报告”因果推断的G-公式”讨论了处理复杂纵向数据因果推断的参数G-公式(parametric g-formula)的最新改进、软件发展和实际应用。

  (二)纵向数据的复杂分析

  纵向数据是当今统计学的一个前沿问题,其主要发展时间不超过50年,最早人们采用anovamanova来分析,现在的主要处理方法是Mixed Effect Model,尤其是linear Mixed Effect Model。各种模型的敏感性分析也成为当前统计模型的热点。本届大会上以”纵向数据的复杂分析”为题特设两个分会场,共有16篇关于纵向数据的报告。

  由Marcel de Toledo Vieira(巴西,Universidade Federal de Juiz de Fora)组织的纵向数据会场,分别从测量误差、结构方程分析、复杂抽样等领域对纵向数据分析新模型和新方法进行了探讨。Maria Eugénia Ferrão(葡萄牙,University of Beira Interior)的报告题目为”纵向多水平模型中测量误差和误分类的调整”。Peter W.F. Smith(英国,University of Southampton)、Maria de Fátima Salgueiro(葡萄牙,Lisbon University Institute)的报告为”纵向数据结构方程模型的显变量联系结构:偏相关的视角”,作者提出了三种包含和不包含相关的测量误差的显变量偏相关(manifest partial correlations)模型:三次观测单指标测量模型、两次观测双指标测量模型、两次观测三指标模型,并利用因子偏相关(factor partial correlations)对这些模型参数化,以设定潜变量和显变量间的相关性。Gad Nathan(以色列,Hebrew University)的研究”复杂抽样下纵向调查数据分析综述”,提出了在有信息抽样(informative sampling)下纵向调查总体分布推断的一般方法。修正的多水平模型可用来分析复杂调查设计数据,特别是纵向调查中无回答(non-response)的处理效应。

  三、应用统计的多元实践

  作为应用学科,统计学研究的发展从来不是”单打独斗”,统计与其他实用学科结合而形成交叉或边缘学科,如生物统计、医药统计、工业统计、金融统计等,都是当前发展很快的热点,统计在经济社会领域方方面面的应用,正体现了统计学强大的分析力。本次大会80%以上的专题涉及到现代统计学在各种研究中的应用。

  (一)SNA的新变化

  目前SNA2008已经发布,本次大会有一些学者便基于SNA2008中账户的变化尤其是金融账户界定范围的变化进行了专项研究。葡萄牙中央银行的Lima, FilipaFonte Santa, Sílvia着重分析了SNA2008中金融部门界定范围的两个变化:控股公司的纳入和新的子部门划分结构。此外对于其他的部门,两位学者也探讨了如何利用额外的数据源,如证券综合统计系统和中央信贷资料库来帮助界定住户部门以及为住户服务的非盈利部门。奥地利国家银行的Michael Andreasch也对比了SNA93/ESA95SNA2008/ESA2010中金融部门的界定范围,认为两者之间主要的区别在于将”除了保险公司和养老基金之外的金融机构”分解为三个子部门,基于新的子部门划分结构,需要正确的界定控股公司、总部和金融租赁公司,并进一步分析了奥地利目前存在的数据源以及为了适应SNA2008的变化所需要做的修改。

  (二)金融风险的统计度量

  关于金融财务风险的度量,学者Rodrigo Cifuentes, Carlos Madeira, Felipe Martínez, Rubén Poblete采用修正的偿债比率(MDSR),以及包含MDSR、失业率、性别、年龄、婚姻状况等因素的Probit模型来测度一个家庭的财务状况。他们将该指标及模型应用于一份实际调查数据,结果表明家庭中主要成员的性别、年龄、婚姻状况会降低该家庭的财务风险,而MDSR、失业率与该家庭的财务风险成正比。

  关于金融环境与投资者行为之间的关系,学者Nombulelo Gumata Nonhlanhla Nhlapo对南非的非银行金融机构的投资行为做了分析,他们认为南非金融部门的成长主要是靠非银行金融机构的拉动,尤其是保险、养老金和公积金。鉴于目前南非的投资法规、资产负债管理政策等,各机构的资产配置主要是股票和定息债券,在授信或贷款中的作用尽管已经有所增长,但还是微乎其微的。学者Nunes, Lígia则是对葡萄牙在2008年全球金融危机以来的金融情况与投资者行为做了分析,从2007年年初金融市场出现衰退后,葡萄牙的投资者逐渐转向增加存款,股票和共同基金对投资者的吸引力降低;随着PSI-20指数的变化,股票和共同基金的投资在2009年有所回升,但是2010年下半年又有所回落。

  (三)CPI编制方法的改进

  CPI的度量方法在国际统计学界受到广泛的重视,本次会议专门设立一个讨论CPI度量与调整方法的专题,与会专家对CPI中的金融中介服务,CPI中的季节调整问题,自有房屋在CPI计算中的处理进行了介绍。

  来自澳大利亚国家统计局的Jason Russo介绍了他与Derick Cullen合作的关于金融中介服务核算的研究。在金融危机的影响下,澳大利亚的CPI以及国民经济核算对金融中介服务的统计出现了变化,引起了澳大利亚国内的关注。而欧洲中央银行的Martin Eiglsperger则通过对CPI数据进行调整提出了调和的CPI指数HICP,该研究成功的将总的调和CPI指数分解到未加工食品、加工食品、工业产品、服务业和能源等几个大类,用于分析和预测欧盟国家的通货膨胀。

  爱尔兰国家统计局的Paul J. Crowley介绍了价格指数编制中的一个难点,住房消费价格指数的编制方法和改进。作者指出所有者自住房屋消费物价指数的编制相对复杂,并简要地介绍了目前各种理论方法。欧盟正在制定统一的自住房屋的价格指数编制,旨在在欧盟层面建立一个共同的房屋价格指数的方法框架,并获得了一系列的自住房屋指数。这些新的指数既符合国家数据需要,又保持与欧盟的HPI和自住房屋指数发展的一致性。

  (四)市场调查模型探讨

  在市场调查方面,学者José G. DiasOmar Paccagnella等人的研究都与实际操作密切相关。组合分析与离散选择模型长期以来都是测度消费者偏好的常用模型,在过去40年间,组合分析在新产品开发、竞争分析、价格研究等方面的应用取得了巨大成功。而潜在类别模型则考虑到了数据的多层次结构,允许对回答的不同测度之间存在异方差。因此José G. Dias在多层潜在类别模型的框架下,对组合分析的不同参数设定情况进行讨论,从而使模型在更细分领域中的使用更有效。市场调查中常常面临的另一个问题是来自不同背景的不同受访者常常对同一问题有着不同理解,这一不同被称为DIF,在跨国与跨群体比较中尤为明显。通过设定不同的阈值,CHOPIT(混合分层序贯Probit)模型可以将受访者自报的排序问题中的个人差异考虑在内,被看作是从统计上解决这一问题的途径之一。

  (五)时间分配与幸福感

  时间变化中的生活质量与日常生活专题从时间角度研究了幸福感测度、幸福与收入以及社会接触与幸福感的关系等一系列问题,为我国开展同类研究提供了全新视角。

  牛津大学时间利用研究中心的Kimberly Fisher认为人们的幸福感在一定程度可以通过日常生活模式反映,但是传统收集单个研究对象生活模式的定性研究方法并不适合大量研究对象。然而,通过记录一天活动模式的时间日记账为研究大量研究对象生活模式的提供了可行的方法。时间日记账为评估幸福感提供了两个有利条件。第一个有利条件是便于监测与生活质量相关的三种维度,包括健康活动、能量与资源的利用和休闲质量,监测这三个维度有利于比较区域间幸福感以及追踪幸福感动态变化趋势。第二个有利条件是通过全民幸福感的变化评估幸福感,时间日记账在记录活动数据的同时也收集了情绪数据,就可以揭示出什么活动令人愉快、什么活动令人不愉快。

  滑铁卢大学娱乐与休闲研究中心的Jiri Zuzanek利用加拿大统计局1998年、2005年时间利用数据以及滑铁卢大学在同一时期的抽样数据,分析经济增长、家庭收入和主观幸福感直接的关系。他认为传统测量幸福感的方法在研究收入与幸福感关系存在不足,主要体现为收入越高则可观测的幸福感(包括生活、工作以及财务情况的满意度)越高,但是收入和可观测幸福感之间的关系并非总是保持一致。由于不同收入群体对时间满意之间的关系比较稳定,于是他提出时间利用作为测度幸福感的指标,就时间利用满意度而言,高收入者要面对更大的时间压力,他们对工作和家庭时间平衡利用的不满意程度高于低收入群体。

  四、官方统计的变革和发展

  对于官方统计的研究和探讨一直是国际统计大会最重要和活跃的内容之一。本届大会关于官方统计的主要论题可概括为如下四个方面:变化环境中官方统计面临的挑战和变化;官方统计数据的质量评价和控制;官方统计的生产架构和新技术的应用;行政记录在官方统计中的应用。

  (一)变化环境中官方统计面临的挑战及应对

  随着经济社会的发展,技术水平、社会结构、经济发展等众多环境因素正在影响着官方统计和统计工作者,可以预见,未来官方统计与环境因素的关系将越来越紧密。英国统计局Richard Laux将影响官方统计的环境因素概括为如下几个主要方面:1.对官方统计和统计分析的需求不断增加;2.官方统计的数据来源正从传统的抽样调查向行政记录数据库转换;3.来自外部统计数据生产者的竞争,如基于互联网的非官方统计机构。为了应对新的挑战,欧洲委员会对官方统计进行了一系列的现代化改革,旨在提高数据收集、存储、匹配和发布的效率,更好地利用行政记录。韩国则通过建立”基于统计的政策管理系统”等制度,加强统计与政府决策的联系,实现由”生产者导向”向”用户导向”的转变。中国国家统计局总统计师鲜祖德作了题为《2000年以来中国政府统计制度方法的变化及主要结果》的专题演讲,结合国民经济发展的主要数据指标介绍了2000年以来中国政府统计在统计制度和方法、统计标准及统计手段方面的主要变化与取得的进展。

  (二)官方统计数据的质量评价和控制

  数据质量是官方统计的生命。《欧洲统计操作规范》规定了保证数据质量的三个主要方面:制度环境、统计生产过程和统计结果输出。瑞典统计局在这些方面都取得了一定进展,其中重点是对统计生产过程的控制。他们基于通用统计过程模型开发的过程支持系统对每个子过程的操作方法进行了详细描述,为统计过程的质量保证奠定了基础。英国统计局制度方法处Ceri Regan等界定了统计质量、质量管理、质量保证等与质量相关的概念,他们认为统计质量是”统计产品在相关性、准确性、及时性、可获得性、可比性、一致性等方面与统计目的的符合程度”。过去5年中,英国统计局开发了”结果质量评价”、过程质量评价”等数据质量评价体系。2009年公布了《英国官方统计操作规范》(The UK Code of Practice for Official Statistics),对统计数据质量提出明确要求。2011年英国统计局提出了新的质量管理战略,要在2015年前实现三个质量管理目标,并在组织内部形成”不断改进质量”的统计文化。

  (三)官方统计的生产架构和新技术的应用

  如何应用现代化的管理模式和新技术降低成本、提高效率,同时保证数据质量,是各国官方统计的目标和改革方向。澳大利亚统计局正在计划一项关于统计方法基本架构的重大变革,那就是使整个统计生产过程”产业化”,即寻求适用于不同情况的通用解决方案、可以自动化、可重复、大规模并行运行的方法和工具、能够处理复杂数据结果和产品要求的过程控制方法以及支持上述功能的知识和信息管理模式。同时,互联网技术在统计调查中的应用越来越普遍。美国普查局处于使用电子方式(包括互联网)收集和处理企业数据的前沿。网页调查在企业调查和住户和人口调查中均有应用。他们认为,未来要进一步扩大网页数据采集系统的使用,需要解决以下问题:1.网络安全和隐私保护;2.采用适当的交流策略,提高应答率,尤其是住户调查的网页应答率;3.通过收集和分析网页并行数据,研究应答行为,发现测量误差的潜在来源,改进数据收集工具设计。

  ()行政记录在官方统计中的应用

  行政记录用于官方统计正在越来越多的国家得到推广,例如,加拿大统计局的普查中用到了生命、税收、移民等行政记录,2006年普查长表和2011年住户调查中直接使用了收入税数据。同时,行政记录数据的质量也得到了更多关注。荷兰统计局研究了行政记录有效性的度量问题,并提出了估计行政数据有效性的方法;新西兰统计局则介绍了他们在处理行政记录使用时的法律和政策问题时的经验和思考;英国统计局开发了使用行政数据的商业统计数据质量评估指标体系。匈牙利统计局也对基于登记数据的普查提出了质量评估框架。

  五、统计软件的广泛应用

  本届大会对统计软件应用给予充分重视,尤其是面向对象的编程统计软件R,通过这一软件,可以和全球一流的统计计算方面的专家合作讨论,它是全世界统计学家思维的最大集中。R软件已经有上千个由世界各国统计学专家提供的R软件包,用户可以免费使用。因此,本届大会专设多个分会场,从基础层面讨论了R软件的应用与发展,另有多篇与R软件相关的报告出现在其他各种主题的分会场,例如可视化、统计方法、生物统计、社会经济统计等,下面将主要介绍R软件及其在可视化领域的应用。

  (一)R软件在多个统计领域的应用

  “入门级的R软件”专题,由R核心小组(R Core Team)成员Peter Dalgaard(丹麦,Copenhagen Business School)组织,分别介绍R的图形用户界面、在应用计量经济学中与统计教育中的应用。

  统计方法方面,Daniel Simpson, Finn Lindgren, Håvard Rue(挪威,Norwegian University of S&T)报告了”快速近似推断与INLA:过去、现在与未来”,介绍了INLA近似和他们开发的Rr-inla。目前潜高斯模型(Latent Gaussian models)非常流行且灵活,但这些模型的贝叶斯推断却棘手且费时。最近集成嵌套Laplace逼近(Integrated Nested Laplace Approximation, INLA)被提出用作确定性快速近似推断(deterministic fast approximate inference)。Manuel Wiesenfarth, Tatyana Krivobokova(德国,University of Goettingen)、Stefan Sperlich(瑞士,University of Geneva)的报告”基于Volume-of-Tube的惩罚样条估计量的检验”介绍了RAdaptFitOS,其利用空间自适应惩罚样条(spatially adaptive penalized splines)拟合半参数回归模型和计算同时置信带(simultaneous confidence bands)。Sven Knoth(德国,Helmut Schmidt University)的报告”计算ARL和其他控制图性能的测度:数值计算和软件”介绍了一个统计过程控制(Statistical Process Control)的Rspc

  生物统计方面,Michael G. Schimek(奥地利,Medical University of Graz)的”Top-k Ranked Lists的探索性非参数和图形程序”报告了用于基于秩的基因组数据集成(Rank-based Genomic Data Integration)的RTopKListsMiguel A. Fernández, Sandra Barragán, Cristina Rueda(西班牙,Universidad de Valladolid)、Shyamal D. Peddada(美国,National Institute of Environmental Health Sciences)的”利用次序限制的统计程序从细胞周期记录分析循环数据”介绍了用于循环数据等渗推断(Isotonic Inference in Circular data)的Risocir

  社会经济统计方面,Matthias Templ, Andreas Alfons, Peter Filzmoser(奥地利,Vienna University of Technology)的报告”社会凝聚力和贫困指标的稳健半参数估计”则介绍了用于社会排斥和贫困指标的估计的Rlaeken

  (二)统计数据的可视化

  统计数据若不加以描绘整理,只会枯燥无味,让读者索然无趣,因此,统计数据的图像化和可视化,成为统计研究的一个重要的专题,本次大会专门设立探讨应用软件实现数据可视化的专题。

  在可视化方面,Deborah Nolan(美国,University of California, Berkeley)、Jamis Perrett(美国,Texas A&M)、Duncan Temple Lang(美国,University of California, Davis)报告了”统计课程中的可视化”。Wayne Oldford, Adrian Waddell(加拿大,University of Waterloo)分别合作报告了”利过探索低维空间的高维数据可视化聚类”和”RnavGraph:一个探索高维数据空间的可视化工具”,他们开发的RRnavGraph基于一种新的图形理论结构,将低维空间表示成图的节点,将空间转换表示成图的边,沿着这些图行走将揭示有意义的结构。如果节点是一维的,行走对应平行坐标图(parallel coordinate plot);如果节点是二维的且边仅在共有一个变量的2维空间之间存在,行走能动态地表示成散点图序列(series of scatterplots),通过3d刚性转换(3d rigid transformation)表示转变。利用可视化工具RRnavGraph,可以展示这些图如何用来动态探索高维数据以可视化地揭示聚类结构。尽管这些图的规模以维数的平方增长,但也存在许多方法仅构建每张图的更有趣的区域。

  六、统计教育的模式探索

  本届大会对统计教育予以较大关注,其中由国际统计教育协会(IASE)组织的分会场多达九个,来自世界各国的四十余位统计学者主要从教育统计研究、统计教学方法、学生对统计学习的态度等方面进行了深入的探讨。

  (一)教育统计研究

  作为各国发展的重要源动力,教育问题广受关注,并成为一些统计学者的研究重心,这对推动国家的教育改革乃至整体发展都起着至关重要的作用。

  “人口普查微观数据财富指数在预测发展中国家教育成果中的应用”(Rodrigo Lovaton Davila,美国明尼苏达大学应用经济学系)利用全球最大的人口普查数据库IPUMS的住户微观数据,基于住房特征及资产所有权等非货币指标计算财富指数,并通过计算与被广泛认可的人口健康调查(DHS)资产指数的相关系数、逐步剔除指标后的Cronbachs alpha系数验证指标体系具有较高的信度。最终作者利用巴西、南非、秘鲁、塞内加尔、哥伦比亚五国的数据验证财富指数对教育成果的预测能力,作者以入学率衡量教育成果,一方面依据指数值的高低将样本五等分,发现各组样本的教育成果差异较大,一方面建立财富指数和其他相关变量对教育成果的probit回归,最终验证了财富指数对教育成果的显著的正向影响。

  (二)统计教学方法

  统计学在很多专业中都占据着举足轻重的地位,无论感兴趣与否,大多数学生都必须接受统计学的训练,如何使学生喜欢上这门”枯燥”甚至有些”令人头疼”的学科,对统计学的推广起着重要的推动作用。本届大会专门设立多个分会场对此进行了深入的探讨。

“一个以研究为基础的大学统计课程”(Jiyoon Park,美国明尼苏达大学统计教育系)重点介绍了作者及其团队开发的CATALST实验课程,该课程利用随机及重抽样方法的思想向学生讲授统计推断,使学生参与模型启发活动(MEA),通过描述、解释、建模、检验、修正解决现实问题,开发其统计思维。

  “用畅销书替代教科书:将畅销书融入大学统计课程之中”(Patrick E. Murphy,爱尔兰都柏林大学数学科学学院)、”畅销书及视频剪辑:两种吸引学生学习统计的方式”(Damien G. Raftery,爱尔兰卡洛技术研究院商业与人文系)及”商业统计教室中的畅销书”(Michelle Sisto,摩纳哥国际大学)等均将寓教于乐的思想引入统计教学中,大大激发了原本由于专业需求而被动学习统计的学生的学习热情。

  “统计课程中的可视化”(Deborah Nolan,美国加州大学伯克利分校统计系)、”在R中教授统计模型”(John Hinde,爱尔兰高威大学统计系)将热门统计软件R充分应用到统计教学中。John针对目前统计教学中存在的模型示例与多阶段真实研究割裂的问题,提出将真实案例研究引入课堂,利用丰富的R软件包激发学生的研究兴趣。Deborah的统计课堂中更加注重鼓励学生利用图表评价、解析数据结构,诸如Many Eyes的在线数据可视化工具为学生提供了大量的图表及相关数据,Google地图有助于展现时间-空间数据,可缩放矢量图形(SVG)则可以帮助学生创作动态图形。

  七、水资源发展的统计方法应用

  水资源核算与统计分析是本次会议中的一个特别专题,大会专门用了一天的时间来组织水资源的相关专题讨论,许多世界各国的专家、学者就水资源专题在本次大会上做了发言。

  (一)水资源环境核算

  澳大利亚统计局的Peter Harper介绍了水资源综合环境经济核算(SEEAW)的目的和意义,讨论了SEEAW的开发情况,并在环境经济核算框架内介绍了SEEAW的结构和内容。讨论了如何将SEEAW应用于制定政策,以及如何处理各国在SEEAW实施过程中遇到的问题。

  加拿大统计局环境核算与统计司François Soulard的论文介绍了加拿大的新水供应和需求统计与核算,加拿大统计局环境核算与统计司在水统计领域的研究为加拿大整套水账户的编制起到了促进作用。但是加拿大水账户的编制仍然面临许多问题,例如环境调查通常以实物单位来测度各项指标,这并不适合于水质核算。

  中国水利水电科学研究院水资源所的甘泓介绍了中国水资源核算的情况,中国水利部在国家统计局和联合国统计司的协助下于200611月启动了中国水资源核算项目,目的是基于国际经验和标准(尤其是SEEAW)并结合中国的实际情况来建立水资源核算框架,为水资源管理提供支持。

  中国人民大学统计学院的高敏雪和高亚春从方法论的角度探索了水资源核算的路径和方法,根据SEEAW以及北京市水资源数据的可获得性,编制了北京市2007年水使用账户,并利用水资源投入产出分析模型对北京市水资源利用过程中的投入产出关系进行了定量分析,明确了水资源管理过程中应该重点关注的部门,从而为北京市的水资源管理提供参考。

  (二)水资源保护和管理

  荷兰统计局的Kees BaasCor Graveland的论文回顾了该国水资源保护相关的问题,主要包括:防洪保护问题,处理水资源过剩和水短缺的水资源管理问题,水污染和水质问题。考虑到这几个问题,荷兰水统计和水账户主要涵盖水短缺(包括水使用)和水污染问题,也包括与经济统计配套的防洪和水资源过剩,水质核算是官方统计中涉及最少的主题。

  中国人民大学环境学院的马中和昌敦虎从公共财政的视角对中国城市居民用水的定价问题进行了研究和探讨,认为中国城市居民用水目前实行的是非全成本定价,公共财政应该承担一部分城市居民用水成本,其原因有三:(1)要满足公众用水的基本需求;(2)城市用水仍然是自然垄断的;(3)当公众纳税时,他们有权获悉家庭用水情况。作者为了实现节水和控制污染的目标,应该根据当地的实际情况制定水价,而不是统一定价。

  中国人民大学的赵彦云和北京物资学院的郭茜利用计量经济模型分析了经济和人口对水资源利用和保护的影响。中国的水资源分布很不均衡,人民生活、农业和工业都需要大量的水资源。经济的快速发展导致水资源系统的负荷越来越重,水污染事件频繁发生。工业和农业利用了85%的水,并且这种情况将持续很长的时间。工业废水是主要的水污染源,威胁着水资源安全。因此,需要增加污水处理基础设施的投资来保护水资源。

  (三)水资源可持续发展与创新

  水资源的保护和可持续发展,不是一个行业能够完成的,需要整个经济体的支持,而技术创新的发展,能够为水资源的保护和科学应用提供技术和管理支持,保障各种资源的可持续发展,因此,来自中国人民大学的研究团队组织了”中国的水资源供求发展:建立一个创新型国家”专题,将水资源的合理利用与保护与技术创新结合起来,分别从国家层面、产业层面和区域层面对这个问题进行多角度探讨。

  中国人民大学的吴翌琳和魏瑶根据压力-状态-响应模式构建了水资源发展指数,将社会因素和经济指标与自然资源指标结合起来研究人类活动是如何影响水资源的。笔者基于15年的国际比较数据,采用结构方程模型,探索了水资源发展与国家创新能力的关系。

中国人民大学的赵彦云和陈琳根据投入产出模型分析了中国水资源和经济因素之间的关系,通过研究发现了各经济部门对水资源消费的差异,包括直接消费和间接消费。根据可比价投入产出表,利用结构分解技术发现每年国内需求、出口和技术进步对水的生产与供应部门的影响是不同的。

  中国人民大学的秦旭和王杰彪利用DEA模型分析了中国31个省市的用水效率,得出的基本结论是用水效率的分布于创新有一定程度的相关性。利用中国31个省市的创新指数数据,根据面板模型分析了区域创新能力对水使用的影响,从而为中国建设创新型国家过程中的水资源供应和使用发展提供决策参考。

  八、人口老龄化和官方统计

  国际官方统计大会作为作为本届大会的卫星会议同期举行。大会主题是”人口老龄化和官方统计”,与会学者围绕发达国家的人口老龄化、发展中国家的人口老龄化、人口老龄化对官方统计的调整、人口老龄化的经济和社会政策影响等专题展开讨论。

  (一)发达国家的人口老龄化

  2008年,世界上老龄人口(65岁以上)比重最高的前25个国家均为发达国家。美国普查局Wan He博士指出了人口老龄化的5个发展趋势:(1)到202065岁以上人口数将超过5岁以下人口数。(2)发展中国家老龄化速度将超过大多数发达国家。(3)老龄人口的平均年龄也在增加。(4)人口老龄化伴随着人口总数下降。(5)在欧洲国家越来越多的老年人(尤其是妇女)将独自生活。牛津大学人口研究中心的David Coleman教授认为人口转型带来的较低的生育率和死亡率是人口老龄化的主要原因,世界人口将在几代之内达到新的稳定的年龄结构。

  (二)发展中国家的人口老龄化

  牛津大学的George W. Leeson博士以拉美和加勒比海国家为例分析了发展中国家的人口老龄化问题。他指出,随着生育率下降,预期寿命增加,老人们度过了更长更健康的晚年。技术改变了就业模式,社会道德观念影响着家庭形式、亲属关系和代际关系,医疗水平的提高演延长了健康寿命,老龄的含义正在发生改变。他提出应对老龄化社会的几个策略:1)使金融体系适应预期寿命增加的变化;2)从急救治疗逐渐转向公共健康和长期保健;3)提供一生的学习机会;4)维持家庭和社区关系;5)使医疗保健、养老金等的转移更加便利;6)处理与环境的相互影响。

  (三)人口老龄化对官方统计的挑战

  英国国家统计局Guy Goodwin先生把人口老龄化对官方统计的挑战概况为以下几个方面:1)发现和满足用户需求。老龄化问题是涉及到劳动力市场、养老金、保健、住房、社区、财政等多个部门的综合性问题,因此要满足老龄化问题对统计数据的需求,统计工作也比较分散。2)数据来源在发生变化。老龄化统计数据来源包括:普查、住户调查、行政记录和追踪调查等,而且正在发生变化。3)测度和分析的挑战。老龄人口并不是一个同质性的群体,而是在年龄、性别、婚姻状况、健康、宗教文化、财富和收入、教育程度生活安排等方面具有多样性的群体,因此在数据收集、测度和报告时应加以区分。

  (四)人口老龄化的经济和社会政策影响

  哈佛大学David Canning教授从国际视角分析了老龄化社会的经济影响。他认为当今的老龄化是健康的、疾病减少的老龄化,因此实际影响总体上是有利的;老龄化带来的大多数经济问题是由于相关制度安排(如转移支付体系)不能适应老龄化的需求,需要采取措施对改革相关体制。曼彻斯特大学经济学教授James Banks认为老龄人口本身并不是负担,降低经济上的抚养比是关键,未来需要更加系统的方法来处理相关数据。

  九、体会与展望

  整个大会在热烈讨论与积极交流的氛围中进行,充分而友好的交流,充分体现了全球统计人坦诚、合作、进取的学术态度。对中国统计事业整体的发展,也有以下几个重要启示:

  1.现代技术在统计工作中的应用加速。

  随着信息技术的迅猛发展和实用化、产业化进程的不断加快,人们需要更加精准地获取信息,更加精细地观测数据变化,更加高效地存贮、分析、处理和表达海量的统计数据。以计算机辅助调查技术、数据挖掘技术、数据库技术、空间信息技术(遥感(RS)、地理信息系统(GIS)和全球定位系统(GPS))为代表的现代技术在统计中的应用不断扩大,有助于变革统计调查模式,再造统计调查流程,完善统计管理机制,有效提高统计能力、数据质量和政府统计公信力。

  2.统计的多元化应用值得推广。

  随着社会和科学技术的蓬勃发展,统计学与其他学科的相互渗透与影响更加广泛深入,并应用于各个领域,从本届大会的议程设计可以看到,统计的多元化应用让这一科学呈现出”百花齐放,百家争鸣”的局面。而我国统计应用的程度相对集中于学术界在经济领域方面的研究,而其他行业对这一技术的应用,较多的只停留在描述层面,还未能对本行业的统计数据的搜集整理和进一步的应用分析进行深入的探讨。统计应用的多元化与平民化成为中国统计发展的新目标。

  3.统计教育普及势在必行。

  本届大会还专门组织了一个青年统计学家互相见面和讨论的机会,旨在促进各国年轻统计学者的交流。而中国高校统计教育的普及程度与外国高校相比还远远不足,统计课程的开设,不应该只局限于财经类院校,而应该全面普及。而且,应该向外国的学校学习更为生动有趣吸引学生的统计教学模式,让大家感受到这是一门生动而具有实践意义和挑战性的学科,而非枯燥的数据堆积。

  总体而言,国际统计学会第58届大会充分展现了全球统计研究的多元化应用与实践性发展,为统计学者提供了良好的交流平台,更为中国统计事业的发展提供了宝贵的经验。



欢迎来到中国统计学会 中国统计科学研究网!
版权所有:中国统计学会 国家统计局统计科学研究所 不得转载
通信地址:北京市西城区月坛南街75号 邮政编码:100826 电子邮箱:yjsinfo@stats.gov.cn