中华预防医学杂志    2014年06期 多水平模型在土壤镉污染与人群尿镉水平关系研究中的应用    PDF     文章点击量:3339    
中华预防医学杂志2014年06期
中华医学会主办。
0

文章信息

张永杰 王建生 马林茂
ZhangYongjie,WangJiansheng,MaLinmao
多水平模型在土壤镉污染与人群尿镉水平关系研究中的应用
Application of multi-level model in study of relationship between soil cadmium contamination and people′s urinary cadmium level
中华预防医学杂志, 2014,48(6)
http://dx.doi.org/10.3760/cma.j.issn.0253-9624.2014.06.017
引用本文:

文章历史

投稿日期: 2013-09-13
上一篇:四种代谢综合征诊断标准在浙江省城市人群中应用情况的比较
下一篇:信号传导与转录激活因子3基因多态性与肝细胞癌的关系
多水平模型在土壤镉污染与人群尿镉水平关系研究中的应用
张永杰 王建生 马林茂     
张永杰 100730 北京协和医学院公共卫生学院
王建生 环境保护部环境与经济政策研究中心环境与健康数据中心
马林茂 中国疾病预防控制中心信息中心
摘要: 目的  基于层次结构数据的特点,运用多水平模型分析中部某县人群尿镉水平可能的影响因素,探讨多水平模型实际应用中处理层次结构数据的优势。方法  2013年5月,以整群抽样的方法在中部某县12个行政村抽取年龄≥20岁居民1 460名,进行尿镉水平可能影响因素调查和尿镉水平检测,并对调查区农田土壤特征污染物镉含量进行测定。完成调查并符合纳入标准的对象共计1 410名,调查区农田土壤检测样品共计318份。根据数据特点,将个体看作水平1单位,调查村看作水平2单位,运用SAS 9.3软件中处理层次结构数据的MIXED过程对数据进行多水平分析。在不考虑数据层次结构的情况下,运用SAS 9.3软件拟合一般线性模型,比较多水平模型及一般线性模型的拟合效果。结果  本研究最终纳入1 410名研究对象,年龄(55.2±11.1)岁,其中男性645名(45.74%),女性765名(54.26%)。家庭人均每年食用大米量(100.9±40.3)kg。有从事采选矿工作经历的占18.65%(262/1 410)。尿镉水平为(9.39±2.16)μg/g肌酐。土壤镉普遍超标。一般线性模型对数据拟合结果显示,除了是否从事采选矿工作差异无统计学意义(χ2=1.05,P=0.305)以外,村土壤镉水平、年龄、食用自产大米量、性别差异均有统计学意义(χ2分别为401.39、34.9、4.16、86.15,P值分别为<0.01、<0.01、0.041、<0.01)。空模型拟合结果显示本研究ICC=0.435 5,尿镉在村水平上存在聚集性。多水平模型全模型分析结果显示解释变量村土壤镉水平、年龄、食用自产大米量、性别差异有统计学意义(Wald χ2值分别为2.55、6.34、2.37、10.32,P值分别为0.029、<0.01、0.018、<0.01),是否从事采选矿工作差异无统计学意义(χ2=0.78,P=0.438)。用于进行模型比较的拟合优度指标,多水平模型拟合结果均小于一般线性模型。水平2解释变量村土壤镉水平的回归系数为0.84,可解释的变异约占总变异的35.26%。结论  多水平模型分析层次结构数据较一般线性模型更加合理;村土壤镉水平对人群尿镉水平影响较大。
关键词 :模型,统计学;镉;土壤
Application of multi-level model in study of relationship between soil cadmium contamination and people′s urinary cadmium level
ZhangYongjie,WangJiansheng,MaLinmao     
Department of Public Health, Peking Union Medical College, Beijing 100730, China
Corresponding author: Wang Jiansheng, Email: wangjiansheng@vip.sina.com
Abstract:Objective  Based on the characteristics of hierarchical data, a multilevel model was used to analysis possible influencing factors of urinary cadmium levels in one county population, and to discuss the advantages of multilevel model for processing hierarchical data in practical problems.Methods  In May 2013, 1 460 participants aged 20 and above in 12 administrative villages in one county in central China were recruited by cluster sampling. Urinary cadmium level and its possible influencing factors were investigated, and cadmium level in farmland soil of survey area was also tested. A total of 1 410 participants completed the survey and met the inclusion criterion. 318 farmland samples in survey area were detected. According to the data, individuals were set as the level one unit, and the village was set as level two unit. the data were analyzed by MIXED procedure for hierarchical data of SAS 9.3 software. In the case of not considering the hierarchy of data, the general linear model was fitted by SAS 9.3 software, and the fitting results of the two models were compared.Results  A total of 1 410 participants were included finally, the age was (55.2±11.1) years. 645 (45.74%) were males and 765 (54.26%) were females. The amount of household per capita consumption of rice was (100.9±40.3) kg/y. All 18.65% (262/1 410) of the participants had mining and mineral separation work experience. The urinary cadmium level was (9.39±2.16) μg/g Cr. Most of the soil cadmium levels in villages were greater than tolerance value. The fitting results of general linear model suggested that whether doing mining and mineral separation work does not have significant difference (χ2=1.05, P=0.305). There was significant difference in the village soil cadmium levels, age, the amount of household per capita consumption of rice, and gender (χ2=401.39, 34.9, 4.16 and 86.15, respectively, P<0.01, <0.01, 0.041, <0.01, respectively). The fitting result of empty model showed the ICC was 0.435 5, the urinary cadmium had clustering at village level. The results of multilevel model showed that the explanatory variables of the village soil cadmium levels, age, the amount of household per capita consumption of rice and gender had significant difference (Wald χ2 values 2.55, 6.34, 2.37 and 10.32, respectively, P=0.029, <0.01, =0.018 and <0.01), while whether doing mining and mineral separation work had no significant difference (χ2=0.78, P=0.438). To the fitting optimization index using for the comparison of models, the results of multilevel model were less than that of general linear model. The regression coefficient of level-2 explanatory variable (the village soil cadmium levels) was 0.84, which could explain the 35.26% of the total variance.Conclusion  Multilevel model could analyze hierarchical data more reasonably than general linear model. Urinary cadmium levels is highly influenced by the village soil cadmium levels.
Key words :Models, statistical;Cadmium;Soil
全文

环境健康数据往往具有反应变量在个体间不独立,存在地理距离内、某行政区划或特定空间范围内聚集性的特点。常用的一般线性模型的应用条件是要求个体之间相互独立,因此在处理层次结构数据时往往不能得到科学合理的结论。多水平模型(multilevel statistical model)是目前处理具有层次结构特点数据的重要方法,该模型在社会学领域应用较多,在环境健康领域的应用尚较少[1]。人体对镉主要是通过消化道途径暴露[2],肾脏是镉的主要蓄积部位和靶器官,慢性严重镉中毒会引起骨骼损害,主要表现为肾小管重吸收功能紊乱和骨质疏松,引起"痛痛病"[3]。进入体内的镉主要通过肾脏经尿液排出体外,排出速度很慢,不同器官的半衰期不同,约为10~30年[4]。笔者以我国中部某县环境重金属镉污染导致健康损害流行病学调查数据作为基础进行横断面研究,采用多水平模型来分析影响人体尿镉水平的主要因素,为科学评估环境镉污染对人群健康造成的危害提供依据。

对象与方法  

1.研究对象:  于2012年5月用整群抽样的方法在中部某县12个行政村抽取当地年龄≥20岁居民1 460名作为研究对象,在剔除部分项目填写不全或关键变量缺失,逻辑核查后,最终纳入符合标准的研究对象1 410名。对调查对象的一般情况、区域环境暴露和健康效应进行调查。(1)一般情况调查:包括调查基本情况、迁移史、既往病史、工作史、饮食情况等内容。考虑到矿工工作史与镉接触有相关性,在调查基本情况中对于调查对象该项目也进行了调查。(2)区域环境暴露调查:主要采集调查区农田土壤,用于对调查区的环境介质土壤中特征污染物镉的含量进行估计。(3)健康效应调查:采集调查对象的随机尿样50 ml并测定尿镉含量,作为镉污染对人群健康影响的效应指标。本研究经过江西省CDC伦理审查委员会批准。所有采样均征得调查对象的知情同意。

2.样品采集:  本调查按照《土壤环境监测技术规范》(HJ/T 166-2004)[5]在与人群暴露特征污染物有关的农用地和人群活动区域进行土壤环境监测点位布设、样品采集和分析,共采集土壤样品318份;按照《生物监测质量保证规范》(GB/T 16126-1995)[6]进行尿液采集、检测,最终获得符合纳入标准随机尿样品1 410份。

3.分析测试方法:  本次调查采集的环境样品和暴露样品中的尿镉和土壤镉含量均采用石墨炉原子吸收光谱法[7],Analyst 800原子吸收光谱仪(购自美国珀金埃尔默公司)进行测定;尿肌酐采用碱性苦味酸测定法[8],722型分光光度计(购自上海佑科仪器仪表有限公司)进行测定。

4.统计学分析:  (1)数据整理与分析:用Datafax软件建立统一的数据库,录入和管理数据,采用统计学分析软件SAS 9.3对数据进行整理与分析。与0岁相对应的因变量尿镉的值没有实际意义,因此对年龄作总均数中心化处理。年龄、食用大米量(自产)数据符合正态分布,变量尿镉在进行对数转换后符合正态分布,采用±s进行统计学描述,分类变量是否从事采选矿工作、性别采用率进行统计描述,村土壤镉水平属于偏态分布,采用中位数以及P25P75进行统计描述。对各个村调查对象年龄和性别构成进行χ2检验。在不考虑数据层次结构的情况下拟合一般线性模型,将村作为水平2单位(解释变量为村土壤镉水平)、个体作为水平1单位(解释变量为年龄、食用自产大米量、性别、是否从事采选矿工作)拟合多水平模型。(2)多水平模型[9]:在应用多水平模型之前,首先评估数据是否具有层次结构。同时采用拟合优度指标2倍对数似然值(–2LL)、Akaike′s信息标准(AIC)、贝叶斯信息标准(BIC)、有限样本校正(AICC)来评价模型的拟合效果。常用来评价数据具有层次结构的指标为组内相关系数(ICC)。ICC被定义为组间方差与总方差之比(公式1)。其中,σ2u0σ2代表组间方差;σ2代表组内方差。可以通过拟合空模型来估计σ2u0σ2

按照数据的层级结构,将变异分解到相应的层次上,本次研究模型可写为:公式2中y表示个体尿镉水平。截距β0j中的下标"j"表示水平1截距跨水平2单位变化。β1β2β3β4为水平1固定斜率。水平1回归系数β0j可以表示为水平2解释变量w1j的方程(公式3)。u0j表示组间差异,ε表示组内差异,γ00表示总截距,代表y的总均值。
        采用估计各水平解释变量占总变异的比例的方法[10],水平1解释变量占总变异的比例、水平2解释变量占总变异的比例可用公式4进行估计。当水平2样本含量差别较大,需要使用2水平样本量的调和均数H进行调整:,其中,k为村数量,nj为各村内个体数量。以P<0.05为差异有统计学意义。

结果  

1.调查对象一般情况:  本研究最终纳入1 410名研究对象,其中男性645名,女性765名,男女性别比例为1∶1.19;年龄(55.2±11.1)岁,处于20~87岁之间;家庭人均每年食用大米量(100.9±40.3)kg;有从事采选矿相关工作经历的占18.65%(262/1 410);有外地迁入史的占3.55%(50/1 410);所有调查对象均在本地居住10年以上。尿镉水平(9.39±2.16)μg/g肌酐。各村调查人群的年龄(χ2=30.17,P=0.61)、性别(χ2=8.85,P=0.64)构成差异均无统计学意义(表1)。

表1调查对象基本情况

2.村土壤镉水平:  对采集的318份土壤样品进行分析,各村农田土壤镉水平普遍超标,编号为12的村污染最为严重,是《土壤环境质量标准》(GB 15618-1995)[11]二级标准(pH<6.5,镉浓度限值为0.30 mg/kg)的3.1倍,详见表2

表2调查村土壤镉水平(mg/kg)

3.多水平模型与一般线性模型拟合结果:  一般线性模型对数据拟合结果显示除了是否从事采选矿工作差异无统计学意义(χ2=1.05, P=0.305)以外,村土壤镉水平、年龄、食用自产大米量、性别差异均有统计学意义(χ2分别为401.39、34.9、4.16、86.15,P值均<0.05)。空模型拟合结果显示本研究ICC=0.435 5,水平1、水平2随机效应统计学检验具有意义,表明尿镉在村水平上存在聚集性。多水平模型全模型分析结果显示解释变量村土壤镉水平、年龄、食用自产大米量、性别差异有统计学意义(Wald χ2值分别为2.55、6.34、2.37、10.32,P值分别为0.029、<0.01、0.018、<0.01),是否从事采选矿工作差异无统计学意义(χ2=0.78, P=0.438)。根据模型分析结果可得水平2变量可解释的变异占总变异的比例为0.352 6,即尿镉水平变异的35.26%可由水平2变量村土壤镉水平解释。两种模型拟合的系数基本一致,多水平模型的–2LL=2 432.5、AIC=2 448.5、BIC=2 452.4、AICC=2 448.6;一般线性模型的–2LL=2 761.6、AIC=2 775.6、BIC=2 812.4、AICC=2 775.7,多水平模型拟合度指标小,拟合效果更佳;一般线性模型的决定系数R2=0.300 6,多水平线性模型R22=0.352 6,详见表3

表3多水平模型和一般线性模型分析结果

讨论  环境镉污染健康危害区判定标准(GB/T 17221-1998)[8]中健康危害指标尿镉的值进行了肌酐校正,本研究依据该国标为参考,因此对尿镉水平作了肌酐校正。由于尿镉分布在村水平具有聚集性,数据不独立,应用传统的一般线性模型对数据进行拟合会导致Ⅰ类错误增大[9],多水平模型从一般线性模型无法解释的部分中分出可由数据层次结构解释的部分,从而降低了不能解释的部分占总变异的比例,提高拟合结果[12]。本研究将村作为水平2单位,个体作为水平1单位,在个体水平和村水平提供解释信息,结果显示ICC=0.435 5,提示人群尿镉水平的35.26%可由村土壤镉水平解释。同时,对比其余拟合数据可知,当数据具有典型的层次结构特征(环境健康数据大多呈现层次结构)时,多水平模型对数据拟合效果较一般线性模型有明显的优势。
        环境污染对健康影响往往具有高度隐蔽性、低剂量暴露、暴露时间长、多因多果、人群众多等特点,人群健康损害症状出现多有滞后性,"机体内负荷升高"、"生理生化功能改变"、"亚临床变化"占人群绝大多数,尿镉可以作为镉污染健康损害的初期健康效应指标。本研究显示,在控制其他因素的情况下,土壤镉水平对尿镉水平有很大的影响,欧阳燕玲和陈玲[13]指出,镉污染地区农田土壤镉水平与大米镉含量之间存在相关性,土壤镉污染导致污染区大米中镉含量超标,人食用镉大米导致体内镉蓄积,引起尿镉水平的升高。年龄、性别、食用自产大米量也对尿镉水平有影响,而是否从事采选矿工作对尿镉水平的影响差异没有统计学意义,可能是因为镉污染的主要暴露途径为消化道,而采选矿相关工作对个体的影响往往是通过呼吸道和皮肤接触产生的;对性别的统计学检验显示,女性的尿镉水平高于男性,有文献报道[14],一般情况下,女性对镉的吸收率高于男性,尿镉水平高于男性;年龄对尿镉水平有影响,但其回归系数较小,可能是出现健康损害效应是镉暴露一个长期累积的结果[15],以一岁为年龄的单位不能反映镉暴露的长期累积,所以回归系数较小;尿镉水平随着年龄的增长而增加,是因为随着年龄的增长,食用含镉大米越来越大,累积暴露量也随之越来越大;食用大米量对尿镉水平有影响,与李继强等[16]、汪再娟[17]文献报告结果一致。镉在体内的生物半衰期长(10~30年),造成肾脏以及骨骼的健康损害不容忽视,目前尚无有效的排毒方法。土壤镉污染已经给当地居民造成了潜在健康风险[18,19,20],应采取有效防治措施,降低人群健康风险。

参考文献
[1]杨珉, 李晓松. 医学和公共卫生研究常用多水平统计模型[M]. 北京:北京大学医学出版社, 2007:10–34.
[2]WHO. Cadmium Environmental health criteria 134: cadmium[M]. Geneva :WHO, 1992:131–198.
[3]杨克敌. 环境卫生学(第六版) [M]. 北京:人民卫生出版社, 2008:276–280.
[4]杜瑜, 尚琪. 环境镉污染人群健康影响研究回顾[J]. 卫生研究, 2006, 35(2):241–243.
[5]中华人民共和国环境保护部. HJ/T 166-2004 土壤环境监测技术规范[S]. 北京:中国环境科学出版社, 2005.
[6]国家技术监督局, 中华人民共和国卫生部. GB/T 16126-1995 生物监测质量保证规范[S]. 北京:中国标准出版社, 1997.
[7]中华人民共和国国家质量监督检疫检验总局, 中国国家标准化管理委员会. WS/T 32-1996 尿中镉的石墨炉原子吸收光谱测定方法[S]. 北京:中国标准出版社, 1996.
[8]国家技术监督局, 中华人民共和国卫生部. GB/T 17221-1998 环境镉污染健康危害区判定标准[S]. 北京:中国标准出版社, 1998.
[9]王济川, 谢海义, 姜宝法. 多层统计分析模型––方法与应用[M]. 北京:高等教育出版社, 2008:18–42.
[10]DouglasA. Luke.多层次模型, 郑冰岛, 译[M]. 上海:上海人民出版社, 2011:36–40.
[11]中华人民共和国环境保护部, 国际技术监督局. GB/T 15618-1995 土壤环境质量标准[S]. 北京:中国标准出版社, 1995.
[12]RasbashJ, BrowneW, GoldsteinH, et al. A User′s Guide to MLwiN (Second Edition) [M]. London, Institute of Education, 2000.
[13]欧阳燕玲, 陈玲. 大米中镉污染的现状分析及其危害[J]. 中国医药指南, 2012, 10(24):367–368.
[14]张金良. 金属和妇女健康[J]. 国外医学. 医学地理分册, 2004, 25(1):34–36.
[15]尚琪, 翟苗苗, 姚量三, 等. 江西某县大米镉污染情况追踪调查[J]. 卫生研究, 2009, 38(3):296–298.
[16]李继强, 陈锡永, 唐艺佳, 等. 环境镉污染及其对人群健康影响的研究[J]. 中国公共卫生, 2001, 17(3):196–198.
[17]汪再娟. 镉污染区居民食用米镉含量与尿镉水平跟踪调查[J]. 中国公共卫生, 1997, 13(3):149.
[18]张文丽, 李秋娟, 史丽娟, 等. 中国南方某镉污染区人群膳食镉摄入调查[J]. 卫生研究, 2009, 38(5):552–557.
[19]吕华东, 田俊, 林仲, 等. 镉污染对居民健康影响及因素分析[J]. 中国预防医学杂志, 2004, 5(2):84–86.
[20]魏筱红, 魏泽义. 镉的毒性及其危害[J]. 公共卫生与预防医学, 2007, 18(4):44–46.