首页

_中国骨伤_杂志论文中存在的统计学错误辨析_2_

中国骨伤2008年3月第21卷第3期ChinaJOrthop&Trauma,Mar.2008,Vol.21,No.3

・233・

・继续教育园地・

《中国骨伤》杂志论文中存在的统计学错误辨析(2)

周诗国,柳伟伟,胡良平

(军事医学科学院生物医学统计学咨询中心,北京

100850)

ZhongguoGushang/ChinaJOrthop&Trauma,2008,21(3):233-236www.zggszz.com

笔者对《中国骨伤》杂志2006年第2期与2007年第2期所载临床研究和基础研究类文章进行了仔细阅读,针对论文统计中统计学方法的应用情况做了细致的考察,就实验设计、表达与描述和统计分析3个方面存在的问题进行了辨析,提出了改进的建议和意见,希望能够为读者在提高科研工作的科学性和严谨性方面提供一定的帮助。

四原则分别是随机、对照、重复和均衡原则,人们在生物医学实验研究中,最易违背对照和均衡原则;设计类型就是由因素及其水平在特定研究中所取的一种组合关系或结构形式。

人们在涉及多因素实验研究的场合中,常用多次单因素设计取代应该采用的某种多因素设计;有时仅凭专业知识也碰巧给出了一个正确的多因素实验设计,但由于这方面的知识比较欠缺,而将其错误地表达出来,以至于后来整理和分析资料时出错;更有甚者,“拍着脑袋定方案、随心所欲搞科研”,给出了没有统计学根据的实验方案。

最常见的标准实验设计类型有单因素设计(包括单组设计、配对设计、成组设计和单因素多水平设计)、多因素析因设计和重复测量设计;还有一种是七拼八凑搞出来的实验方案,

[5]

。但不是标准的实验设计,叫做“多因素非平衡的组合实验”

1资料来源

临《中国骨伤》杂志2006年第2期和2007年第2期中“

床研究”部分论文共17篇(其中16篇为回顾性临床研究),“基础研究”部分论文共8篇(其中3篇为国家级基金资助项目,2篇为省市级基金资助项目)。这25篇论文中所存在的统计学错误的情况见表1和表2。

表125篇论文中存在的统计学错误情况(按统计学内容分)

错误所涉及到的统计学内容实验设计统计表达与描述统计分析

论文篇数

错误出现率(%)

典型错误案例辨析列举如下。

[6]

例1,《高龄股骨粗隆间骨折治疗方法的选择》一文,受

241115

964460

试对象为某医院骨科1997年6月至2003年7月间收治的高龄股骨粗隆间骨折患者115例……按Evans分型:Ⅰ型22例,Ⅱ型24例,Ⅲ型34例,Ⅳ型27例,Ⅴ型8例。根据骨折类型及患者意愿,分别采用骨牵引、多枚折尾钉内固定及动力髋螺钉(DHS)内固定等方法治疗,其中不愿接受内固定治疗者采用骨牵引法治疗(A组),EvanⅠ、Ⅱ型骨折者采用闭合复位多枚折尾钉内固定法治疗(B组),EvanⅢ、Ⅳ、Ⅴ型骨折者采用动力髋螺钉内固定法治疗(C组)。经12~34个月(平均22个月)随访,共有94例获完整随访资料,均骨折愈合,依据疗效标准,A组优2例,良6例,可5例,差2例,合计15例;B组优11例,良17例,可4例,合计32例;C组优18例,良22例,可6例,差1例,合计47例。对3个组疗效的比较采用&2检验。请问:此研究的实验分组正确吗?为什么?

辨析:此研究的实验分组是不正确的。3组患者在病情分型上(A组为不愿接受内固定治疗者;B组为EvanⅠ、Ⅱ型骨折者;C组为EvanⅢ、Ⅳ、Ⅴ型骨折者)明显是不具有可比性年龄构成等其他方面到底的,更不用说3组患者在性别构成、

是否具有可比性了。本例中,实验设计违背了均衡原则,组与组之间没有可比性,所得出的结论的可信度大打折扣。

例2,《腓骨固定在严重胫腓骨粉碎性骨折治疗中的作

[7]

用》一文,研究者于1998年1月至2003年1月手术治疗严

表225篇论文中存在的统计学错误情况(按错误类型分)

论文篇数出现率(%)

错误类型

实验设计类型的选择不合理无对照或对照不全

受试对象不同质或同质性差违背均衡原则

违背重复原则或样本含量太少误用t检验或方差分析违背随机原则

用单因素设计类型资料的分析方法来分析多因素设计类型的资料受试对象不独立误用χ检验

2016128885532

8064483232322020128

2统计学错误辨析

2.1实验设计方面的错误辨析

统计研究设计(含调查设

计、临床试验设计和实验设计)是生物医学科研工作不可或缺的重要内容,而实验设计又是其中最核心的内容;支起实验设三计这座“宏伟大厦”的3根坚实的支柱分别是实验设计的“

[1-4]要素”、“四原则”和“设计类型”。

重胫腓骨粉碎骨折80例(男54例,女26例;年龄12~76岁,平均34.5岁;闭合骨折44例,开放骨折36例),其中42例仅所有病例术后随访2~固定胫骨,38例同时固定胫腓骨。6年,

三要素分别是受试对象、实验因素和实验效应(通过具体的观测指标来体现),其选定是否正确主要取决于专业知识;

・234・

中国骨伤2008年3月第21卷第3期ChinaJOrthop&Trauma,Mar.2008,Vol.21,No.3

平均3.7年。请问:该论文得出的研究结论可信吗?为什么?

辨析:该论文得出的研究结论不可信。因为此论文没有交代患者进入不同治疗组的原则、方法及最终形成的2组患者在各个重要非实验因素方面的具体情况。因此,2个治疗组的骨折患者在年龄构成、性别构成、骨折类型构成、骨折严重程度、从骨折到治疗的时间间隔等重要非实验因素方面的情况可能差别很大,进而致使2个治疗组在年龄构成等重要非实验因素方面不均衡、不可比,最终得出的结论缺乏说服力。

中心减压自体骨与BMP植入治疗缺血性股骨头例3,《

[8]

坏死》一文,研究者为了探讨中心减压自体骨与骨形态发生

得出的结论可信度是可想而知的,不具有推广性和应用价值。

例4,《模拟肿瘤对颈胸段脊柱不同部位破坏后的生物力

[9]

一文,为了评价颈胸段脊柱T1在模拟溶骨性肿瘤学研究》

不同部位(肋椎关节、椎弓根和关节突)的破坏情况下的生物力学特性,取6具新鲜冷藏人体尸体脊柱标本(C7-T2),测量胸椎在不同部位损伤后对脊柱稳定性的影响。按照不同的破坏部位分为正常标本组(IS)、椎体破坏+椎体后壁破坏组(VB+PW)、椎体破坏+肋椎关节破坏组(VB+CVJ)、椎体破坏+椎弓根破坏组(VB+P)、椎体+肋椎关节+椎弓根破坏组(VB+椎体+肋椎关节+椎弓根+关节突破坏组(VB+CVJ+P+CVJ+P)、

蛋白(bonemorphogenicprotein,BMP)植入治疗缺血性股骨头坏死的临床疗效,对1996年4月至2002年4月应用中心减压自体骨与牛骨提纯骨形态发生蛋白植入治疗缺血性股骨头坏死患者36例41髋(男25例29髋,女11例12髋;年龄

FJ)。部分实验数据见表3,以统计软件SPSS11.0进行t检验

处理。请问:此研究的实验设计妥当吗?为什么?

辨析:此研究的实验设计不妥当,因为此研究的实验设计严重对照不全。虽然原作者讲“按照不同的破坏部位”设置了

31~69岁,平均45.5岁。有饮酒嗜好者15例,服用激素者10例,

饮酒并服用激素者4例,无明显诱因者7例。按Ficat分期:0期3髋,Ⅰ期19髋,Ⅱ期13髋,Ⅲ期6髋)的疗效进行了回

顾分析。结果36例患者均获随访,随访时间2~63个月,平均疗效评价结果:优21例,良8例,可4例,差3例。结41个月。

论:此术式可有效降低骨内压,改善股骨头血供,植入自体松质骨对关节软骨起到有效支撑防止塌陷的作用。BMP诱发组织修复,加快了股骨头骨质修复的过程,适于Ficat分期0~Ⅱ期的早期患者。请问:此研究结论可信吗?为什么?

辨析:此研究结论不可信。理由是:①未设置对照组,实验设计违背对照原则。本研究仅涉及到1组患者,而且所有患者都是接受中心减压自体骨与BMP植入术治疗,因此,本研究缺少对照组,违背了实验设计的对照原则。没有对照就没有比较的基础,所得出的结论就没有说服力。②受试对象不独立且同质性差。本研究中,有的患者有2个患侧,而有的患者只有

6个实验组,但从各个组的具体情况看,这6个组并不是6种

破坏部位”的不同的破坏部位所对应的6个组(即实验因素“

椎体是否破坏”、“椎体后壁是否破坏”、6个水平组),而是“

“肋椎关节是否破坏”、“椎弓根是否破坏”、“关节突是否破坏”

5个2水平实验因素各水平的不完全组合结果。若5个2水

平因素的各个水平完全组合,总共应有32个组,对应32种实验条件。而本文研究者仅在32种实验条件中的6种实验条件研究者所完成的实验下进行了实验,实验设计严重对照不全。

为多因素非平衡的组合实验,实验设计违背了对照原则和均衡原则。

间歇性压力培养环境对兔骨髓基质干细胞增殖的例5,《

[10]

一文,研究者用出生1个月的新西兰幼兔1只来制影响》

将生长良好的备骨髓基质干细胞(marrowstromalcells,MSC)。

第3~4代骨髓基质干细胞,按1×104个/孔随机接种于4块

1个患侧,如果用患侧作为研究对象的话,则研究对象之间不

年龄、饮酒情况、服用激素情况、临独立。此外,各患者在性别、床分期、病情严重程度等方面的差别比较大,而它们对疗效都会产生影响,因此,该组患者的同质性差,研究者在本文中所

24孔培养板,14h后细胞完全贴壁,换新鲜含10%FCS的按压力施加类型不同分为持续性和间歇性压力,每块DMEM。

培养板的细胞为1个大组,随机将4块培养板分为4个大组,即:对照组及20、60、100kPa间歇组。每大组按观察期分4个小组,即:1、3、5、7d组。每小组样本(细胞)为6孔。对照组

表3胸椎不同部位模拟肿瘤破坏后对胸椎稳定性的影响(xs)

标本破坏部位

比例极限

屈服载荷

破坏载荷

屈服位移

破坏位移

Pb(N)3372±2302859±1862493±1482265±1301994±981590±62

Ps(N)3549±2543043±2042680±1642440±1462168±1101734±74

Pb(N)4732±2744112±2203672±1763384±1382270±1301816±82

△s(mm)3.91±1.413.89±1.344.03±1.484.12±1.603.89±1.703.87±1.64

△b(mm)5.20±3.145.26±3.165.01±2.885.01±2.885.21±3.044.98±2.94

ISVB+PWVB+CVJVB+PVB+CVJ+PVB+CVJ+P+FJ

表4骨髓基质干细胞在不同间歇压力作用下的光吸收值(OD)(xs)

组别对照组

光吸收值(OD)

1d0.297±0.0380.298±0.0380.292±0.0210.273±0.039

3d0.678±0.0390.695±0.0570.663±0.0590.552±0.055

5d1.368±0.0561.435±0.0421.243±0.0511.062±0.080

7d1.632±0.0701.877±0.0701.550±0.0841.303±0.097

20kPa组60kPa组100kPa组

中国骨伤2008年3月第21卷第3期ChinaJOrthop&Trauma,Mar.2008,Vol.21,No.3

・235・

不予加压,20、60、100kPa间歇组分别每日施以20、60、100kPa的压力5min2次。实验数据见表4,采用单因素4水平定量资料的方差分析进行统计学处理。请问:此实验设计是否正确?为什么?

辨析:此实验设计不正确。研究者误将“重复取样”当作“独立重复实验”,致使实验设计严重违背重复原则。研究者在整个研究过程中所用到的骨髓基质干细胞只来自同一只出生

表5各组伤后6h血液及脊髓组织中MDA含量(xs,n=16)!±

组别对照组损伤组红花组

血清(nmol/ml)

脊髓组织(nmol/ml)

2.14±0.26△2.76±0.35*2.26±0.37△*

21.43±5.44△37.47±10.14*26.48±5.80△*

注:红花组与对照组比较△P>0.05;红花组与损伤组比较*P<0.01

1个月的新西兰幼兔,也就是说,只用了1只兔的骨髓基质干

由于生物体个体差异的客观细胞来做实验,即样本含量n=1。

存在,样本含量n=1的样本无论如何都是不具有代表性的,

不能代表任何一个总体。因此,本研究的实验设计严重违背了重复原则。实际上,研究者在本研究中是误用“重复取样”来代替“独立重复实验”。研究者错误地认为:1只兔的骨髓基,每个大组再“分质干细胞经过一系列处理后“分为4个大组”为4个小组”,每个小组仍有6个培养孔就是重复实验了。这是一种完全错误的认识。

合实验结果资料,应该根据分析目的、专业知识和统计学知识,对“组别”进行合理拆分、重新组合,每一种组合用一张统表5中的“血清”计表来表达。③统计表纵标目的设置不正确。和“脊髓组织”不是统计指标(或结果变量)的名称,而是一个名为“组织类型”(或类似的其他名称)的实验因素的2个水平的名称,而且,该因素与重复测量有关,因此,将计量单位“等放在“血清”和“脊髓组织”之后是错误的。计量单nmol/ml”

位应该放在统计指标的后面。真正的统计指标为“MDA含量”。因此,对于表5,编制统计表时应将计量单位“nmol/ml”之后,同时,应将“血放在统计表标题中统计指标“MDA含量”清”和“脊髓组织”之后的计量单位删掉。④在统计表中标注统计分析的结果也是不正确的。因为在统计表中标注统计分析结果时一般很难向读者清楚地说明或交代论文作者所采用的是哪一种具体的统计分析方法,也很难给出相应统计量的具体值及具体的P值。因此,应该在正文中或统计表之外来表达或说明分析资料时所采用的具体统计分析方法及统计分析的结果。此外,资料的表达形式还必须与资料所对应的实验设计类型相吻合,也就是说,资料的表达还必须能够正确体现资料所对应的实验设计类型。对于本研究,由于名为“组织类型”的实验因素是一个与重复测量有关的因素,故资料的正确表达应该如表6和表7所示。这两张表中定量资料所对应的实验设计类型都叫做“具有一个重复测量的两因素设计”。表6正常对照组和模型组成年雄性SD大鼠伤后6h血液及

脊髓组织中的MDA含量(xs,n=16)!±

是否建模不建模建模

2.2统计表达与描述方面的错误辨析有了实验资料之后,

就需要将其表达出来。资料的表达与描述,目的是将实验资料的核心内容用简洁的方法表达出来。有时需要计算一些简标准差、标准误、率、比等。有时需要编单的统计量,如均值、

制统计表、绘制统计图等。在表达实验资料时需要将资料所对应的实验设计类型体现出来。

在资料的表达与描述中,最常见的错误有:编制统计表组别”、“(实验)分组”、“(实验)处理”等模糊、抽象的词时,用“

语作为横标目的总称;将分组标志(或分组变量)放置在观测指标(或统计指标,或结果变量)的位置上而导致表中数据的含义不清楚。绘制统计图时,坐标轴上的刻度值标得不符合数学原则、资料与所选用的统计图类型不匹配等。

典型错误案例辨析列举如下。

红花注射液对脊髓损伤早期自由基影响的实验研例6,《

究》一文,研究者选择成年雄性SD大鼠48只,月龄4个月,体重230~损伤组、红花治250g,随机均分为正常对照组、疗组。采用Allen撞击法建立脊髓损伤模型,其中红花治疗组分别于打击后30min及2、术后6h4h腹腔注射红花注射液。测定脊髓组织和血液中丙二醛(malondialdehyde,MDA)和超氧化物歧化酶(superoxidedismutase,SOD)的含量,其中MDA的测定结果见表5。请问:原作者对资料的表达是否正确?为什么?

辨析:原作者对资料的表达不够正确。理由是:①用“组别”作为横标目的总称,不易反映出问题的实质。一般来说,统计表中最好不用“组别”、“(实验)分组”、“(实验)处理”、“(治)疗(方)法”等模糊、抽象性词语作为横标目的总称,因为单因素多水平设计”问这些词语容易给人误导,让人以为是“

题,而应该使用能揭示各组共性特征的一个或多个名词作为组别”之下的3个组实际上涉横标目的总称。②由于本例中“

及到两个实验因素,一个为“是否建模”,另一个为“(建模后)是否用红花注射液治疗”,每个因素都有2个水平,2个因素的各个水平全面组合,共有4种情况,对应4个实验组。本研究仅设置了其中的3个组,犯了对照不全的错误,所获得的资料为多因素非平衡组合实验结果资料。对于多因素非平衡组

[11]

MDA含量(nmol/ml)

组织类型:血液

脊髓组织

2.14±0.262.76±0.35

21.43±5.4437.47±10.14

表7模型对照组和治疗组成年雄性SD大鼠伤后6h血液及

脊髓组织中的MDA含量(xs,n=16)!±

是否用红花注射液治疗不治疗治疗

MDA含量(nmol/ml)

组织类型:血液

脊髓组织

2.76±0.352.26±0.37

37.47±10.1426.48±5.80

2.3统计分析方面的错误辨析在对资料进行统计分析时,

要根据资料的类型和资料所对应的实验设计类型,同时结合分析的目的选用相应的统计分析方法。对于定量资料而言,如果资料满足参数检验法的前提条件,可以进行参数检验,比如单组设计一元定量资料的t检验、单因素k水平设计一元定量资料的方差分析、两因素析因设计二元定量资料的方差分析、具有一个重复测量的三因素设计一元定量资料的方差分

・236・

中国骨伤2008年3月第21卷第3期ChinaJOrthop&Trauma,Mar.2008,Vol.21,No.3

析等;若不满足参数检验的前提条件(如不满足正态性或方差齐性),则需要使用非参数检验。定性资料常以列联表的形式给出,合理选用统计分析方法的关键在于正确辨别列联表的列联表的类型及资料的前提条件选类型,然后根据分析目的、

用相应的统计分析方法对列联表资料进行分析。

典型错误案例辨析列举如下。

例7,资料同例1。假定研究者的实验设计是正确的,请问:原作者对3个组疗效比较采用!2检验是否正确?为什么?

辨析:原作者比较3组疗效时所采用的统计分析方法是不正确的。因为此处的效应指标为“疗效”,而且有“优、良,可、差”4个水平,所以效应指标为等级(或有序)变量。因此,采用

对应的实验设计类型根本就不是单因素4水平设计。从表4可以明显地看出,资料至少涉及到2个实验因素,一个为“压,一个为“时间”。当然,资料所涉及到的实验因素究竟是不力”

是就是这两个呢?这需要作进一步的分析。经仔细分析,表4资料所涉及到的实验因素只有“压力”和“时间”两个,而且,由于本研究中各个实验条件下的骨髓基质干细胞都来自相同的压力”和“时间”幼兔,所以“2个实验因素都与重复测量有关,是两个重复测量因素,而不是实验分组因素。因此,表4资料所对应的实验设计类型应为具有两个重复测量的两因素设计。对该资料正确的分析方法应该是:如果资料满足参数检验的前提条件,应采用具有两个重复测量的两因素设计一元定量资料的方差分析对其进行处理;若资料不满足参数检验的前提条件,则可先对资料进行某种变量变换,若经变量变换后的资料满足参数检验的前提条件,仍可对变量变换后的资料采用具有两个重复测量的两因素设计一元定量资料的方差分析进行处理;若经变量变换后的资料仍不满足参数检验的前提条件,则应对原始资料采用某种适当的非参数检验方法(假如存在与相应设计对应的秩和检验方法,但目前尚无公认的多因素非参数检验方法)进行处理。

综上所述,在医学科研工作中,实际工作者对统计学的应用确实还存在很多错误,有待进一步加强学习。统计学的使用应该贯穿于整个科研工作的始终,而不是仅仅局限于最后的实验数据处理(分析)阶段。

参考文献

胡良平.医学统计应用错误的诊断与释疑.北京:军事医学科学出版社,1999.569.

!2检验来对3组疗效进行比较是不正确的。若研究者的实验

设计是正确的,所获得的资料也是可靠的,则应该采用结果变量为有序变量的单向有序3×4表列联表资料的秩和检验或

Ridit分析或logistic回归分析处理;倘若实验设计是错误的,

或者所获得的资料不可靠,则对资料的统计分析是毫无价值的!

例8,资料同例4。请问:原作者对表3资料进行t检验是否正确?为什么?

辨析:原作者对表3资料“进行t检验处理”是错误的。首先,原作者没有指出资料所对应的实验设计类型,没有说明资料是否满足参数检验的前提条件,也没有给出统计量的具体值。其次,原文中的数据根本就不能用t检验来处理。为了进行平均数的比较,能用t检验处理的定量资料只能来自以下配对设计和成组设计(或单因素3种单因素设计:单组设计、

两水平设计),而且统计指标必须是一元的定量变量;定量资料还必须满足参数检验的前提条件(独立性、正态性和方差齐性)。本研究资料为多因素非平衡组合实验结果资料(例4中已分析),显然不能用t检验来处理。对于这种多因素非平衡专业知识和统计学知识组合实验结果资料,应根据分析目的、

对原来的分组进行拆分和重组,对于每一种新的组合,根据其所对应的实验设计类型、资料性质、资料所满足的前提条件来选择合适的统计学分析方法对其进行处理。

例9,资料同例5。原作者对表4资料采用单因素4水平设计定量资料方差分析进行统计学处理。请问:原作者所采用的统计分析方法正确吗?请说明理由。

采用单因素4水平设计定量资辨析:原作者对表4资料“

料方差分析进行统计学处理”是错误的。原作者误判了实验设计类型。首先,原作者对统计分析方法的描述是错误的。假定原作者对表4资料所对应的实验设计类型的判断是正确的,即表4资料所对应的实验设计类型确实为单因素4水平设计,则对统计分析方法的正确描述应该是:经检验(或已知,或正态性(在该括号内给出检根据题意),表4资料满足独立性、

验统计量的具体值及具体的P值)和方差齐性(在该括号内给出检验统计量的具体值及具体的P值),故采用单因素4水平设计一元定量资料的方差分析对其进行处理。

表4资料所其次,原作者误判了本研究的实验设计类型。

2胡良平.现代统计学与SAS应用.北京:军事医学科学出版社,2000.

814.3

胡良平.统计学三型理论在实验设计中的应用.北京:人民军医出版社,2006.2043.

4胡良平.医学统计实战练习.北京:军事医学科学出版社,2007.1567891011

胡良平.口腔医学科研设计与统计分析.北京:人民军医出版社,

2007.304322.

唐吉平,蒋顺琬,曾强,等.高龄股骨粗隆间骨折治疗方法的选择.中国骨伤,2006,19(2):6769.

丁国正,姜宗圆,刘平.腓骨固定在严重胫腓骨粉碎性骨折治疗中的作用.中国骨伤,2006,19(2):8182.

赵建彬,张洪磊,魏鑫.中心减压自体骨与BMP植入治疗缺血性股骨头坏死.中国骨伤,2006,19(2):8384.

滕红林,杨胜武,吴春雷,等.模拟肿瘤对颈胸段脊柱不同部位破坏后的生物力学研究.中国骨伤,2006,19(2):9193.

彭磊,胡蕴玉,徐华梓,等.间歇性压力培养环境对兔骨髓基质干细胞增殖的影响.中国骨伤,2007,20(2):9293.

隋吉生,吴小涛,徐小彬.红花注射液对脊髓损伤早期自由基影响的实验研究.中国骨伤,2007,20(2):9496.

(收稿日期:2008-01-29

本文编辑:李为农)