-
类别归纳涉及到应用类别知识将一个新属性从一个/组类别推理到另一个/组类别,是根据已有知识对新的情况进行预测[1]. 表 1呈现了典型的类别归纳的例子[2].即向被试提供论证前提,并要求被试判断结论成立的可能性,或对归纳力度进行评价.
至今,归纳推理的研究大多集中在肯定证据的作用上,很少有研究关注否定证据是如何影响推理的[3-4].然而否定证据却频繁地出现在我们的现实生活中.例如,世界上的大多数事物都是不可食用的,不危险的等等[5].最近的一些研究开始关注否定证据对类别归纳的影响[1-2, 5-7].这些研究较为一致地发现增加否定证据增强了类别归纳结论判断力度.例如,Ransom等人[7]发现与仅提供一个肯定证据相比,增加否定证据更有利于推理.如表 1所示,多数被试会认为(b)的归纳力度强于(a),因为(b)提供了一个额外的否定证据.研究发现这种现象在儿童中也稳定存在[5].
Heussen等人[6]认为目前为止,仅关联理论(relevance theory)[8]和贝叶斯解释(Bayesian approach)[4, 9]能够解释否定证据增强类别归纳结论力度的现象.关联理论的设计目的是预测和解释归纳中的情境敏感性和因果知识效应,它认为前提是关于结论的信息,并强调刺激之间的关联性和认知效果是人们进行推理的重要部分.模型假设当输入的刺激之间相关性强,那么从大量刺激中挑选出目标刺激更有意义;当输入的刺激产生更大的认知效果或需要较少的认知努力,那么刺激之间更相关.因此,根据关联理论的观点,归纳论断的强度与前提和结论之间的认知相关性以及得出结论所需的认知努力或产生的认知效果有关[8].根据关联理论,在前提中增加一个否定证据,能够降低提取归纳所用类别范围时所需的努力,从而增强论证强度.但否定证据在类别归纳中能否降低努力程度仍然是一个未知问题.
另一个解释这种现象的理论是贝叶斯解释.贝叶斯解释是假设人们通过先验信息进行最优推理,这些先验信息包括新特征的分布情况、前提提供的证据等[4, 9].根据贝叶斯解释,当先前提供的前提和结论类别有一个很强的先验聚类时(例如“所有类别都具有某种特征,或者只有某个类别具有”),增加的否定证据就能提高论证的说服力;此外,当考虑到假设空间时,如果所有假设的概率都分布在假设空间上,引入否定证据就能排除某种假设,这意味着其余任何一个假设的概率都会增加,因此人们能够更明确地对其中一些假设进行对比.
然而,无论是关联理论还是贝叶斯解释,关于否定证据影响类别归纳的研究忽略了任务的加工速度问题,即任务加工是需要时间的.最近,由Hawkins等人[10]提出的线性弹道积累模型(Linear Ballistic Accumulation,LBA)讨论了这一问题.该理论假设类别归纳中的加工速度问题包含3种可能性解释:①人们做出强归纳力度的反应速度快于弱归纳力度的反应速度,因为做出强归纳反应力度时,证据积累速度更快;②人们做出强、弱归纳力度判断的反应速度不存在显著差异,导致强推理结论产生的原因可能是基于更低判断标准;③人们做出强归纳力度判断,是同时基于更快的证据积累速度和更松的判断标准.然而Hawkins等人[10]没有对他们的理论假设进行直接的检验,确定类别归纳的加工速度到底是哪种可能性.
本研究的目的是讨论否定证据是否会影响归纳力度判断的反应速度.若有影响,证据积累速度和判断标准是否对归纳力度判断有贡献.在本研究中,分别在具体结论(实验1)和一般结论(实验2)条件下通过测量归纳力度判断的反应时探讨否定证据对类别归纳力度判断的反应速度的影响.任务包含基线条件和增加否定证据条件.基线条件类似于表 1的(a),是一个由单一肯定前提构成的论述.增加否定证据条件类似于表 1的(b),是在基线条件的基础上,增加一个否定论述作为前提.为了计算判断标准,结论类别分别为与肯定证据类别属于同一类别(一致)或不属于同一类别(不一致).归纳结论包括具体结论和一般结论[11],因此在实验1中,结论类别为具体类别(例如,香梨);而在实验2中,结论为一般类别(例如,梨类).根据线性弹道模型[10],如果增加否定证据条件的反应时短于基线条件,且判断标准松于基线条件,则表明否定证据增加归纳力度是由证据积累速度的增加和判断标准的降低引起的.如果仅是反应时变短,则说明否定证据加速证据积累速度;否则,则说明否定证据仅改变判断标准,不影响反应速度.
全文HTML
-
先前研究主要采用具体结论讨论否定证据对类别归纳的影响[2, 5-7].因此,本实验在前人基础上,进一步探讨具体结论条件下的反应时和判断标准特征.
-
本研究在西南大学招募35名被试(平均年龄[M]:20.37岁,标准差[SD]:2.01;女生20人,男生15人)参加正式实验.被试均为右利手,无精神病或神经症史,视力或矫正视力正常,并以汉语为母语.实验完成后得到10元报酬.
-
具体材料见表 2.该实验采用2(前提:基线、增加否定前提)×2(结论:一致、不一致)的被试内实验设计.其中,前提与结论中包含的类别均为下位水平类别.属性采用真实但又不常见的词(如天冬氨酸).前提有2个条件:基线条件和增加否定证据条件.在基线条件下,前提条件是由一个肯定证据组成(例如,“草莓含有天冬氨酸”).在增加否定证据条件下,前提在基线条件的基础上,增加一个否定证据(例如,“草莓含有天冬氨酸,货船不含有天冬氨酸”).其中,否定证据与肯定证据不属于同一类别.结论分2种条件:与肯定证据的类别一致(例如,“香梨”)或不一致(例如,“茶几”).结论是由一个下位水平类别组成,其后加一个问号“?”,表示被试需要基于前提判断这个结论类别是否也具有相同属性(例如,“香梨?”表示香梨是否含有天冬氨酸).实验为4点等级评分,一半被试的指导语为“数字越大可能性越大,1=完全不可能,4=完全可能”,另一半被试则相反.正式实验共24个试次,其中基线前提-结论一致、基线前提-结论不一致、增加否定证据前提-结论一致和增加否定证据前提-结论不一致条件各6个试次.正式实验前每个被试会进行8个试次的练习,每种条件分别有2个试次,以确保他们能够理解实验任务,并且这8个试次不会出现在正式实验中.
实验开始时,主试告诉被试将会进行一项推理任务:“首先你会看到一个或者2个前提,它是经过证明的事实.例如,‘草莓含有天冬氨酸’(基线)或‘货船不含有天冬氨酸,草莓含有天冬氨酸’(增加否定证据). ”接着给被试呈现结论,询问他们认为结论成立的可能性大小,例如,“你认为香梨含有天冬氨酸的可能性是多少,请选择1-4,数字越大/小,可能性越大”.前提与结论分屏呈现,并要求被试在结论出现时又准确又快地进行判断.
实验程序如图 1所示.首先屏幕中央会呈现一个44号宋体的注视点“+”表示实验开始,呈现时间为500 ms,之后随机呈现一个800~1 000 ms的空屏,然后再随机呈现一个或者2个前提,呈现时间均为6 000 ms,中间有一个800~1 000 ms的空屏;接着再次呈现800~1 000 ms的空屏,然后呈现结论,呈现时间为10 000 ms,之后随机呈现一个800~1 000 ms的空屏,最后呈现结论的判断阶段,持续呈现10 000 ms,被试对结论成立的可能性大小作出按键反应后消失.实验试次随机呈现.实验时间约为10 min.
-
实验使用了E-prime 2.0收集数据,数据采用JASP(https://jasp-stats.org/)[12-14]进行两因素重复测量方差分析,对归纳力度、反应时和判断标准进行分析.当数据不符合球形假设时,统计结果均采用Green-House校正.
-
图 2分别展示了具体结论在前提(基线条件、增加否定前提条件)和结论(一致、不一致)条件下的平均归纳力度,平均反应时以及判断标准.统计归纳力度时统一为“完全不可能”记1分,“有些不可能”记2分,“有些可能”记3分,“完全可能”记为4分.为排除题目之间的异质性对实验的干扰,本研究分别在结论一致和结论不一致条件下,对各题目在增加否定证据后产生的归纳力度改变(增加否定证据条件-基线条件)进行单因素方差分析,结果显示各题目间差异无统计学意义(一致:F[5, 29]=1.28,p=0.23,ηp2=0.18;不一致:F[5, 29]=0.34,p=0.84,ηp2=0.01).因此,在后续的统计中,通过平均各题目上的反应参数忽略题目间的差异.
对于归纳力度,分析显示前提与结论交互作用不显著(F[1, 34]=3.75,p=0.061,ηp2=0.10);归纳论断力度前提的主效应显著(F[1, 34]=5.79,p=0.022,ηp2=0.15),增加否定证据条件的归纳论断力度显著高于基线条件(t[1, 34]=2.41,p=0.022,Cohen’d=0.41);结论的主效应显著(F[1, 34]=574.30,p < 0.001,ηp2=0.94),结论一致条件的归纳力度显著高于不一致条件(t[1, 34]=23.96,p < 0.001,Cohen’d=4.05).
对于反应时,统计显示,前提和结论的交互作用不显著(F[1, 34]=0.36,p=0.551,ηp2=0.01);前提的主效应显著(F[1, 34]=17.93,p < 0.001,ηp2=0.35),增加否定证据的反应时显著快于基线条件(t[1, 34]=-4.23,p < 0.001,Cohen’d=-0.72);结论的主效应显著(F[1, 34]=16.86,p < 0.001,ηp2=0.33),结论一致条件的反应时显著慢于不一致条件(t[1, 34]=4.11,p < 0.001,Cohen’d=0.69).
对于判断标准,已有文献的计算方法主要有2种:一阶信号检测理论(Signal Detection Theory,SDT)[15]和二阶信号检测论(Two High Threshold Model,2 HTM)[16].因此本实验分别报告了一阶信号检测论的判断标准指标c和二阶信号检测论的判断标准指标Br.其中,根据Cui等人[17]的计算方法,本研究的击中率为结论类别与肯定证据类别一致时,报告为“是”的比例,虚报率为结论类别与肯定证据类别不一致时,报告为“是”的比例.在一阶信号检测论中,通过配对样本t检验,发现增加否定证据条件的判断标准c(M[SD]=0.10[0.28])与基线条件(M[SD]=0.20[0.24])相比,在统计学上呈显著差异(t[1, 34]=-2.21,p=0.034,Cohen’d=-0.373).在二阶信号检测论中,增加否定证据条件的判断标准Br(M[SD]=0.43[0.15])与基线条件(M[SD]=0.37[0.14])相比,在统计学上呈显著差异(t[1, 34]=2.33,p=0.026,Cohen’d=0.40),该结果说明采用具体结论,增加否定证据条件比基线条件的判断标准更宽松.
1.1. 方法
1.1.1. 研究对象
1.1.2. 实验材料及设计
1.1.3. 工具与分析方法
1.2. 结果与分析
-
实验1证明了具体性结论时,增加一个否定证据能够提高归纳判断的力度、缩短反应时和降低判断标准.先前的研究[2, 5-7]仅讨论了具体结论对类别归纳的影响,缺乏一般结论对类别归纳影响的证据,因此本实验进一步探讨在一般性结论条件下增加否定证据是否也能够稳定地对归纳力度、反应速度和判断标准产生影响.
-
本研究在西南大学招募35名(平均年龄[M]:19.97岁,标准差[SD]:1.72;女生22人,男生15人)健康被试.被试均为右利手,无精神病或神经症史,视力或矫正视力正常,且以汉语为母语.实验完成后得到10元报酬.
-
实验材料中与实验1相似,不同之处是采用一般性类别词作为结论(表 2).实验设计同实验1.
-
实验工具,统计工具与统计方法与实验1相同.
-
图 3展示了一般性结论在前提(基线条件、增加否定前提条件)和结论(一致、不一致)条件下的平均归纳力度、平均反应时和判断标准.为排除题目之间的异质性对实验的干扰,本研究分别在结论一致和结论不一致条件下,对各题目在增加否定证据后产生的归纳力度改变(增加否定证据条件-基线条件)进行单因素方差分析,结果显示各题目间差异无统计学意义(一致:F[5, 29]=0.93,p=0.48,ηp2=0.13;不一致:F[5, 29]=0.27,p=0.93,ηp2=0.008).
对于归纳力度,根据两因素重复测量方差分析,前提与结论的交互作用不显著(F[1, 34]=0.25,p=0.624,ηp2=0.01);归纳力度的前提主效应显著(F[1, 34]=8.81,p=0.005,ηp2=0.21),增加否定证据条件的归纳论断力度显著高于基线条件(t[1, 34]=2.97,p=0.005,Cohen’d=0.50);结论的主效应显著(F[1, 34]=591.39,p < 0.001,ηp2=0.95),结论一致条件的归纳力度显著高于不一致条件(t[1, 34]=24.32,p < 0.001,Cohen’d=4.11).
对于反应时,根据两因素重复测量方差分析,前提与结论的交互作用不显著(F[1, 34]=1.73,p=0.198,ηp2=0.05);归纳反应时前提的主效应显著(F[1, 34]=10.07,p=0.003,ηp2=0.23),增加否定证据的判断反应时显著快于基线(t[1, 34]=-3.17,p=0.003,Cohen’d=-0.54);结论的主效应显著(F[1, 34]=30.47,p < 0.001,ηp2=0.47),结论一致条件的反应时显著慢于不一致条件(t[1, 34]=-5.52,p < 0.001,Cohen’d=-0.93).
对于判断标准,在一阶信号检测论中,根据配对样本t检验统计,发现增加否定证据条件的判断标准c(M[SD]=0.05[0.24])与基线条件(M[SD]=0.19[0.28])相比,在统计学上呈显著差异(t[1, 34]=-3.02,p=0.005,Cohen’d=-0.51).在二阶信号检测论中,增加否定证据条件的判断标准Br(M[SD]=0.48[0.15])与基线条件(M[SD]=0.39[0.14])相比,在统计学上呈显著差异(t[1, 34]=3.20,p=0.003,Cohen’d=0.54),该结果表明采用一般结论,增加否定证据条件比基线条件的判断标准更宽松.
2.1. 方法
2.1.1. 研究对象
2.1.2. 实验材料与设计
2.1.3. 工具
2.2. 结果与分析
-
关联理论与贝叶斯方法均能解释否定证据增强归纳力度,但是缺乏对时间动态性的考察.本研究在具体结论(实验1)和一般结论(实验2)条件下考察了类别归纳力度判断中增加否定证据对归纳力度、反应速度和判断标准的影响.研究发现在2个实验中,否定证据均可以增强归纳力度,加快归纳判断反应速度并降低判断标准.
首先,本研究重复了以前的研究结果并拓宽了研究材料的范围.以往的研究[2, 5-7]发现,当结论类别为具体类别时,增加否定证据能增强归纳力度,但他们只讨论了具体结论时的归纳力度,而未涉及一般结论,也未讨论类别归纳的时间动态性和判断标准.因此本研究在具体结论的基础上增加了一般结论,发现当结论为一般结论时,增加否定证据后归纳力度也得到了增强,从而拓展了以往研究的结论类型.同时,以上研究大多采用的迫选任务,有研究[6]对量表评分和迫选任务进行了比较,发现量表评分是更严格的.因此本研究采用的是更严格的量表评定法,也发现了增加否定证据能够提高归纳力度,进一步说明了效应的可靠性和稳定性.
其次,以前的研究[2, 5-7]忽略了反应时和判断标准的测量,这可能与先前的研究主要采用纸质问卷的测量方式有关.本研究发现增加否定证据后能够出现更快的归纳判断反应速度和更松的判断标准.无论是具体结论还是一般结论,增加否定证据均对反应速度有促进作用,这可能是因为证据的增加导致了更大的说服力,从而有一个更快的判断速度.同时,本研究还发现,无论是具体结论还是一般结论条件下,增加否定证据的论断比基线论断有更小的c和更大的Br.在一阶信号检测论中,更小的c表示更松的判断标准;在二阶信号检测论中,更大的Br表示更松的判断标准.因此,一阶和二阶信号检测理论都一致表明增加否定证据后出现了更松的判断标准.这些结果对信号检测论的研究进行了拓展.此外,我们发现结论类别与肯定证据类别一致时相比,当结论类别与肯定证据类别不一致时会出现一个更快的判断速度,这与以前的研究一致[18],表明接受归纳需要更多的认知加工时间,而拒绝归纳可以基于某些凸显的理由快速反应.
本研究发现增加否定证据后能够出现更快的归纳判断反应速度和更松的判断标准,表明证据积累速度和判断标准能同时影响归纳.线性弹道积累模型[10]对类别归纳有3种可能性假设:①不同程度归纳力度判断的速度不同,人们做出强归纳力度的反应速度快于弱归纳力度的反应速度,因为做出强归纳反应力度时,证据积累的速度更快;②不同归纳力度的判断速度之间的证据积累速度没有显著差异,不同力度判断是由于判断标准的不同引起的;③证据积累速度和判断标准同时影响归纳力度判断.然而,他们仅提出了这3种可能性,并未进一步回答是哪种可能性.在本研究中,与基线相比,增加否定证据条件有更快的归纳判断反应速度与更松的判断标准,提供了证据支持线性弹道积累模型的第三种可能性. Cui等人[17]对类别归纳的单调性效应(肯定证据越多,归纳力度越强)的研究也发现,肯定证据多的归纳结论比肯定证据少的归纳力度更强,并且同时具有更快的反应速度和更松的判断标准,这也支持了线性弹道积累模型的第三种可能性.
然而,证据积累速度和判断标准对类别归纳力度判断的影响还需要进一步研究.尽管本研究和Cui等人[17]的研究都显示证据积累速度和判断标准影响类别归纳力度判断,但这一结论还需要在更多的类别归纳的心理效应(例如,典型性效应[19-20],多样性效应[17, 21])中进行检验.此外,线性弹道积累模型本身也面临一些挑战.例如,有研究表示[22],弥散性模型(Diffusion Decision Model,DDM)对刺激-目标可变性证据提供了比线性弹道积累模型更准确的解释,今后的研究可以进一步比较线性弹道积累模型和弥散性模型,探索哪种模型能更好地解释类别归纳的力度判断.
-
本研究发现具体结论和一般结论条件中增加否定证据均提高了归纳力度,这重复了以往研究的结果;同时,结果进一步发现无论是具体结论还是一般结论,增加否定证据加快了结论判断的反应速度,支持了线性弹道模型关于证据积累速度的假设.本研究进一步发现,增加否定证据的一般结论论断比仅包含肯定证据的一般结论论断有更松的判断标准,这一结果进一步支持了线性弹道模型关于证据积累速度和判断标准影响类别归纳的假设.