留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

基于三支概念簇的知识表示

上一篇

下一篇

智慧来, 徐彤, 李逸楠. 基于三支概念簇的知识表示[J]. 西南大学学报(自然科学版), 2021, 43(10): 10-18. doi: 10.13718/j.cnki.xdzk.2021.10.002
引用本文: 智慧来, 徐彤, 李逸楠. 基于三支概念簇的知识表示[J]. 西南大学学报(自然科学版), 2021, 43(10): 10-18. doi: 10.13718/j.cnki.xdzk.2021.10.002
ZHI Huilai, XU Tong, LI Yinan. Knowledge Representation Based on Three-Way Concept Cluster[J]. Journal of Southwest University Natural Science Edition, 2021, 43(10): 10-18. doi: 10.13718/j.cnki.xdzk.2021.10.002
Citation: ZHI Huilai, XU Tong, LI Yinan. Knowledge Representation Based on Three-Way Concept Cluster[J]. Journal of Southwest University Natural Science Edition, 2021, 43(10): 10-18. doi: 10.13718/j.cnki.xdzk.2021.10.002

基于三支概念簇的知识表示

  • 基金项目: 国家自然科学基金项目(61502150);河南省高校基本科研业务费专项(NSFRF210318)
详细信息
    作者简介:

    智慧来,副教授,硕士生导师,博士,主要从事形式概念分析、粗糙集理论、粒计算等研究 .

  • 中图分类号: TP18

Knowledge Representation Based on Three-Way Concept Cluster

  • 摘要: 概念簇刻画了现代范畴理论中具有家族相似性的概念集合. 概念簇中的概念包含了对象具有的共同属性,但忽略了对象都不具有的属性,不利于解决某些特定的问题. 本文融合现代范畴理论与三支概念分析,提出了用三支概念簇刻画具有家族相似性的三支概念集合;其次,研究了三支概念簇的若干重要性质与运算方法;最后,将三支概念簇用于满足特定约束条件下的相似对象检索. 分析结果表明,三支概念簇相比较于概念簇,能够检索到更加符合需求的对象.
  • 加载中
  • 图 1  形式背景K的对象导出三支概念格OEL(K)

    图 2  例3的对象导出三支概念格

    表 1  例1的形式背景K

    a b c d e
    1 × × ×
    2 × ×
    3 × × ×
    4 × × × ×
    下载: 导出CSV

    表 2  例3的形式背景

    a b c d e f g h
    1 × ×
    2 × × ×
    3 × × × ×
    4 × × × ×
    5 × × ×
    6 × × × ×
    7 × × ×
    8 × × ×
    下载: 导出CSV
  • [1] WU W Z, LEUNG Y, MI J S. Granular Computing and Knowledge Reduction in Formal Contexts[J]. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(10): 1461-1474. doi: 10.1109/TKDE.2008.223
    [2] 仇国芳, 马建敏, 杨宏志, 等. 概念粒计算系统的数学模型[J]. 中国科学(F辑: 信息科学), 2009, 39(12): 1239-1247. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-PZKX200912003.htm
    [3] 苗夺谦, 张清华, 钱宇华, 等. 从人类智能到机器实现模型——粒计算理论与方法[J]. 智能系统学报, 2016, 11(6): 743-757. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-ZNXT201606004.htm
    [4] 李金海, 吴伟志. 形式概念分析的粒计算方法及其研究展望[J]. 山东大学学报(理学版), 2017, 52(7): 1-12. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SDDX201707001.htm
    [5] 智慧来, 李金海. 基于必然属性分析的粒描述[J]. 计算机学报, 2018, 41(12): 2702-2719. doi: 10.11897/SP.J.1016.2018.02702
    [6] ZADEH L A. Toward a Theory of Fuzzy Information Granulation and Its Centrality in Human Reasoning and Fuzzy Logic[J]. Fuzzy Sets and Systems, 1997, 90(2): 111-127. doi: 10.1016/S0165-0114(97)00077-8
    [7] QI J J, WEI L, WAN Q. Multi-Level Granularity in Formal Concept Analysis[J]. Granular Computing, 2019, 4(3): 351-362. doi: 10.1007/s41066-018-0112-7
    [8] FUJITA H, GAETA A, LOIA V, et al. Resilience Analysis of Critical Infrastructures: A Cognitive Approach Based on Granular Computing[J]. IEEE Transactions on Cybernetics, 2019, 49(5): 1835-1848. doi: 10.1109/TCYB.2018.2815178
    [9] HOŃKO P. Recent Granular Computing Frameworks for Mining Relational Data[J]. Artificial Intelligence Review, 2019, 52(4): 2705-2742. doi: 10.1007/s10462-018-9643-1
    [10] WILLE R. Restructuring Lattice Theory: An Approach Based on Hierarchies of Concepts[M] // RIVAL I. Ordered Set. Dordrecht-Boston: Reidel, 1982: 445-470.
    [11] 智慧来. 概念格构造与应用中的关键技术研究[D]. 上海: 上海大学, 2010.
    [12] YAO YY. A Comparative Study of Formal Concept Analysis and Rough Set Theory in Data Analysis[C] //Rough Sets and Current Trends in Computing (LNCS: 3066), Uppsala, Sweden, 2004: 59-68.
    [13] YAO Y Y. Concept Lattices in Rough Set Theory[C] // Proceedings of the International Conference of the North American Fuzzy Information Processing Society, IEEE, Banff, Canada, 2004: 796-801.
    [14] ZHI H L, QI J J, QIAN T, et al. Three-Way Dual Concept Analysis[J]. International Journal of Approximate Reasoning, 2019, 114: 151-165. doi: 10.1016/j.ijar.2019.08.010
    [15] YAO Y Y. Rough-Set Concept Analysis: Interpreting RS-Definable Concepts Based on Ideas from Formal Concept Analysis[J]. Information Sciences, 2016, 346/347: 442-462. doi: 10.1016/j.ins.2016.01.091
    [16] XU W H, LI W T. Granular Computing Approach to Two-Way Learning Based on Formal Concept Analysis in Fuzzy Datasets[J]. IEEE Transactions on Cybernetics, 2016, 46(2): 366-379. doi: 10.1109/TCYB.2014.2361772
    [17] SHAO M W, LEUNG Y, WANG X Z, et al. Granular Reducts of Formal Fuzzy Contexts[J]. Knowledge-Based Systems, 2016, 114: 156-166. doi: 10.1016/j.knosys.2016.10.010
    [18] 李金海, 吴伟志, 邓硕. 形式概念分析的多粒度标记理论[J]. 山东大学学报(理学版), 2019, 54(2): 30-40. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SDDX201902002.htm
    [19] ZHI H L, QI J J, QIAN T, et al. Conflict Analysis under One-Vote Veto Based on Approximate Three-Way Concept Lattice[J]. Information Sciences, 2020, 516: 316-330. doi: 10.1016/j.ins.2019.12.065
    [20] YAO Y Y. Three-Way Decision: An Interpretation of Rules in Rough Set Theory[M] //Rough Sets and Knowledge Technology Berlin, Heidelberg: Spring Berlin Heidelberg, 2009: 642-649.
    [21] QI J J, WEI L, YAO Y Y. Three-Way Formal Concept Analysis[M] //Rough Sets and Knowledge Technology Cham: Springer International Publishing, 2014: 732-741.
    [22] QI J J, QIAN T, WEI L. The Connections Between Three-Way and Classical Concept Lattices[J]. Knowledge-Based Systems, 2016, 91: 143-151. doi: 10.1016/j.knosys.2015.08.006
    [23] 魏玲, 高乐, 祁建军. 三支概念分析研究现状与展望[J]. 西北大学学报(自然科学版), 2019, 49(4): 527-537. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XBDZ201904005.htm
    [24] 魏玲, 赵思雨. 三支概念分析中的粒与知识结构[J]. 西北大学学报(自然科学版), 2020, 50(4): 537-545. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XBDZ202004004.htm
    [25] CROFT W, CRUSE D A. Cognitive Linguistics[M]. Cambridge: Cambridge University Press, 2004.
    [26] LAKOFF G. Women, Fire, and Dangerous Things: What Categories Reveal about the Mind[M]. Chicago: The University of Chicago Press, 1987.
    [27] 智慧来, 李逸楠. 基于概念簇的知识表示[J]. 西北大学学报(自然科学版), 2020, 50(4): 529-536. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XBDZ202004003.htm
  • 加载中
图( 2) 表( 2)
计量
  • 文章访问数:  862
  • HTML全文浏览数:  862
  • PDF下载数:  154
  • 施引文献:  0
出版历程
  • 收稿日期:  2021-05-21
  • 刊出日期:  2021-10-20

基于三支概念簇的知识表示

    作者简介: 智慧来,副教授,硕士生导师,博士,主要从事形式概念分析、粗糙集理论、粒计算等研究
  • 河南理工大学 计算机科学与技术学院, 河南 焦作 454003
基金项目:  国家自然科学基金项目(61502150);河南省高校基本科研业务费专项(NSFRF210318)

摘要: 概念簇刻画了现代范畴理论中具有家族相似性的概念集合. 概念簇中的概念包含了对象具有的共同属性,但忽略了对象都不具有的属性,不利于解决某些特定的问题. 本文融合现代范畴理论与三支概念分析,提出了用三支概念簇刻画具有家族相似性的三支概念集合;其次,研究了三支概念簇的若干重要性质与运算方法;最后,将三支概念簇用于满足特定约束条件下的相似对象检索. 分析结果表明,三支概念簇相比较于概念簇,能够检索到更加符合需求的对象.

English Abstract

  • 开放科学(资源服务)标志码(OSID):

  • 概念是人类认知活动的基本单位,以概念为基础的粒计算方法是实现可解释性人工智能的途径之一[1-5]. 粒计算通过对复杂数据的多粒度化处理得以实现复杂问题的简易求解[6]. 多粒度化的数据呈现出大小不同的信息粒,从而构成了由小到大的粒度链条[7]. 在粒度链条中,小粒是构成大粒的基础,粒度的变化体现着思维过程的泛化和特化,在泛化和特化的双向思维驱动下,人们得以解决许多看似无法下手的困难问题[8-9].

    形式概念分析(formal concept analysis,FCA)[10]是基于格论建立起来的数学方法,已经成为一种最有效的粒计算理论. 在应用的驱动下,根据实际需求可以通过各种方法构造不同类型的形式概念,包括经典形式概念、面向对象概念、面向属性概念、对偶概念等[11-14]. 最近十年,粗糙集、粒计算、模糊集、三支决策理论等推动了形式概念分析的发展,产生了许多有重要理论价值与应用价值的成果[15-20]. 其中,QI等[21]将三支决策理论(three-way decisions,3WD)中的三分思想引入形式概念分析,提出了三支概念分析(three-way concept analysis,3WCA). 具体就是通过在形式背景上定义负算子,刻画对象子集与属性子集间"共同不具有"的关系,并构造三支算子,将对象集或属性集三分,形成三支概念与三支概念格. 三支概念分析自2014年提出以来,得到了广泛的认可[22-24].

    信息检索一直是人工智能的重要研究课题,但是,现有的信息检索方法广泛采用距离度量相似程度,不能完全客观精准地对具有家族相似性的原型范畴进行刻画. 如果能够采用粒计算思想,从概念的角度对整个粒度链条进行深入研究,特别是对粒度链条顶端的子格进行研究,或许可以得到满意的解决.

    现代范畴理论[25-26]强调相似的传递性,使得看似不相关的对象通过相似的传递性联系在一起,形成一个个特定的范畴,在同一范畴内,成员共享"家族相似性". 显然,采用距离度量相似程度不能准确地刻画这样的情形. 为了解决这一问题,在现代范畴理论的启发下,智慧来与李逸楠首次提出了概念簇,用以刻画一组具有家族相似性的概念,并应用于相似对象的检索[27]. 概念簇中的概念包含了对象具有的共同属性,但忽略了对象都不具有的属性,不利于解决某些特定的问题.

    为了解决上述问题,本文融合现代范畴理论与三支概念分析,提出了用三支概念簇刻画具有家族相似性的三支概念集合,并对三支概念簇的性质、运算以及应用进行了初步的探讨.

  • 本节介绍形式概念分析[10]、概念簇[27]以及三支概念分析[21]的相关基本概念.

  • 形式概念分析[10]建立在格论基础之上,对哲学中的概念进行了高度的数学概括,具有良好的性质,已经广泛应用于知识表示、数据挖掘、近似推理等诸多领域. 形式背景是领域本体的抽象描述,也是形式概念分析研究的具体对象和起点.

    具体地,形式背景可以抽象为一个三元组K=(GMI),其中,G为对象集合,M为属性集合,且均非空有限,IGM之间的二元关系. 进一步,使用I(xa)=1表示对象x具有属性a,使用I(xa)=0表示对象x不具有属性a. 在下文中,为了方便起见,对于单元素集合,只列出其中的元素. 例如,用x表示集合{x}.

    对于XGAM,分别定义对象集和属性集上的算子如下:

    X*=AA*=X,则称(XA)是形式背景K的一个概念. 已经证明,形式背景K的全体概念构成一个完全格,并称之为概念格,记做L(K).

    现代范畴理论[25-26]着重分析了家族相似概念,从理论上阐述了在同一个范畴中有可能存在一些不具有共同属性的对象. Wittgenstein通过深入了解许多不同类型的游戏,发现当中的一些游戏并不具有共同点,但是体现出了不可忽视的紧密联系. 经过分析得知,这些游戏是通过相似的传递性而密切联系在一起,利用这种密切联系,Wittgenstein将这些游戏划分成了多个家族. 语言学家Labov和Rosch在深入研究自然范畴的基础上,将"家族相似性"解释为家族成员具有某些相似之处,并将"原型范畴"(prototype category)解释为具有"家族相似性"的自然范畴,从而奠定了现代范畴理论的基础.

    现代范畴理论的主要观点包括:

    1) 范畴内的各个成员通过相似的传递性聚集在一起,所有成员不一定存在相同的约束;

    2) 范畴中可能存在一个或多个中心,形成单一中心结构或多中心结构;

    3) 对于一个范畴,最具典型性的成员位于范畴的中心.

    现代范畴理论的主要观点在粒计算理论中已经有大量的体现. 在现代范畴理论的启发下,智慧来等提出了概念簇,用以刻画具有某些特定相似之处的概念,并应用于基于概念格的相似对象检索.

    定义 1[27]  给定一个形式背景K=(GMI),XGAM. 若

    则称C(XA)是K的一个概念簇.

    文献[27]已经证明,概念簇本质上是概念格的子格,位于粒度链条的最顶端,使用概念簇代替子格,是为了强调概念之间的家族相似性,以便于概念格理论的应用.

  • 三支概念分析[21-22]相比较于经典形式概念分析,刻画了对象共同不具有的属性,能够提供经典形式概念分析所不能提供的某些细节. 为了构造三支概念,首先需要定义对象集和属性集上的负算子.

    给定一个形式背景K=(GMI),XGBM,对象集和属性集上的负算子分别定义如下:

    定义 2  给定一个形式背景K=(GMI),XGABM,定义对象导出三支算子如下:

    进一步,若${X^ \triangleleft } = (A, B)且{(A, B)^ \triangleright } = X$,则称(X,(AB))为对象导出三支概念,简称为OE-概念. 已经证明,形式背景K的全体对象导出三支概念构成一个完全格,并称之为对象导出三支概念格,记做OEL(K).

    OEL(K)中存在一类对象诱导的三支概念,两类属性诱导的三支概念,这些概念在基于三支概念分析的应用中发挥着重要作用,具体定义如下.

    定义 3  给定一个形式背景K=(GMI),xGaM. 称($x^{\triangleleft \triangleright}, x^{\triangleleft}$)为对象诱导的三支概念,称(a*${a^{* \triangleleft }}$)为Ⅰ型属性诱导的三支概念,称(a*${a^{\bar * \triangleleft }}$)为Ⅱ型属性诱导的三支概念.

    例 1  给定一个形式背景K=(GMI),如表 1所示,其中共包含4个对象和5个属性,用符号"×"表示某个对象具有某个属性. 形式背景K的对象导出三支概念格OEL(K),如图 1所示.

    形式背景K的对象导出三支概念格OEL(K)中包含4个对象诱导的三支概念,分别为:对象1诱导的(1,(acebd)),对象2诱导的(2,(bdace)),对象3诱导的(3,(abecd))和对象4诱导的(4,(abcde)).

    此外,OEL(K)中包含5个Ⅰ型属性诱导的三支概念,分别为:属性a诱导的(134,(a,Ø)),属性b诱导的(234,(bØ)),属性c诱导的(14,(acØ)),属性d诱导的(24,(bde))和属性e诱导的(13,(aed)).

    再者,OEL(K)中包含5个Ⅱ型属性诱导的三支概念,分别为:属性a诱导的(2,(bdace)),属性b诱导的(1,(acebd)),属性c诱导的(23,(bc)),属性d诱导的(13,(aed))和属性e诱导的(24,(bde)).

  • 概念簇[27]建立于经典概念格的基础之上,只考虑了对象具有的共同属性. 然而,在许多情况下,不仅要考虑对象具有的共同属性,还需要考虑对象都不具有的属性. 在现代范畴理论的启发下,本文在三支概念分析的基础上提出三支概念簇.

  • 本质上,概念簇刻画了一组具有家族相似性的概念. 在此基础上,我们提出三支概念簇,用以描述具有家族相似性的三支概念集合.

    定义 4  给定一个形式背景K=(GMI),xGaM. 若

    则称t(xa)为对象x和属性a诱导的Ⅰ型三支概念簇.

    定义 5  给定一个形式背景K=(GMI),xGaM. 若

    则称t(xa~)为对象x和属性a诱导的Ⅱ型三支概念簇.

    性质 1  给定一个形式背景K=(GMI),xGaM. 三支概念簇t(xa)和t(xa~)均是OEL(K)的子格.

      首先,由形式背景K=(GMI)的有限性可知OEL(K)是有限的,进而可知t(xa)是有限的. 其次,t(xa)中存在唯一的最大元(a*${a^{* \triangleleft }}$),且存在唯一的最小元($x^{\triangleleft \triangleright}, x^{\triangleleft}$). 综上可知,三支概念簇t(xa)是OEL(K)的一个子格.

    同理可证t(xa~)也是OEL(K)的一个子格. 证毕.

    定义 6  给定一个形式背景K=(GMI),xGaM. 称t(xØ)为对象x诱导的三支概念簇,称t(Øa)为属性a诱导的Ⅰ型三支概念簇,称t(Øa~)为属性a诱导的Ⅱ型三支概念簇.

    实际上,对于对象x和属性a诱导的Ⅰ型三支概念簇t(xa),令a=Ø,即可得到对象x诱导的三支概念簇t(xØ);对偶地,令x=Ø,即可得到属性a诱导的Ⅰ型三支概念簇t(Øa).

    对于对象x和属性a诱导的Ⅱ型三支概念簇t(xa~),令x=Ø,即可得到属性a诱导的Ⅱ型三支概念簇t(Øa~).

    例开 2  对于例1中的形式背景K,考察其上的三支概念簇如下.

    形式背景K中包含4个对象诱导的三支概念簇,分别为:

    对象1诱导的t(1,Ø)={(1,(acebd)),(13,(aed)),(14,(acØ)),(134,(aØ)),(1234,(ØØ))};

    对象2诱导的t(2,Ø)={(2,(bdace)),(23,(bc)),(24,(bde)),(234,(bØ)),(1234,(ØØ))};

    对象3诱导的t(3,Ø)={(3,(abecd)),(13,(aed)),(23,(bc)),(34,(abØ)),(134,(aØ)),(234,(bØ)),(1234,(ØØ))};

    对象4诱导的t(4,Ø)={(4,(abcde)),(14,(acØ)),(24,(bde)),(34,(abØ)),(134,(aØ)),(234,(bØ)),(1234,(ØØ))}.

    形式背景K中包含5个属性诱导的Ⅰ型三支概念簇,分别为:

    属性a诱导的t(Øa)={(134,(aØ)),(34,(abØ)),(14,(acØ)),(13,(aed)),(3,(abecd)),(1,(acebd)),(4,(abcde)),(Ø,(abcdeabcde))};

    属性b诱导的t(Øb)={(234,(bØ)),(23,(bc)),(34,(abØ)),(24,(bde)),(2,(bdace)),(3,(abecd)),(4,(abcde)),(Ø,(abcdeabcde))};

    属性c诱导的t(Øc)={(14,(acØ)),(1,(acebd)),(4,(abcde)),(Ø,(abcdeabcde))};

    属性d诱导的t(Ød)={(24,(bde)),(2,(bdace)),(4,(abcde)),(Ø,(abcdeabcde))};

    属性e诱导的t(Øe)={(13,(aed)),(3,(abecd)),(1,(acebd)),(Ø,(abcdeabcde))}.

    形式背景K中包含5个属性诱导的Ⅱ型三支概念簇,分别为:

    属性a诱导的t(Øa~)={(2,(bdace)),(Ø,(abcdeabcde))};

    属性b诱导的t(Øb~)={(1,(acebd)),(Ø,(abcdeabcde))};

    属性c诱导的t(Øc~)={(23,(bc)),(3,(abecd)),(2,(bdace)),(Ø,(abcdeabcde))};

    属性d诱导的t(Ød~)={(13,(aed)),(1,(acebd)),(3,(abecd)),(Ø,(abcdeabcde))};

    属性e诱导的t(Øe~)={(24,(bde)),(4,(abcde)),(2,(bdace)),(Ø,(abcdeabcde))}.

  • 三支概念簇是具有家族相似性的三支概念集合,三支概念簇的运算在本质上是集合的运算,首先给出三支概念簇的运算性质.

    性质 2  给定一个形式背景K=(GMI),xGaM. 以下命题成立:

    1) $t(x, a) = t(x, \emptyset ) \cap t(\emptyset , a);$

    2) $t\left( {x, {a^ \sim }} \right) = t(x, \emptyset ) \cap t\left( {\emptyset , {a^ \sim }} \right).$

      1) 一方面,t(xØ)由OEL(K)中所有大于等于($x^{\triangleleft \triangleright}, x^{\triangleleft}$)且小于等于(G,$G^{\triangleleft}$)的三支概念组成. 另一方面,t(Øa)由OEL(K)中所有大于等于(Ø${\emptyset ^ \triangleleft }$)且小于等于(a*${a^{* \triangleleft }}$)的三支概念组成. 综合两个方面,由t(xa)的定义可知t(xa)=t(xØ)∩t(Øa). 命题1)成立.

    2) 同理可证命题2成立,证毕.

    性质2实际上给出了利用对象诱导和属性诱导的三支概念簇计算任意三支概念簇的方法. 例如,考虑例2中的三支概念簇,利用性质2及例2的计算结果可得:

    t(1,a)=t(1,Ø)∩t(Øa)={(1,(acebd)),(13,(aed)),(14,(acØ)),(134,(aØ)),(1234,(ØØ))}∩{(134,(aØ)),(34,(abØ)),(14,(acØ)),(13,(aed)),(3,(abecd)),(1,(acebd)),(4,(abcde)),(Ø,(abcdeabcde))}={(1,(acebd)),(13,(aed)),(14,(acØ)),(134,(aØ))}.

    性质 3  给定一个形式背景K=(GMI),xGaM. 以下命题成立:

    1) 若I(xa)=0,则t(xa)=Ø

    2) 若I(xa)=1,则t(xa~)=Ø

    3) $OEL(K) = \left( {\bigcup\limits_{x \in G} t (x, \emptyset )} \right) \cup \left( {\emptyset , {\emptyset ^ \triangleleft }} \right);$

    4) $OEL(K) = \left( {\bigcup\limits_{a \in M} t (\emptyset , a) \cup t\left( {\emptyset , {a^ \sim }} \right)} \right) \cup \left( {G, {G^ \triangleleft }} \right).$.

      1) 若I(xa)=0,则概念$\left( {{x^{ \triangleleft \triangleright }}, {x^ \triangleleft }} \right)$$\left( {{a^*}, {a^{* \triangleleft }}} \right)$是不可比的,所以OEL(K)中不存在大于等于$\left( {{x^{ \triangleleft \triangleright }}, {x^ \triangleleft }} \right)$且小于等于$\left( {{a^*}, {a^{* \triangleleft }}} \right)$的概念,根据t(xa)的定义可得t(xa)=Ø. 命题1)成立.

    2) 同理可证命题2成立.

    3) 若t(xØ)中的最小元与最大元分别为$\left( {{x^{ \triangleleft \triangleright }}, {x^ \triangleleft }} \right)$$\left( {G, {G^ \triangleleft }} \right)$,则$\bigcup\limits_{x \in G} t (x, \emptyset )$即为OEL(K)中大于等于所有对象诱导的且小于等于$\left( {G, {G^ \triangleleft }} \right)$的三支概念. 因此易得$OEL(K) = \left( {\bigcup\limits_{x \in G} t (x, \emptyset )} \right) \cup (\emptyset , \left. {{\emptyset ^ \triangleleft }} \right)$. 命题3成立.

    4) 同理可证命题4成立,证毕.

    需要指出的是,$OEL(K) = \left( {\bigcup\limits_{a \in M} t (\emptyset , a)} \right) \cup \left( {G, {G^ \triangleleft }} \right)$$OEL(K) = \left( {\bigcup\limits_{a \in M} t \left( {\emptyset , {a^ \sim }} \right)} \right) \cup \left( {G, {G^ \triangleleft }} \right)$均不一定成立.

    在例2中,$OEL(K) = \left( {\bigcup\limits_{a \in M} t (\emptyset , a)} \right) \cup \left( {G, {G^ \triangleleft }} \right)$成立,但$OEL(K) = \left( {\bigcup\limits_{a \in M} t (\emptyset , {a^ \sim })} \right) \cup \left( {G, {G^ \triangleleft }} \right)$不成立. 实际上,$OEL(K) = \left( {\bigcup\limits_{a \in M} t (\emptyset , {a^ \sim })} \right) \cup \left( {G, {G^ \triangleleft }} \right) \cup (134, (a, \emptyset )) \cup (234, (b, \emptyset )) \cup (14, (ac, \emptyset ) \cup (34, (ab, \emptyset ))$.

  • 在信息检索的过程中,经常会请求系统推荐一类和某种已知对象类似,且具有或不具有某些特殊限定的对象. 如在网上购物系统中,顾客通常会要求客服进行产品的合理推荐,如:"请给我推荐一款与2号模特上身穿的相似,并且是深蓝色的,但不含拉链的外套",这种需求可以形式化地表述为:用G表示对象的集合,M表示属性的集合,在G中查找与对象x相似,且具有属性a,但不具有属性b的对象.

    基于以上讨论,下面提出算法1以实现符合特定约束条件下的相似对象检索.

    算法 1  基于三支概念簇的相似对象查找算法.

    输入:形式背景K=(GMI),对象xG,属性abM.

    输出:与对象x相似,且具有属性a,但不具有属性b的所有对象.

    步骤1:建立形式背景K的对象导出三支概念格OEL(K);

    步骤2:计算三支概念簇t(Øa)与t(Øb~);

    步骤3:计算t(Øa)∩t(Ø,b~),并记其中全体对象诱导的三支概念的外延为集合E;

    步骤4:从概念$\left( {{x^{ \triangleleft \triangleright }}, {x^ \triangleleft }} \right)$开始,逐层遍历其父概念:

    记当前遍历的概念为(X,(AB));

    XEØ,则X∩E中包含的对象即为所求.

    步骤5:返回结果,算法结束.

    例 3  表 2描述了一个由8种生物构成的形式背景,也就是在形式概念分析理论研究中广为熟知的"生物和水"形式背景,其对象导出三支概念格如图 2所示. 由于所有的生物都需要水,这里不再考虑"需要水"这个生物属性,只考虑其余的8种生物属性. 用数字1到8分别代表蚂蝗、鱼、蛙、狗、水草、芦苇、豆与玉米. 另外,用小写字母ah表示8种生物属性,即:在水中生活、在陆地生活、有叶绿素、双子叶、单子叶、能运动、有四肢与会哺乳.

    为了更好地说明上述提出的基于三支概念簇的相似对象查找算法,我们将通过实际案例来进一步对基于概念簇和三支概念簇的相似对象查找算法进行分析对比.

    首先,使用上述算法1,查找和芦苇(对象6)相似,且有叶绿素(具有属性c),但不能在陆地生活(不具有属性b)的生物.

    输入:"生物和水"形式背景,对象6∈G,属性cbM.

    输出:与对象6相似,且具有属性c,但不具有属性b的所有对象.

    步骤1:建立"生物和水"形式背景的对象导出三支概念格,如图 2所示;

    步骤2:计算三支概念簇t(Øc)={(Ø,(abcdefghabcdefgh)),(5,(acebdfgh)),(6,(abcedfgh)),(7,(bcdaefgh)),(8,(bceadfgh)),(56,(acedfgh)),(68,(bcedfgh)),(78,(bcafgh)),(568,(cedfgh)),(678,(bcfgh)),(5678,(cfgh))},t(Øb~)={(Ø,(abcdefghabcdefgh)),(1,(afbcdegh)),(2,(afgbcdeh)),(5,(acebdfgh)),(12,(afbcdeh)),(15,(abdgh)),(125,(abdh))};

    步骤3:计算t(Øc)∩t(Øb~)={(Ø,(abcdefghabcdefgh)),(5,(acebdfgh))},并记其中全体对象诱导的三支概念的外延为集合E={5};

    步骤4:从概念$\left( {{x^{ \triangleleft \triangleright }}, {x^ \triangleleft }} \right)$=(6,(abcedfgh))开始,逐层遍历其父概念:

    遍历其第一层父概念得到(56,(acedfgh))与(68,(bce,dfgh)),由{5,6}∩{5}={5}≠Ø可知对象5满足算法要求;由{68}∩{5}=Ø可知不满足算法要求,舍弃;综上可得,对象5即为所求.

    步骤5:返回结果对象5,即符合条件的生物是水草,算法结束.

    接下来,使用文献[27]所提出的基于对象直观图与概念簇的相似对象查找算法,查找和芦苇(对象6)相似,且有叶绿素(具有属性c),但不能在陆地生活(不具有属性b)的生物.

    输入:"生物和水"形式背景,对象6∈G,属性cbM.

    输出:与对象6相似且具有属性c的所有对象.

    步骤1:建立"生物和水"形式背景的对象直观图与概念格,见文献[27];

    步骤2:在步骤1的对象直观图中查找大于等于(6,6*)的所有二元组,可得最大二元组仍为(6,6*);

    步骤3:计算AC(6,c)=C(6**c**)={(6,abce),(56,ace),(68,bce),(568,ce),(678,bc),(5678,c)};

    步骤4:对于AC(6,c)中存在的概念(56,ace)=(5**,5*)和(68,bce)=(8**,8*),可得符合条件的对象为5和8;

    步骤5:返回结果对象5和对象8,即符合条件的生物是水草和玉米,算法结束.

    综上所述,针对同一个案例,对比两个算法可知,使用基于对象直观图与概念簇的算法只能检索和芦苇(对象6)相似且有叶绿素(具有属性c)的生物,无法检索其中不能在陆地生活(不具有属性b)的生物,即属性b无法被按需使用,最终得到的结果是水草(对象5)和玉米(对象8). 虽然此算法得到两种结果,但是根据常识可知,算法1得到的结果水草和基于对象直观图与概念簇的算法得到的结果之一玉米相比较更加符合条件. 因此,三支概念簇相比较于概念簇,更加有利于检索到符合需求的对象.

    通过深入思考发现,三支概念簇之所以更加有利于检索到符合需求的对象,原因在于三支概念不仅考虑了对象共同具有的属性,而且还考虑了对象共同不具有的属性,使得三支概念比经典形式概念能够捕捉到更加精确的对象细节,从而发现更加细致的对象分类,检索到更加贴切实际应用场景的相似对象.

  • 本文融合现代范畴理论与三支概念分析,提出了三支概念簇. 研究结果表明,三支概念簇刻画了具有"家族相似性"的三支概念集合,是检索符合特定约束条件下相似对象的有力工具. 三支概念簇作为三支概念分析中的重要粒度之一,还有许多值得深入探讨的问题. 例如:模糊形式背景下的模糊概念簇如何定义,与经典二值形式背景下的三支概念簇有何区别与联系;在动态环境下,三支概念簇如何更新;对于大规模形式背景,如何提高三支概念簇的计算效率. 最后,需要指出的是概念簇建立在形式概念的基础之上,构造概念格的复杂性限制了其大规模应用的有效性. 因此,如何采用新的思路,从新的角度研究概念簇还需要付出更多的努力.

参考文献 (27)

目录

/

返回文章
返回