期刊介绍
期刊导读
- 03/14预防小麦条锈病 陕西省农业农村厅发布提醒
- 03/14章丘区枣园街道:发展壮大特色农业产业,绘出
- 03/14“艺术+景观”颠覆传统农业……成都又一网红打
- 03/14高人气Steam沙盒游戏推荐,《ATLAS》农业发展是立
- 03/14农业重大科技成果!桑叶、蚕蛹有如此医药功效
基于可拓语义的农产品生产销售知识检索(2)
其中,P(C)表示概念C出现的概率;n(C)表示概念C在物元中出现的次数;N(O)是物元中概念的总数;表示概念C的子概念集合。
计算概念C1,C2的相似度,计算方法可表示为:
其中,是节点C1,C2的最相邻的共同祖先,包含二者的共同信息。在该公式中,首先取C1,C2两个节点的公共信息,然后根据该信息和它的子概念在C1,C2最相邻的共同祖先节点中出现的次数计算出概率。最后根据概率即可求得两个概念节点的C1,C2相似度。
通过该方式对两个概念的相似度粗略计算后,需对其语义距离进行计算以提高准确率。
3.2 基于语义距离的语义相似度
将农业知识的物元以树形结构进行存储,计算两个概念的语义距离,需从树状图中分析两个节点之间的距离。由于两个节点之间的路径不同,距离也就不同,本文以二者之间的最短路径为准[15]。同时,将语义距离的单位距离统一为1。两个概念节点C1,C2的语义距离表示为:
Distance(C1,C2)表示概念 C1,C2节点之间的语义距离,Length(Li)表示在连接 C1,C2两个概念的最短路径中,第i条边Li的长度。这样一来,概念之间的语义距离为:
上述将语义距离的单位距离定为 1,概念之间的语义距离可以定义为:
其中,Number(C1, C2)表示连接两个概念的最短路径的边数。但是,这样的计算方法消除了权重以及边的关系类型对结果的影响,因此引入节点深度和节点密度两个影响因子。
节点深度即概念节点在形成的结构树中的深度,若语义距离一定时,两个节点的深度越大,概念划分的准则越细致,则概念之间的相似度越大[16]。另Depth(C)表示概念C的节点深度,对于概念C1,C2,深度影响因子可以定义为:
且 Dep(C1,C2)>1。
节点密度是针对于两个概念节点的最近公共父节点而言,当此节点所产生的直接子节点越多,它的节点密度越大,子节点之间的关联程度越大,语义相似度也就越大[17]。同样定义Density(C)为节点C的子节点数量,是节点C1,C2的最近公共父节点,节点密度影响因子定义为:
其中,Degree(O)为在由物元形成的整颗树中,最大的度。
综上所述,这些条件对语义相似度的结果都有影响,为保证计算的准确度,本文引入加权概念,根据对结果影响程度,对各个影响因素分配不同的权值。经过分析,得到的加权之后的语义相似度计算公式为:
其中,α+β+γ=1
3.3 基于属性的语义相似度
每个属性都是对概念的一种描述,如果两个概念之间属性值相同或是相似,也能够在一定程度上反应两个概念之间的相似程度。通过参考文献[6]得出:
在式(12)(13)中,Pro(C1∩C2)表示概念C1,C2属性的交集,即二者的公共属性;Pro(C1–C2)表示概念的差集,即概念C1有而C2没有的属性,同理Pro(C1–C2)表示概念C2有而C1没有的属性;D(C1)和D(C2)表示在形成的物元结构的树中,概念所在的深度。
3.4 加权语义相似度
经过对语义相似度影响因素的研究,我们得到信息、语义距离、属性等三个影响因子,但若计算综合语义相似度需要结合3.1-3.3中介绍的三种情况[18-20]。通过请教专业领域的专家得知,三种影响因子对计算结果的影响程度不尽相同,因此,得到最后的加权语义相似度计算公式:
4 案例研究
随着互联网的发展,工作生活中的各项服务越发智能化,各应用系统迫切需要高准确性的语义相似度算法,农产品相关系统也不例外。
本文抽取部分实验数据进行语义相似度计算,这些实验数据形成的结构树如图2所示。
图2 结构树Fig.2 Structure tree
4.1 实例计算
经过查阅相关资料与市场调查,选定对生产销售影响较大的属性,现选取物元中部分属性进行举例,价格定为市场调查当日的数值。本文选取的几种概念的部分属性如表1所示。
下面以计算“生菜”“小白菜”为例,计算二者的语义相似度,过程如下。
根据图 2物元树状图,计算“生菜”和“小白菜的”语义相似度。为了确定各个权值和参数,进行了大量的数据研究和实际考察,采用专家经验和试错法,得到结果α=0.5,β=0.2,γ=0.3,ω1=0.2,ω2=0.1,ω3=0.7。
表1 农作物物元的部分属性Tab.1 Some attributes of crop matter elements农作物 所属科 主要颜色 食用部位 性质 口感 用途 产地 价格/kg金桔 芸香科 金黄色 果实 温性 味辛甘酸 水果 尤溪 14.3莲藕images/BZ_23_536_836_571_884.png科 白色 茎 寒性 微甜而脆 蔬菜 邯郸 5.0小白菜 十字花科 深绿色 叶片/叶柄 凉性 味甘 蔬菜 淮安 1.4生菜 菊科 绿色 叶片/叶柄 凉性 味甘 蔬菜 邯郸 3.2豆角 豆科 碧绿 果皮/种子 平性 味甘 蔬菜 聊城 4.0柠檬 芸香科 黄色 果实 平性 味甘酸 水果 安岳 6
文章来源:《农业与技术》 网址: http://www.nyyjszzs.cn/qikandaodu/2021/0313/1519.html
上一篇:内燃机机械增压技术与性能评价分析
下一篇:新农村建设环境下农业经济管理优化策略研究