Uploaded by game happy

一种基于黄金引用算法的论文推荐方法

advertisement
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 108763328 A
(43)申请公布日 2018.11.06
(21)申请号 201810432225 .2
(22)申请日 2018 .05 .08
(71)申请人 北京市科学技术情报研究所
地址 100044 北京市西城区西直门外大街
140号
(72)发明人 吴晨生 杜丽萍
黄玉荣
李梦辉
刘静
(74)专利代理机构 北京元中知识产权代理有限
责任公司 11223
代理人 王明霞
(51)Int .Cl .
G06F 17/30(2006 .01)
权利要求书3页
CN 108763328 A
(54)发明名称
一种基于黄金引用算法的论文推荐方法
(57)摘要
本发明公开了一种基于黄金引用算法的论
文推荐方法,
包括以下步骤:
首先,
在论文数据库
中选定论文群体范围 ;
其次 ,
依据所选定论文群
体中论文的相互引用关系构建初始引用网络模
型;
然后,
标定初始引用网络模型中论文的引用
属性,
并通过自引系数修订引用次数,
生成自引
修订论文群体;
最后,
迭代的缩小自引修订论文
群体的范围,
直至结果收敛,
得出黄金引用论文。
通过标定论文的引用属性,
排除论文引用关系中
自引的干扰,
再依据自引修订引用次数,
递归地
缩小论文群体,
排除低质低效他引论文的干扰,
使得用户快速、
准确的检索到高质量论文。
说明书10页
附图3页
CN 108763328 A
权
利
要
求
书
1/3 页
1 .一种基于黄金引用算法的论文推荐方法,
其特征在于:
包括以下步骤:
首先,
在论文
数据库中选定论文群体范围;
其次,
依据所选定论文群体中论文的相互引用关系构建初始
引用网络模型;
然后,
标定初始引用网络模型中论文的引用属性,
并通过自引系数修订引用
次数,
生成自引修订论文群体;
最后,
迭代的缩小自引修订论文群体的范围,
直至结果收敛,
得出黄金引用论文。
2 .根据权利要求1所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
所述初
始引用网络模型为:
G=(V ,E) ,
G=(V ,E)是由|V|=N个论文节点和|E|=M条边所组成的一
个有向网络;
其中,
G代表论文群体中论文以及论文间引用关系的集合,
V代表论文群体G中
的论文集合,
E代表论文群体G中论文间的引用关系。
3 .根据权利要求1-2任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
引入引用变量ei ,j ,
ei ,j代表论文群体G中论文vi 与论文vj的引用关系,
若论文vi被论文vj 引
用,
则ei ,j等于1;
若论文vi未被论文vj引用,
则ei ,j等于0,
其中i≥1,
j≥1;
在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei ,j累加得到,
则建立第i
篇论文在论文群体G中的被引次数关系式为
4 .根据权利要求1-3任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
所述标定论文引用属性,
步骤如下:
根据论文作者判定论文的引用关系是自引还是他引,
若
论文vi被论文vj引用,
当论文vi与论文vj中没有相同作者,
则该次引用为他引;
当论文vi与论
文vj中至少有一个相同作者,
则该次引用为自引。
5 .根据权利要求1-4任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
依据论文引用属性,
引入自引系数λi ,j ,
若论文vi与被引论文vj为自引关系,
则λi ,j等于0;
若
论文vi与被引论文vj为他引关系,
则λi ,j等于1;
其中,
i≥1,
j≥1。
6 .根据权利要求1-5任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
论文vi被论文vj 引用且为自引,
则引用系数ei ,j与自引系数λi ,j的乘积为0;
论文vi被论文vj
引用且为他引,
则引用变量ei ,j与自引系数λi ,j的乘积为1;
通过对引用变量ei ,j与自引系数
λi ,j的乘积相累加,
排除了第i篇论文在初始引用网络模型中的自引用关系,
则建立第i篇论
文在论文群体中的自引修订引用次数公式为
其中,
i≥1,
j≥1。
7 .根据权利要求1-6任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
依据自引修订引用次数为
生成自引修订论文群体G ',
从而构建出自引修
订网络模型G '=(V ',E ') ;
G '=(V ',E ')是由|V '|=N个节点和|E '|=M '条边所组成的一个
有向网络。
8 .根据权利要求1-7任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
引入被引次数设定值k ,k依次由小到大取值,
采用迭代删除的方式逐层缩小论文群体的范
围,
直至结果收敛,
其中,
k为整数,
且k≥0。
9 .根据权利要求1-8任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在于:
k
k
k
k
第k层的初始论文群体为G 时,
G 中含有|V |=Nk个节点,
即含有Nk篇论文,
|E |=Mk条边,
第
2
权
CN 108763328 A
利
要
求
书
2/3 页
i篇论文在论文群体Gk中的被引次数关系式为
采用迭代的方式缩小Gk的范围,
删除Gk中被引次数
等于k的论文及其引用
关系,
生成论文群体Gk ,1 ,
第i篇论文在论文群体Gk ,1中的被引次数关系式为
继续删除Gk ,1中
小于和/或等于k的论文及其引用关系,
并生成论文群体Gk ,2 ,
继续迭代
删除,
直至生成论文群体Gk ,q ,
且Gk ,q中论文被至少k+1篇Gk ,q中的论文引用 ,形成第k+1层的
初始论文群体,
即Gk ,q记作Gk+1 ;
每层迭代删除的论文组成论文群体Dk ,
删除后的论文群体G k+1中含有|Vk+1 |=Nk+1 个节
点,
即含有Nk+1篇论文,
|Ek+1|=Mk+1条边,
第i篇论文在论文群体Gk+1中的被引次数关系式为
且被引次数大于k,
其中,
k、
q为整数,
且k≥0,
q≥1。
10 .根据权利要求1-9任一所述的一种基于黄金引用算法的论文推荐方法,
其特征在
0
于:
以自引修订论文群体G '为初始论文群体,
G =G ',
采用迭代删除的方式逐层缩小论文群
体的范围,
当k大于和/或等于n时,
终止删除论文节点,
论文群体收敛 ,得出黄金引用论文,
其中n为整数,
且n≥0,
具体包括以下步骤:
S11 .k=0,
删除G0中自引修订引用次数
,1
等于0的论文及其引用关系,
生成论文群体G0
,
第i篇论文在论文群体G0 ,1中的被引次数关系式为
继续删除G0 ,1中
等
于0的论文及其引用关系,
并生成论文群体G0 ,2 ,
继续迭代删除,
直至生成论文群体G0 ,q ,
且G0
,q
中论文被其他至少1篇G0 ,q中的论文引用,
其中G0 ,q记作G1 ,
迭代删除的论文组成论文群体
1
1
1
D0 ,
论文群体缩小为G ,
G 中含有|V |=N1个节点,
即含有N1篇论文,
|E1|=M1条边,
第i篇论文
在论文群体G1中的被引次数关系式为
其中,
q为整数,
且q≥1;
S12 .k=1,
删除论文群体G1中自引修订引用次数
等于1的论文及其引用关系,
生成论
文群体G1 ,1 ,
第i篇论文在论文群体G1 ,1中的被引次数关系式为
中
继续删除G1 ,1
小于或等于1的论文及其引用关系,
并生成论文群体G1 ,2 ,
继续迭代删除,
直至生成论
文群体G1 ,q ,
且G1 ,q中论文被其他至少2篇G1 ,q中的论文引用,
其中G1 ,q 记作G2 ,
迭代删除的论
文组成论文群体D1 ,
论文群体缩小为G2 ,
含有论文数量为|V2|=N2篇,
第i篇论文在论文群体
G2中的被引次数关系式为
其中,
q为整数,
且q≥1;
等于2的论文及其引用关系,
生成论文群体G2
S13 .k=2,
删除G2中自引修订引用次数
,1
,
第i篇论文在论文群体G2 ,1中的被引次数关系式为
继续删除G2 ,1中
小
于或等于2的论文及其引用关系,
并生成论文群体G2 ,2 ,
继续迭代删除,
直至生成论文群体G2
,q
,
且G2 ,q中论文被其他至少3篇G2 ,q中的论文引用,
其中G2 ,q记作G3 ,
迭代删除的论文组成论
3
3
文群体为D2 ,
论文群体缩小为G ,
含有论文数量为|V |=N3篇,
第i篇论文在论文群体G3中的
3
权
CN 108763328 A
被引次数关系式为
利
要
求
书
3/3 页
其中,
q为整数,
且q≥1;
S14 .依照步骤S11-S13,
继续迭代删除边缘性论文,
当k=n时,
删除Gn中自引修订引用次
数
等于n的论文及其引用关系,
生成论文群体Gn ,1 ,
第i篇论文在论文群体Gn ,1中的被引次
继续删除Gn ,1中
数关系式为
小于或等于n的论文及其引用关系,
并生成
论文群体Gn ,2 ,
继续迭代删除,
直至生成论文群体Gn ,q ,
且Gn ,q中论文被其他至少n+1篇Gn ,q中
的论文引用,
其中Gn ,q记作Gn+1 ,
迭代删除的论文组成论文群体为Dn ,
论文群体缩小为Gn+1 ,
Gn
+1
含有论文数量为|Vn+1|=Nn+1篇为黄金引用论文,
其中n,
q为整数,
且n≥0,
q≥1;
优选的,
Nn-1-Nn小于和/或等于某一设定值时,
终止删除论文节点,
论文群体收敛为Gn ,
其中n为整数,
且n≥0;
优选的,
Nn小于和/或等于某一设定值时,
终止删除论文节点,
论文群体收敛为Gn ,
其中n
为整数,
且n≥0;
优选的,
小于和/或等于某一设定值时,
终止删除论文节点,
论文群体收敛为G n ,
其
中n为整数,
且n≥0。
4
CN 108763328 A
说
明
书
1/10 页
一种基于黄金引用算法的论文推荐方法
技术领域
[0001] 本发明属于大数据论文检索推荐技术领域,
具体地说涉及一种基于黄金引用算法
的论文推荐方法。
背景技术
[0002] 基于推荐信息的不同,
论文推荐主要分为基于内容的推荐,
基于协同过滤的推荐,
社会化推荐和混合模型推荐。在论文的推荐系统当中,
还存在着一种特殊的基于引用的推
荐,
但从数量庞大、
良莠不齐的文献资料中获取具有较高质量的科技论文是一项非常困难
的工作,
如何有效的自动评估科技论文质量成为了研究课题。被引次数是一项客观且直观
的衡量论文质量的指标,
论文引用包括作者在后来的论文中自我引用和他人的引用两种,
自引次数的多少与论文的质量评估关系不大,
而在统计引用次数时并不对二者做出区分,
这是利用引用次数对科技论文进行评价时的一个局限性。
同时,
各个论文的诸多施引论文
不能认为具有同等的质量或影响力,
使得论文的被引次数无法完全体现论文质量。
[0003] 现有技术中,
基于论文引用次数提出了h指数、
g指数,
用于评估研究人员的学术产
出数量与学术产出水平,
但其排序的基础数据并没有进行处理,
在实际应用中不能准确地
反映真实情况。被引频次标准化虽然消除学科领域、文献类型、
出版时间等因素的影响,
实
现跨学科或跨领域的比较,
但统计数据庞大且计算繁琐,
科研工作者或文献研究工作者无
法快速识别某一领域或学科的关键论文群。
[0004] 现有技术公开了一种基于引用关系分布式表达的论文推荐方法,
利用分布式向量
来表达论文在权重引用网络当中的上下文,
然后利用该向量计算论文之间的相似度,
达到
论文推荐的目的。该申请只考虑了论文之间引用的相似度或论文内容的相似度,
但并不能
完全体现论文的质量。
[0005] 有鉴于此特提出本发明。
发明内容
[0006] 本发明要解决的技术问题在于克服现有技术的不足,
提供一种基于黄金引用算法
的论文推荐方法,
通过黄金引用算法排除自引论文和低质低效的他引论文的干扰,
使得用
户可快速、
准确的检索到高质量论文。
[0007] 为解决上述技术问题,
本发明采用技术方案的基本构思是:
一种基于黄金引用算
法的论文推荐方法,
包括以下步骤:
首先,
在论文数据库中选定论文群体范围;
其次,
依据所
选定论文群体中论文的相互引用关系构建初始引用网络模型;
然后,
标定初始引用网络模
型中论文的引用属性,
并通过自引系数修订引用次数,
生成自引修订论文群体;
最后,
递归
的缩小自引修订论文群体的范围,
直至结果收敛,
得出黄金引用论文。本申请中的黄金引用
算法模型,
排除了引用次数中的自引,
从而避免了自引在论文评价中的干扰,
又通过迭代删
除的方式排除了引用次数统计中低质低效的他引干扰,
提高了对高质量论文识别的准确
性,
并且该算法简单易于实行,
用户运用该算法对论文群体中的高质量论文进行统计、
计算
5
说
CN 108763328 A
明
书
2/10 页
较为方便。
[0008] 进一步,
所述初始引用网络模型为:
G=(V ,E) ,
G=(V ,E)是由|V|=N个论文节点和
|E|=M条边所组成的一个有向网络;
其中,
G代表论文群体中论文与论文间引用关系的集
合,
V代表论文群体G中的论文集合,
E代表论文群体G中论文间的引用关系。
[0009] 进一步,
引入引用变量ei ,j ,
ei ,j代表论文群体G中论文vi与论文vj的引用关系,
若论
文vi被论文vj引用,
则ei ,j等于1;
若论文vi未被论文vj引用,
则ei ,j等于0,
其中i≥1,
j≥1;
[0010] 在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei ,j 累加得到,
则建
立第i篇论文在论文群体G中的被引次数关系式为
其中,
[0011]
进一步,
所述标定论文引用属性,
步骤如下:
根据论文作者判定论文的引用关系是
自引还是他引,
若论文vi被论文vj 引用,
当论文vi 与论文vj中没有相同作者,
则该次引用为
他引;
当论文vi与论文vj中至少有一个相同作者,
则该次引用为自引。
[0012] 进一步,
依据论文引用属性,引入自引系数λi ,j ,
若论文vi 与被引论文v j为自引关
系,
则λi ,j等于0;
若论文vi与被引论文vj为他引关系,
则λi ,j等于1;
其中,
i≥1,
j≥1。
[0013] 进一步,
论文vi被论文vj引用且为自引,
则引用变量ei ,j与自引系数λi ,j的乘积为0;
论文vi被论文vj 引用且为他引,
则引用变量ei ,j与自引系数λi ,j的乘积为1;
通过对引用变量
ei ,j与自引系数λi ,j的乘积相累加,
排除了第i篇论文在初始引用网络模型中的自引用关系,
则建立第i篇论文在论文群体中的自引修订引用次数公式为
其中,
i≥1,
j≥1。
[0014]
生成自引修订论文群体G ',
从
进一步,
依据自引修订引用次数为
而构建出自引修订网络模型G '=(V ',E ') ;
G '=(V ',E ')是由|V '|=N个节点和|E '|=M '条
边所组成的一个有向网络。
[0015] 进一步,
引入被引次数设定值k,
k依次由小到大取值,
采用迭代删除的方式逐层缩
小论文群体的范围,
直至结果收敛,
其中,
k为整数,
且k≥0。
k
k
[0016] 进一步,
第k层的初始论文群体为G 时,
G 中含有|Vk|=Nk个节点,
即含有Nk篇论文,
|Ek|=Mk条边,
第i篇论文在论文群体Gk中的被引次数关系式为
[0017]
采用迭代的方式缩小Gk的范围,
删除Gk中被引次数
等于k的论文及其
引 用关 系 ,生 成 论 文 群 体 G k ,1 ,第 i 篇 论 文 在 论 文 群 体 G k ,1 中 的 被 引次 数 关 系 式 为
继续删除G k ,1中
小于和/或等于k的论文及其引用关系,
并生成论文群
体Gk ,2 ,
继续迭代删除,
直至生成论文群体Gk ,q ,
且Gk ,q中论文被至少k+1篇Gk ,q论文引用,
形成
k ,q
k+1
第k+1层的初始论文群体,
即G 记作G ;
[0018] 每层迭代删除的论文组成论文群体Dk ,
删除后的论文群体Gk+1中含有|Vk+1 |=Nk+1
个节点,
即含有Nk+1篇论文,
|Ek+1|=Mk+1条边,
第i篇论文在论文群体Gk+1中的被引次数关系
6
说
CN 108763328 A
式为
明
书
3/10 页
且被引次数大于k,
其中,
k、
q为整数,
且k≥0,
q≥1。
进一步,
以自引修订论文群体G '为初始论文群体,
G0=G ',
采用迭代删除的方式逐
层缩小论文群体的范围,
当k大于和/或等于n时,
终止删除论文节点,
论文群体收敛,
得出黄
金引用论文,
其中n为整数,
且n≥0,
具体包括以下步骤:
[0019]
[0020]
S11 .k=0,
删除G0中自引修订引用次数
等于0的论文及其引用关系,
生成论文群
体G 0 ,1 ,
第i篇论文在论文群体G 0 ,1中的被引次数关系式为
继续删除G 0 ,1中
等于0的论文及其引用关系,
并生成论文群体G0 ,2 ,
继续迭代删除,
直至生成论文群体G0
,q
,
且G0 ,q中论文被其他至少1篇G0 ,q中的论文引用,
其中G0 ,q记作G1 ,
迭代删除的论文组成论
文群体D0 ,
论文群体缩小为G1 ,
G1中含有|V1|=N1个节点,
即含有N1篇论文,
|E1|=M1条边,
第i
篇论文在论文群体G1中的被引次数关系式为
[0021]
其中,
q为整数,
且q≥1;
S12 .k=1,
删除论文群体G1中自引修订引用次数
等于1的论文及其引用关系,
生
成论文群体G1 ,1 ,
第i篇论文在论文群体G1 ,1中的被引次数关系式为
G1 ,1中
继续删除
小于和/或等于1的论文及其引用关系,
并生成论文群体G1 ,2 ,
继续迭代删除,
直至
生成论文群体G1 ,q ,
且G1 ,q中论文被其他至少2篇G1 ,q中的论文引用,
其中G1 ,q 记作G2 ,
迭代删
2
2
除的论文组成论文群体D1 ,
论文群体缩小为G ,
含有论文数量为|V |=N2篇,
第i篇论文在论
文群体G2中的被引次数关系式为
[0022]
其中,
q为整数,
且q≥1;
S13 .k=2,
删除G2中自引修订引用次数
等于2的论文及其引用关系,
生成论文群
体G 2 ,1 ,
第i篇论文在论文群体G 2 ,1中的被引次数关系式为
继续删除G 2 ,1中
小于和/或等于2的论文及其引用关系,
并生成论文群体G 2 ,2 ,
继续迭代删除,
直至生成
论文群体G2 ,q ,
且G2 ,q中论文被其他至少3篇G2 ,q中的论文引用,
其中G2 ,q 记作G3 ,
迭代删除的
3
3
论文组成论文群体为D2 ,
论文群体缩小为G ,
含有论文数量为|V |=N3篇,
第i篇论文在论文
群体G3中的被引次数关系式为
[0023]
其中,
q为整数,
且q≥1;
S14 .依照步骤S11-S13,
继续迭代删除边缘性论文,
当k=n时,
删除Gn中自引修订
引用次数
等于n的论文及其引用关系 ,生成论文群体Gn ,1 ,
第i篇论文在论文群体Gn ,1中的
被引次数关系式为
继续删除Gn ,1中
小于和/或等于n的论文及其引用关
系,
并生成论文群体Gn ,2 ,
继续迭代删除,
直至生成论文群体Gn ,q ,
且Gn ,q中论文被其他至少n+
1篇Gn ,q中的论文引用,
其中Gn ,q记作Gn+1 ,
迭代删除的论文组成论文群体为Dn ,
论文群体缩小
n+1
n+1
n+1
为G ,
则结果收敛,
G 含有论文数量为|V |=Nn+1篇为黄金引用论文,
其中n,
q为整数,
且
n≥0,
q≥1;
[0024] 优选的,
Nn-1-Nn小于和/或等于某一设定值时,
终止删除论文节点,
论文群体收敛
n
为G ,
其中n为整数,
且n≥0;
7
CN 108763328 A
说
明
书
4/10 页
优选的,
Nn小于和/或等于某一设定值时,
终止删除论文节点,
论文群体收敛为Gn ,
其中n为整数,
且n≥0;
[0025]
[0026]
优选的 ,
小于和/或等于某一设定值时 ,
终止删除论文节点,
论文群体收敛为
Gn ,
其中n为整数,
且n≥0。
[0027] 论文的原始引用次数统计是将每次被引用记录均记为1,
通过论文作者对引用关
系进一步地限定,
排除论文引用关系中自引的干扰,
再根据施引论文的被引情况修订论文
的引用次数,
排除低质低效他引论文的干扰,
采用迭代方式逐层地缩小了论文群体范围,
使
得用户快速、准确的检索到高质量论文;
从而使得采用对论文引用次数评估获得高质量论
文的方法更加合理。
[0028] 采用上述技术方案后,
本发明与现有技术相比具有以下有益效果:
[0029] 1、
通过构建论文群体初始引用网络模型,
基于论文引用次数识别高质量论文,
使
得论文群中论文相互之间的引用关系更加具体直观,
且计算过程快速便捷,
选出的论文群
体具有较高的权威性。
[0030] 2、
实施自引修订引用次数,
排除了引用次数中的自引用论文,
克服了自引在论文
评价中的干扰,
使得评估出的论文质量更加合理;
同时,
采用迭代删除的方式,
排除自引修
订引用次数统计中低质低效的他引干扰;
综合考虑作者自引和低质量论文引用的干扰因
素,
对论文的初始的引用次数进行统计修订,
提高推荐系统识别高质量论文的准确性。
[0031] 下面结合附图对本发明的具体实施方式作进一步详细的描述。
附图说明
[0032] 附图作为本发明的一部分,
用来提供对本发明的进一步的理解,
本发明的示意性
实施例及其说明用于解释本发明,
但不构成对本发明的不当限定。显然,
下面描述中的附图
仅仅是一些实施例,
对于本领域普通技术人员来说,
在不付出创造性劳动的前提下,
还可以
根据这些附图获得其他附图。在附图中:
[0033] 图1是本发明中一种黄金引用论文算法的流程示意图;
[0034] 图2是本发明中一种应用黄金引用论文算法的流程示意图;
[0035] 图3是本发明中论文群体初始引用网络模型示意图;
[0036] 图4是本发明中递归删除边缘性论文的数量统计示意图。
[0037] 需要说明的是,
这些附图和文字描述并不旨在以任何方式限制本发明的构思范
围,
而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
[0038] 如图1至图4所示,
本发明介绍了一种基于黄金引用算法的论文推荐方法,
首先,
在
论文数据库中选定论文群体范围;
其次,
依据所选定论文群体中论文的相互引用关系构建
初始引用网络模型;
然后,
标定初始引用网络模型中论文的引用属性,
并通过自引系数修订
引用次数,
生成自引修订论文群体;
最后,
递归的缩小自引修订论文群体的范围,
直至结果
收敛,
得出黄金引用论文。
[0039] 如图1所示,
本实施例中,
具体包括以下步骤:
8
CN 108763328 A
说
明
书
5/10 页
[0040]
S1 .在论文数据库中选定论文群体范围;
[0041] S2 .构建选定论文群体的初始引用网络模型;
[0042] 如图3所示,
构建论文引用网络,
论文群体G=(V ,E)是由|V|=N个顶点和|E|=M条
边所组成的一个有向网络,
其中,
G代表论文群体中论文与论文间引用关系的集合,
V代表论
文群体G中的论文集合,
E代表论文群体G中论文间的引用关系;
[0043]
引入引用变量ei ,j ,
ei ,j代表论文群体G中论文vi 与论文vj的引用关系,
若论文vi被
论文vj引用,
则ei ,j等于1;
若论文vi未被论文vj引用,
则ei ,j等于0,
其中i≥1,
j≥1;
[0044] 在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei ,j 累加得到,
则建
立第i篇论文在论文群体G中的被引次数关系式为
[0045]
S3 .标定引用属性,
建立自引修订引用网络;
[0046] 首先,
根据论文的作者判断论文之间的引用关系是自引还是他引;
若论文vi被论
文vj引用,
当论文vi与论文vj中没有相同作者,
则该次引用为他引;
当论文vi与论文vj中至少
有一个相同作者,
则该次引用为自引;
[0047] 其次,
依据论文引用属性,
引入自引系数λi ,j ,
若论文vi与被引论文vj为自引关系,
则λi ,j等于0;
若论文vi与被引论文vj为他引关系,
则λi ,j等于1;
其中,
i≥1,
j≥1;
在Ei中引入
自引系数λi ,j ,
删除初始引用网络模型中第i篇论文的自引引用关系,
获得第i篇论文在论文
群体中的他引引用关系;
[0048] 最后,
论文vi被论文vj引用且为自引,
则引用变量ei ,j与自引系数λi ,j的乘积为0;
论
文vi被论文vj引用且为他引,
则引用变量ei ,j与自引系数λi ,j的乘积为1;
通过对引用变量ei ,j
与自引系数λi ,j的乘积相累加,
排除了第i篇论文在初始引用网络模型中的自引用关系,
则
建立第i篇论文在论文群体中的自引修订引用次数公式为
≥1;
依据自引修订引用次数
其中,
i≥1,
j
生成自引修订论文群体G ',
从而构建出自引修
订网络模型G '=(V ',E ') ;
G '=(V ',E ')是由|V '|=N个节点和|E '|=M '条边所组成的一个
有向网络
[0049] 如图4所示,
引入被引次数设定值k ,k依次由小到大取值,
采用迭代删除的方式逐
层缩小论文群体的范围,
直至结果收敛,
其中,
k为整数,
且k≥0。
[0050] S4 .以自引修订论文群体G '为初始论文群体,
G0=G ',
采用迭代删除的方式逐层缩
小论文群体的范围,
当k大于和/或等于n时,
终止删除论文节点,
论文群体收敛 ,得出黄金引
用论文,
其中n为整数,
且n≥0,
[0051] 如图2所示,
具体步骤如下:
[0052]
S11 .k=0,
删除G0中自引修订引用次数
等于0的论文及其引用关系,
生成论文群
体G 0 ,1 ,
第i篇论文在论文群体G 0 ,1中的被引次数关系式为
继续删除G 0 ,1中
等于0的论文及其引用关系,
并生成论文群体G0 ,2 ,
继续迭代删除,
直至生成论文群体G0
,q
,
且G0 ,q中论文被其他至少1篇G0 ,q中的论文引用,
其中G0 ,q记作G1 ,
迭代删除的论文组成论
1
1
1
文群体D0 ,
论文群体缩小为G ,
G 中含有|V |=N1个节点,
即含有N1篇论文,
|E1|=M1条边,
第i
9
CN 108763328 A
说
明
书
篇论文在论文群体G1中的被引次数关系式为
[0053]
6/10 页
其中,
q为整数,
且q≥1;
S12 .k=1,
删除论文群体G1中自引修订引用次数
等于1的论文及其引用关系,
生
成论文群体G1 ,1 ,
第i篇论文在论文群体G1 ,1中的被引次数关系式为
G1 ,1中
继续删除
小于和/或等于1的论文及其引用关系,
并生成论文群体G1 ,2 ,
继续迭代删除,
直至
生成论文群体G1 ,q ,
且G1 ,q中论文被其他至少2篇G1 ,q中的论文引用,
其中G1 ,q 记作G2 ,
迭代删
2
2
除的论文组成论文群体D1 ,
论文群体缩小为G ,
含有论文数量为|V |=N2篇,
第i篇论文
[0054]
在论文群体G2中的被引次数关系式为
[0055]
S13 .k=2,
删除G2中自引修订引用次数
其中,
q为整数,
且q≥1;
等于2的论文及其引用关系,
生成论文群
体G 2 ,1 ,
第i篇论文在论文群体G 2 ,1中的被引次数关系式为
继续删除G 2 ,1中
小于和/或等于2的论文及其引用关系,
并生成论文群体G 2 ,2 ,
继续迭代删除,
直至生成
论文群体G2 ,q ,
且G2 ,q中论文被其他至少3篇G2 ,q中的论文引用,
其中G2 ,q 记作G3 ,
迭代删除的
3
3
论文组成论文群体为D2 ,
论文群体缩小为G ,
含有论文数量为|V |=N3篇,
第i篇论文在论文
群体G3中的被引次数关系式为
[0056]
其中,
q为整数,
且q≥1;
S14 .依照步骤S11-S13,
继续迭代删除边缘性论文,
当k=n时,
删除Gn中自引修订
引用次数
等于n的论文及其引用关系,
生成论文群体Gn ,1 ,
第i篇论文在论文群体Gn ,1中的
被引次数关系式为
继续删除Gn ,1中
小于和/或等于n的论文及其引用关
系,
并生成论文群体Gn ,2 ,
继续迭代删除,
直至生成论文群体Gn ,q ,
且Gn ,q中论文被其他至少n+
1篇G n ,q中的论文引用,
论文群体收敛,
其中G n ,q 记作G n+1 ,
迭代删除的论文组成论文群体为
Dn ,
论文群体缩小为Gn+1 ,
Gn+1含有论文数量为|Vn+1|=Nn+1篇为黄金引用论文,
其中n,
q为整
数,
且n≥0,
q≥1;
[0057] 优选的,
依照步骤S11-S13,
k继续依次由小到大取值,
Nn-1-Nn小于和/或等于某一
n
n
设定值时,
终止删除论文节点,
论文群体收敛为G ,
G 含有论文数量为|Vn|=Nn篇为黄金引
用论文,
其中n为整数,
且n≥0;
。
[0058] 优选的,
依照步骤S11-S13,
k继续依次由小到大取值,
Nn小于和/或等于某一设定
n
n
值时,
终止删除论文节点,
论文群体收敛为G ,
G 含有论文数量为|Vn|=Nn篇为黄金引用论
文,
其中n为整数,
且n≥0;
[0059]
优选的,
依照步骤S11-S13,
k继续依次由小到大取值, 小于和/或等于某一设定
值时,
终止删除论文节点,
论文群体收敛为Gn ,
Gn含有论文数量为|Vn|=Nn篇为黄金引用论
文,
其中n为整数,
且n≥0。
[0060] S5 .输出黄金引用论文。
[0061] 本实施例中,
步骤S1中论文群体可以是按照主题、
领域、
学科和/或年代划定范围,
也可以是按照设定的检索策略划定范围,
也可以是数据库中的全部论文。
10
CN 108763328 A
[0062]
说
明
书
7/10 页
本实施例中,
以主题为马克思的论文群体为例,
首先选定论文群体主题为马克思
的论文,
含有论文17260篇;
依据自引修订引用次数
删除初始引用网络模
型中的自引用关系;
然后迭代的删除论文群体中的边缘性论文,
即排除低质低效他引论文;
最后收敛结果获得163篇黄金引用论文推荐给用户。
[0063] 本实施例中,
以主题为航空航天的论文群体为例,
首先选定论文群体主题为航空
删除初始引用网
航天的论文,
含有论文20781篇;
依据自引修订引用次数
络模型中的自引用关系;
然后迭代的删除论文群体中的边缘性论文,
即排除低质低效他引
论文;
最后收敛结果获得461篇黄金引用论文推荐给用户。
[0064] 实施例一
[0065] 本发明实施例中介绍了一种基于黄金引用算法的论文排序方法,
包括以下步骤:
首先,
在论文数据库中选定论文群体范围;
[0066] 其次,
利用选定论文群体中论文的相互引用关系构建初始引用网络模型;
[0067] 然后,
标定初始引用网络模型中论文的引用属性,
并引入论文的自引系数修订引
用次数,
生成自引修订论文群体;
[0068] 最后,
采用迭代筛选的方式逐层缩小自引修订论文群体的范围,
将每层筛选出的
论文组成论文群体,
并进行降序排列。
[0069] 本实施例中,
论文群体可以是按照主题、
领域、
学科和/或年代划定范围,
或者是按
照设定的检索策略划定范围,
或者是数据库中的全部论文;
[0070] 本实施例中,
所述初始引用网络模型为:
G=(V ,E) ,
G=(V ,E)是由|V|=N个论文节
点和|E|=M条边所组成的一个有向网络;
其中,
G代表论文群体中论文以及论文间引用关系
的集合,
V代表论文群体G中的论文集合,
E代表论文群体G中论文间的引用关系。
[0071] 本实施例中,
引入引用变量ei ,j ,
ei ,j代表论文群体G中论文vi与论文vj的引用关系,
若论文vi被论文vj 引用,
则ei ,j等于1;
若论文vi未被论文vj 引用,
则ei ,j等于0,
其中i≥1,
j≥
1;
[0072] 在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei ,j 累加得到,
则建
立第i篇论文在论文群体G中的被引次数关系式为
[0073]
其中,
本实施例中,
标定论文引用属性,
步骤如下:
根据论文的作者判断论文之间的引用
关系是自引还是他引;
若论文vi被论文vj 引用,
当论文vi 与论文vj中没有相同作者,
则该次
引用为他引;
当论文vi与论文vj中至少有一个相同作者,
则该次引用为自引;
[0074] 依据论文引用属性,
引入自引系数λi ,j ,
若论文vi与被引论文vj为自引关系,
则λi ,j
等于0;
若论文vi与被引论文vj为他引关系,
则λi ,j等于1,
其中,
i≥1,
j≥1;
在Ei中引入自引
系数λi ,j ,
删除初始引用网络模型中第i篇论文的自引引用关系,
获得第i篇论文在论文群体
中的他引引用关系。
[0075] 本实施例中,
论文vi被论文vj引用且为自引,
则引用变量ei ,j与自引系数λi ,j的乘积
为0;
论文vi被论文vj 引用且为他引,
则引用变量ei ,j与自引系数λi ,j的乘积为1;
通过对引用
变量ei ,j与自引系数λi ,j的乘积相累加,
排除了第i篇论文在初始引用网络模型中的自引用
11
说
CN 108763328 A
明
书
8/10 页
关系,
则建立第i篇论文在论文群体中的自引修订引用次数公式为
其中,
i≥1,
j≥1。
本实施例中 ,
依据自引修订引用次数为
[0076]
生成自引修订论文群体
G ',
从而构建出自引用网络模型G '=(V ',E ');
G '=(V ',E ')是由|V '|=N个节点和|E '|=M '
条边所组成的一个有向网络。
[0077] 本实施例中,
引入被引次数设定值k,
k依次由小到大取值,
采用迭代筛选的方式逐
层缩小论文群体的范围,
将每层筛选出的论文组成论文群体,
并进行排序,
直至输出全部的
排序结果,
其中,
k为整数,
且k≥0。
[0078] 本实施例中,
第k层的初始论文群体为Gk时,
Gk中含有|Vk|=Nk个节点,
即含有Nk篇
论文,
|Ek|=Mk条边,
第i篇论文在论文群体Gk中的被引次数关系式为
采用迭代筛选的的方式缩小Gk的范围,
筛选出Gk中被引次数
[0079]
等于k的
论文及其引用关系,
生成论文群体G k ,1 ,
第i篇论文在论文群体G k ,1中的被引次数关系式为
继续筛选出Gk ,1中
小于和/或等于k的论文及其引用关系,
并生成论文群
体Gk ,2 ,
继续迭代筛选,
直至生成论文群体Gk ,q ,
且Gk ,q中论文被至少k+1篇Gk ,q中的论文引用,
形成第k+1层的初始论文群体,
即Gk ,q记作Gk+1 ;
[0080] 每层迭代筛选出的论文组成论文群体D k ,
筛选后的论文群体G k+1中含有|V k+1 |=
Nk+1个节点,
即含有Nk+1篇论文,
|Ek+1|=Mk+1条边,
第i篇论文在论文群体Gk+1中的被引次数关
系式为
且被引次数大于k,
其中,
k、
q为整数,
且k≥0,
q≥1。
[0081]
本实施例中,
以自引修订论文群体G '为初始论文群体,
每层迭代删除的论文组成
论文群体,
并进行降序排列,
直至输出全部的排序结果,
具体步骤如下所示:
[0082]
S11 .k=0,
筛选出G0中自引修订引用次数
等于0的论文及其引用关系,
生成论文
群体G0 ,1 ,
第i篇论文在论文群体G0 ,1中的被引次数关系式为
继续筛选出G0 ,1
中
等于0的论文及其引用关系,
并生成论文群体G0 ,2 ,
继续迭代筛选,
直至生成论文群体
G0 ,q
且G0 ,q中论文被其他至少1篇G0 ,q中的论文引用,
其中G0 ,q记作G1 ,
迭代筛选出的论文
组成论文群体D0 ,
论文群体缩小为G1 ,
G1中含有|V1|=N1个节点,
即含有N1篇论文,
|E1|=M1条
边,
第i篇论文在论文群体G1中的被引次数关系式为
[0083]
S32 .k=1,
筛选出论文群体G1中自引修订引用次数
其中,
q为整数,
且q≥1;
等于1的论文及其引用关系,
生成论文群体G1 ,1 ,
第i篇论文在论文群体G1 ,1中的被引次数关系式为
选出G1 ,1中
继续筛
小于和/或等于1的论文及其引用关系,
并生成论文群体G1 ,2 ,
继续迭代筛选,
直至生成论文群体G1 ,q ,
且G1 ,q中论文被其他至少2篇G1 ,q中的论文引用,
其中G1 ,q 记作G2 ,
迭
12
说
CN 108763328 A
明
书
9/10 页
代筛选出的论文组成论文群体D1 ,
论文群体缩小为G2 ,
含有论文数量为|V2|=N2篇,
第i篇论
文在论文群体G2中的被引次数关系式为
[0084]
其中,
q为整数,
且q≥1;
S33 .k=2,
筛选出G2中自引修订引用次数
等于2的论文及其引用关系,
生成论文
群体G2 ,1 ,
第i篇论文在论文群体G2 ,1中的被引次数关系式为
中
继续筛选出G2 ,1
小于和/或等于2的论文及其引用关系,
并生成论文群体G 2 ,2 ,
继续迭代筛选,
直至生
成论文群体G2 ,q ,
且G2 ,q中论文被其他至少3篇G2 ,q中的论文引用,
其中G2 ,q 记作G3 ,
迭代筛选
3
3
出的论文组成论文群体为D2 ,
论文群体缩小为G ,
含有论文数量为|V |=N3篇,
第i篇论文在
论文群体G3中的被引次数关系式为
[0085]
其中,
q为整数,
且q≥1;
S34 .依照步骤S11-S13,
继续迭代筛选边缘性论文,
为k=n时,
筛选出Gn中自引修
订引用次数
等于n的论文及其引用关系 ,生成论文群体Gn ,1 ,
第i篇论文在论文群体Gn ,1中
的被引次数关系式为
继续筛选出Gn ,1中
小于和/或等于n的论文及其引
用关系,
并生成论文群体Gn ,2 ,
继续迭代筛选,
直至生成论文群体Gn ,q ,
且Gn ,q中论文被其他至
少n+1篇Gn ,q中的论文引用,
其中Gn ,q记作Gn+1 ,
迭代筛选出的论文组成论文群体为Dn ,
论文群
体缩小为Gn+1 ,Gn+1含有论文数量为|Vn+1|=Nn+1篇论文,
其中n,
q为整数,
且n≥0,
q≥1;
n+1
[0086] S35 .当N =0时,
终止筛选论文节点,
输出论文群体排序结果,
其中排序结果为:
{Dn、
Dn-1……D2、
D1、
D0};
[0087] 本实施例中,
k依次由小到大取值,
k大于和/或等于某一设定值的论文群体进行迭
代筛选出的论文为黄金引用论文,
则从排序结果中由高到低依次输出论文群体,
其中k为正
整数,
且k≥0;
[0088]
优选的,
小于和/或等于某一设定值时的论文群体进行迭代筛选出的论文为黄
金引用论文,
并将论文群体从排序结果中由高到低输出,
n为整数,
且n≥0;
[0089] 优选的,
Nn-1-Nn 小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群
体为黄金引用论文,
并将论文群体从排序结果中由高到低输出,
n为整数,
且n≥0;
[0090] 优选的 ,
Nn 小于和/或等于某一设定值的论文群体进行迭代筛选出的论文群体为
黄金引用论文,
并将论文群体从排序结果中由高到低输出,
n为整数,
且n≥0。
[0091] 本实施例中,
用户手动按序查看,
获取高质量的黄金引用论文。
[0092] 论文的原始引用次数统计是将每次被引用记录均记为1,
通过论文的作者对论文
间的引用关系进一步地限定,
排除论文引用关系中自引的干扰,
再根据施引论文的被引情
况修订论文的引用次数,
排除低质低效他引论文的干扰,
以自引修订论文群体G '为初始论
文群体,
依据自引修订引用次数,
采用迭代筛选的方式逐层对论文群体筛选,
筛选出的论文
群体组合成论文群体,
并进行降序排列,
增加了用户的论文选择范围,
提升用户体验。
[0093] 以上所述仅是本发明的较佳实施例而已 ,
并非对本发明作任何形式上的限制,
虽
然本发明已以较佳实施例揭露如上,
然而并非用以限定本发明,
任何熟悉本专利的技术人
员在不脱离本发明技术方案范围内,
当可利用上述提示的技术内容做出些许更动或修饰为
13
CN 108763328 A
说
明
书
10/10 页
等同变化的等效实施例,
但凡是未脱离本发明技术方案的内容,
依据本发明的技术实质对
以上实施例所作的任何简单修改、
等同变化与修饰,
均仍属于本发明方案的范围内。
14
CN 108763328 A
说
明
书
图1
15
附
图
1/3 页
CN 108763328 A
说
明
书
图2
图3
16
附
图
2/3 页
CN 108763328 A
说
明
书
图4
17
附
图
3/3 页
word版下载:http://www.ixueshu.com
免费论文查重:http://www.paperyy.com
3亿免费文献下载:http://www.ixueshu.com
超值论文自动降重:http://www.paperyy.com/reduce_repetition
PPT免费模版下载:http://ppt.ixueshu.com
-------------------------------------------------------------------------------
Download