[关系图谱] 一.Gephi通过共线矩阵构建知网作者关系图谱

作者最近研究人物关系图谱,准备发表相关的文章,原本是用Python Networkx库绘制,但效果不太理想;故改为Gephi软件,发现其非常好看,特分享几篇文章供大家交流学习,希望对您有所帮助,尤其是引文分析、社交网络、主题分布等方向的同学。后续的文章将尽可能的使用Markdown语法撰写了。
参考文章:【python数据挖掘课程】十七.社交网络Networkx库分析人物关系(初识篇)


一.关系图谱结果展示

1.Fruchterman Reingold布局
运行结果如下图所示:



2.Force Atlas布局
总体布局如下图所示:




然后查看图谱的细节如下所示:







二.导入共线矩阵

1.Excel构建共线矩阵
接下来导入Excel文件的共线矩阵,如下图test.xls文件所示,具体怎么得出这个表格数据,我后续文章将采用倒叙的方式进行讲解,包括抓取知网的论文数据。




部分数据如下所示,其中“赵凌 谢传红”表示两个作者合作完成一篇文章,同理“赵凌 石维武”也一样,这就是所谓的共线矩阵。有的学者针对文学作品或影视作品做关系图谱,则只需将出现在同一章节或同一集电视剧的演员看作存在关系,构建对应的共线矩阵即可。

赵凌  谢传红
赵凌  石维武
张磊  屈国超
张磊  王韶霞
张磊  谢卓潇
屈国超 王韶霞
屈国超 谢卓潇
王韶霞 谢卓潇
高会军 屈植斌
胡翠华 彭馨
张婷  赵孝梅
张婷  何燕
张婷  邓婕
张婷  吴昌学
张婷  禹文峰
张婷  官志忠

文章“贵州都匀阳和乡格业寨水族“开控”仪式及仪式音声考述”的作者刚好是“赵凌 谢传红 石维武”三位老师,也对应上述的共线关系。



2.Gephi导入数据

接下来打开Gephi软件,点击“文件”=>“导入电子表格”,选择“test.xls”文件,如下图所示。




点击“下一步”=>“完成”,需要注意的是:图的类型选择“无向边”,因为论文作者是同时出现的,不存在方向;而如果研究论文引用文献,则建议构建有向图。



该图共有497个节点,1085条边,点击确定之后如下图所示,可以看到一堆混乱的关系及散点。




三.设置节点和边

接着点击右下角“统计”,然后点击:
(1) 平均路径按钮(Betweenness Centrality)
(2) 模块化(Modularity Class)




运行过程中会弹出生成的报告图,点击“关闭”按钮即可,如下图所示:


接着设置节点和边的属性。
(1) 设置节点大小(第二个图标)Ranking为度。点击“运行”后,可以看到节点的大小有所改变,这里的节点大小对应节点的度,例如作者“王二”与五个作者共线,则大小设置为5;也可以设置为平均路径按钮(Betweenness Centrality)。



(2) 设置节点颜色(第一个图标)Partition为Modularity Class(模块化),为不同的关系设置不同的颜色,如下图所示。





四.设置关系图片布局

1.设置为Fruchterman Reingold类型。FR算法(Fruchterman-Reingold) 属于力引导布局算法类别,网络局部算法。




输出结果如下图所示:


2.设置为Force Atlas类型。同时将斥力强度从200设置为2000,这样点之间的线会分得更开。




接着点击预览,点击“显示节点标签”并设置为中文汉字,勾选“比例大小”,否则节点很大的字体很大,可以看到图像如下所示:



但是图形中存在很多两两在一起的点,他们是常见的硕士论文和博士论文,导师和学生的合作,或者仅有两个作者的文章。



如何过滤这些关系比较孤立的群体呢?
可以通过“过滤”中点击“拓扑”=>“在度的范围”,将关系较少的子图过滤。



输出结果如下图所示:


最后推荐下面文章给大家学习:
(1) 视频: http://www.iqiyi.com/w_19ru91d0vt.html
(2) 百度文库: https://wenku.baidu.com/view/29328a9f19e8b8f67d1cb92d.html
(3) 博客文章: Gephi学习笔记-画出图形基本流程

猜你喜欢

转载自blog.csdn.net/Eastmount/article/details/81746650