从《维京传奇》看社交网络构建与视觉化
011.论文简介与作者背景
今日,我们为大家呈现的是Milán Janosov在今年4月于nightingale网站上发表的一篇论文:以《维京传奇》为蓝本, 探讨社交网络地图的构建与视觉化。在这篇文章中,Milán深入阐述了如何运用电视剧粉丝百科网站与Python编程语言来创建电视剧角色关系网,并详细解读了社交网络的构建过程。同时,他还慷慨地分享了所有制作工具和相关代码。
Milán Janosov博士是一位杰出的数据科学家,他在物理学和生物物理学领域有着深厚的背景。他于2020年获得网络和数据科学博士学位,现为Datapolis首席数据科学家、中欧大学附属研究机构成员、maven7高级数据科学家以及欧盟委员会数据科学专家。他的作品不仅趣味盎然,更融合了先进的技术性。
02电视剧社交网络的数据收集
在开展《维京传奇》人物社交网络地图的构建之前,数据收集是最为重要的一步。 从Vikings Wiki获取角色列表和他们之间的关系数据,这一过程通过抓取角色简介得以实现,从而创建了社交网络的基础节点和连接。
为了构建《维京传奇》人物社交网络地图,我需获取两类关键信息:一是角色清单,作为社交网络中的节点;二是这些角色间的关系数据,作为网络中的链接。尽管直接从电视剧中获取数据亦可取得一定成效,但为了简化工作流程,我选择了Vikings Wiki这一《维京传奇》粉丝网站。

图1展示了Vikings Wiki上的角色列表。在收集完《维京传奇》的全部卡司信息,包括人物姓名和Vikings Wiki的唯一标识符后,我进一步抓取了他们的详细个人简历(相关代码已在GitHub报告中提供)。以Ragnar Lothbrok为例,他的简介中包含了众多其他角色的超链接,这些链接无疑构成了社交网络的重要组成部分。例如,Ragnar的简介中就链接到了他的首位妻子Lagertha、他的子女Gyda和Bjorn,甚至还包括了他那背信弃义的兄弟Rollo。
图2展示了Vikings Wiki上角色Ragnar的个人简历。通过深入探索其详细信息,我们可以发现其简介中不仅包含了他本人的详细介绍,还链接到了众多与他相关的其他角色,如他的妻子Lagertha、子女Gyda和Bjorn,以及背信弃义的兄弟Rollo。这些链接为我们揭示了一个复杂的社交网络。
032.社交网络的建立与视觉化
在拥有了所有角色的简介之后,我着手构建了一个社交网络。在这个网络中,每个角色都由一个节点表示,如果两个角色间存在至少一个相关链接,那么他们就被连接起来。 利用NetworkX库构建了包含1104条边和221个节点的社交网络图,并通过Gephi进行优化视觉化,以节点大小、颜色及布局算法来展示角色网络。

经过一系列简单步骤(具体细节请参见GitHub报告),我将这些关系输入到NetworkX库中,从而创建了一个包含1104条边和221个节点的网络图。虽然使用NetworkX和Matplotlib可以直接在iPython Notebook中快速可视化这些关系网络(如图3所示),但通常,我们更推荐使用Gephi来设计和微调详细的可视化网络图,其操作简便得多。

图4-从NetworkX构建的gexf文件。在Gephi中呈现的关系网络图
以Gephi中打开的原始关系图为基础,我着手进行最终的设计调整。首要任务是依据节点的重要程度来设定其大小。我选择了Force Atlas 2布局算法,它能够将关系图中的节点布置在一个平面上,通过模拟物理引力来推拉节点,从而直观地揭示网络的核心结构。
此外,我还运用了一种模块化搜索算法,该算法能够根据节点的连接性模式进行聚类,强化节点间的连接,使其在视觉上比网络其他部分更为突出。根据角色所属的社群,我为这些节点着色,并筛选出那些互动频率较低的角色及其交互关系,以确保视觉上的清晰度。经过这些步骤,我成功绘制出了图5所示的《维京传奇》骨干关系网,其中包含149个节点和399条关联线。

表5-《维京传奇》关系网络图。该图以节点形式呈现了每位角色,若角色间在Vikings Wiki上存在关联,则以连线相连。连线粗细代表角色间联系的频繁程度,连线越粗,联系越紧密。同时,节点大小与角色所涉关系数量成正比,而节点颜色则依据其所属的社群——网络中紧密相连的子集来区分。经过精简,此网络图包含149个节点和399条边。

图6-图5的放大版。在深入探究关联强度时,我们发现Bjorn和Torvi这对维京夫妇以强大的关联位居榜首。
043.社交网络的解读
通过视觉化关系网络,我们可以洞悉到许多有趣的故事。 通过网络图识别核心角色和关联关系,并对其进行了分析,揭示了主要角色如Ragnar及其家族在社交网络中的核心地位,同时展示了新剧集与原系列的联系。
经过测量,我们发现角色关系最多的前十名分别是:Ragnar、Bjorn、Lagertha、Harald、Ubbe、Ivar、Rollo、Hvitserk、Floki和Torvi。在这些角色中,仅有Floki和Harald两位并非Ragnar家族的直接成员。尽管Floki与家族无直接血缘关系,但可视为家族的紧密一员,而Harald则将原《维京传奇》系列与新剧集《维京传奇:英灵神殿》巧妙地联系在一起。

图7-进一步放大版的网络图部分,其中Ragnar以85条关联线高居榜首。
值得注意的是,尽管Ragnar在维京传奇中扮演着举足轻重的角色,但他的紧密关系强度却仅为Bjorn和Torvi之间的约35%,这反映出Ragnar的关系模式更倾向于广泛而非紧密。
05问题与未来方向
在这篇小文章中,我们探讨了如何利用电视剧集的粉丝百科网站和Python编程技巧来构建电视剧系列的人物角色关系网络。 当前研究在社交网络构建与视觉化取得了一些进展,但仍存在待解决的问题,例如优化人物提及的精准匹配以及探索情感量化联系。此外,相关的Python源代码和Gephi文件已经上传至GitHub库,供大家参考和学习。相关代码和文件旨在帮助进一步的研究和探索。
举报/反馈
网址:从《维京传奇》看社交网络构建与视觉化 https://mxgxt.com/news/view/2041212
相关内容
社交距离与社交网络结构社交网络数据分析与可视化.pptx
探索Python中的社交网络分析:构建社交网络应用
网络可视化:构建网络世界的可视化图谱
社交关系网络可视化
人人网交流模式的社交网络分析与可视化实现
社交网络知识图谱可视化
社交媒体网络用户画像构建及应用研究
图解社交网络构建、信息扩散路径
读图时代:社交网络走向“视觉化”

