全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+
当前位置:首页  >  技术干货

发现一个宝藏Python库,玩社区发现算法的不能错过!

发布时间:2023-01-13 10:41:00
发布人:wjy

  网络是由一些紧密相连的节点组成的,并且根据不同节点之间连接的紧密程度,网络也可视为由不同簇组成。簇内的节点之间有着更为紧密的连接,不同簇之间的连接则相对稀疏。这种簇被称为网络中的社区结构(community structure)。

  由此衍生出来的社区发现(community detection)算法用来发现网络中的社区结构,这类算法包括 Louvain 算法、Girvan-Newman 算法以及 Bron-Kerbosch 算法等。

  最近,在 GitHub 上发现了一个可以发现图中社区结构的 Python 库 communities,该库由软件工程师 Jonathan Shobrook 创建。

宝藏 Python 库1

  项目地址:https://github.com/shobrook/communities

  首先,该库可以实现以下几种社区发现算法:

  Louvain 算法

  Girvan-Newman 算法

  层次聚类

  谱聚类

  Bron-Kerbosch 算法

  其次,用户还可以使用 communities 库来可视化上述几种算法。

  该库的安装方法也非常简单,可采用 pip 的方式安装 communities,代码如下:

宝藏 Python 库2

  对于这个 Python 库,很多网友给予了高度评价,表示会去尝试。

宝藏 Python 库3

  算法详解

  1、Louvain 算法

宝藏 Python 库4

  该算法来源于文章《Fast unfolding of communities in large networks》,简称为 Louvian。

  作为一种基于模块度(Modularity)的社区发现算法,Louvain 算法在效率和效果上都表现比较好,并且能够发现层次性的社区结构,其优化的目标是最大化整个图属性结构(社区网络)的模块度。

  Louvain 算法对最大化图模块性的社区进行贪婪搜索。如果一个图具有高密度的群体内边缘和低密度的群体间边缘,则称之为模图。

  示例代码如下:

宝藏 Python 库5

  2、Girvan-Newman 算法

宝藏 Python 库6

  该算法来源于文章《Community structure in social and biological networks》。

  Girvan-Newman 算法迭代删除边以创建更多连接的组件。每个组件都被视为一个 community,当模块度不能再增加时,算法停止去除边缘。

  示例代码如下:

宝藏 Python 库7

  3、层次聚类

宝藏 Python 库8

  层次聚类实现了一种自底向上、分层的聚类算法。每个节点从自己 的社区开始,然后,随着层次结构的建立,最相似的社区被合并。社区会一直被合并,直到在模块度方面没有进一步的进展。

  示例代码如下:

宝藏 Python 库9

  4、谱聚类

宝藏 Python 库10

  这种类型的算法假定邻接矩阵的特征值包含有关社区结构的信息。

  示例代码如下:

宝藏 Python 库11

  5、Bron-Kerbosch 算法

宝藏 Python 库12

  Bron-Kerbosch 算法实现用于最大团检测(maximal clique detection)。图中的最大团是形成一个完整图的节点子集,如果向该子集中添加其他节点,则它将不再完整。将最大团视为社区是合理的,因为团是图中连接最紧密的节点群。因为一个节点可以是多个社区的成员,所以该算法有时会识别重叠的社区。

  示例代码如下:

宝藏 Python 库13

  可视化

  绘图

宝藏 Python 库14

  可视化图(graph),将节点分组至它们所属的社区和颜色编码中。返回代表绘图的 matplotlib.axes.Axes。示例代码如下:

宝藏 Python 库15

  可视化图如下:

宝藏 Python 库16

  Louvain 算法的动图展示

宝藏 Python 库17

  Louvain 算法在图中的应用可以实现动图展示,其中每个节点的颜色代表其所属的社区,并且同一社区中的节点聚类结合在一起。

  示例代码如下:

宝藏 Python 库18

相关文章

Mysql索引为什么要用B+Tree实现?

Mysql索引为什么要用B+Tree实现?

2023-10-15
Java常用的包(package)有哪些?

Java常用的包(package)有哪些?

2023-10-15
Java Nio中Selector是什么?

Java Nio中Selector是什么?

2023-10-15
ThreadLocal为什么会发生内存泄漏?

ThreadLocal为什么会发生内存泄漏?

2023-10-15

最新文章

常见网络安全面试题:Windows常用的命令有哪些?

常见网络安全面试题:Windows常用的命令有哪些?

2023-10-09
常见网络安全面试题:根据设备告警如何展开排查?

常见网络安全面试题:根据设备告警如何展开排查?

2023-10-09
常见网络安全面试题:mysql加固呢?(数据库加固)

常见网络安全面试题:mysql加固呢?(数据库加固)

2023-10-09
常见网络安全面试题:windows和linux加固?(操作系统加固)

常见网络安全面试题:windows和linux加固?(操作系统加固)

2023-10-09
在线咨询 免费试学 教程领取