什么是社交网络?

社交网络是由图描述的异构和多关系信息集。该图通常非常大,节点对应于对象,边对应于描述对象之间关系或连接的连接。节点和连接都有属性。对象可以有类标签。链接可以是单向的,不需要是二进制的。

社交网络是由图描述的异构和多关系信息集。该图通常非常大,节点对应于对象,边对应于描述对象之间关系或连接的连接。节点和连接都有属性。对象可以有类标签。链接可以是单向的,不需要是二进制的。

社交网络的特征

社交网络有以下特点 -

  • 密集化幂律- 人们认为随着网络的发展,多个节点中的度数线性增加。这被称为恒定平均程度假设。但是,大量实验表明,反之亦然,随着平均度数的增加,网络会随着时间的推移变得更加密集(因此,边的数量随着节点数量的增加呈超线性增长)。密集化遵循密集化幂律(或增长幂-法),它定义了

    $$e(t)\propto n(t)^{a}$$

    其中e(t)和n(t)分别定义图在时间 t 的边数和节点数,指数 a 通常严格位于 1 和 2 之间。如果 a = 1,则这对应于随时间的固定平均度数,而 a = 2对应于一个完全密集的图,其中每个节点都具有所有节点的固定比例的边。

  • 收缩直径- 实验表明,随着网络的增加,有效直径趋于减小。这与早期的理解相矛盾,即直径随着网络规模的变化而缓慢增加。

    考虑一个引文网络,其中节点是论文,从一篇论文到另一篇论文的引文由有向边表示。节点 v(定义 v 引用的论文)的外链在它结合图的那一刻被“冻结”。因此,节点对之间的距离减小是后续论文通过引用来自多个领域的早期论文充当“桥梁”的结果。

  • 重尾出度和入度分布- 节点的多个出度通过观察幂律 1/n a倾向于遵循重尾分布,其中 n 是节点在顺序中的排名降低出度,通常为 0 < a < 2。

    a 的值越小,尾部越重。这种现象在优先连接模型中定义,其中每个新节点通过固定数量的外链连接到现有网络,遵循富人变富的规则。入度也遵循重尾分布,尽管其影响比出度分布更偏斜。