文本挖掘:社交网络、社群划分
二、中心势中心度都是在说点-点,点-网络。如果单论网络的话,有哪些指标呢? 用中心势来表示。前叙述的三个中心度指标都可以分别打造一款中心势。 中心势的原理就是比较一个网络的边缘点以及中心点的中心度的情况, 如果一个网络很集中,那么势必是中心点,中心度高;而边缘点中心度低。 如果一个网络很稀疏,那么中心点、边缘点的中心度没有多少差异。 这边笔者么有看到太多的关于中心势的指标,在这从网络中找到了这两个:网络聚类系数、网络密度。 1、网络聚类系数——transitivity按照图形理论,聚集系数是表示一个图形中节点聚集程度的系数,一个网络一个值。
可以衡量网络中关联性如何,值越大代表交互关系越大。说明网络越复杂,越能放在一块儿,聚类。 2、网络密度——graph.density跟网路聚类系数差不多,也是用来形容网络的结构复杂程度。越大,说明网络越复杂,说明网络越能够放在一块。
以上两个汉字表,都是比较好的用来描述社群划分是否合理的指标,社群之中的密度越大,三元组聚类系数越多,越好。 社群划分跟聚类差不多,参照《R语言与网站分析》第九章,社群结构特点:社群内边密度要高于社群间边密度,社群内部连接相对紧密,各个社群之间连接相对稀疏。 社群发现有五种模型:点连接、随机游走、自旋玻璃、中间中心度、标签发现。 评价社群三个指标:模块化指标Q、网络聚类系数、网络密度。 画图有三种方法:直接plot、书中自编译函数、SVG。 不同社群划分模型的区别 一、社群发现模型1、基于点连接的社群发现——clusters如果一个点与社群有联系则放在一个网络中,简单易懂,耗时短,但是分类效果并不特别好。
2、随机游走的社群发现
weight代表线权重,默认就是E(g)$label;step代表游走步长,越大代表分类越粗糙,分类类别越小。默认为4. 3、自旋玻璃社群发现
weight代表线权重,但是与随机游走不同,其要自己赋上去,weight=E(g)$label不能少;spins代表产生的社群数,默认值为25。 4、中间中心度社群发现
(编辑:滨州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |