文本挖掘:社交网络、社群划分
g<-g-V(g)[degree(g)==0]??? (3)相邻点的集合——neighbors(很重要)
eighbors可以找出标签如果是“会计”的点,与之有关系的点的序号是啥;不过你也可以通过V(g.zn)$label让临近点的标签一起筛选出来 其中mode代表点出度(out)以及点入度(in),还有两个都有的点度(total)。 2、关系网络中的线集E(1)线集的类型关系网络中线的关系比较多,loop线就是循环到自己的点,1-2-1;multiple代表线的重叠。
(2)线集属性线的属性中,自编译函数能够拿到线权重,E(g)$weight。但是没有标签项,这时候需要用set_vertex_attr加入线标签。
原理就是把点集的标签,打到线集上来,name是默认的设置。
(3)线集加减线集的加减可以用add.edges以及-来实现
其中需要注意,add.edges中,需要把列数据,转置为行数据,平放id与词条。 同时线集也会有重复性的问题,见下文count.multiple(g) 以及simplify函数。 还有一些特别的函数,diameter(g)可以做到最长的链接经过了多少根线。 4、关系网络的重复性问题在关系网络中,重复是常见的,而且无向线中1-2与2-1是重复的,重复线的数量也可以作为线的权重。也就是E(g)$weight。其中igrarh包中笔者看到两个函数跟重复性问题有关。count.multiple(g) 以及simplify函数。 (1)count.multiple(g) 函数可以获得网络中线的重复情况。不重复是1,重复一次+1。比如:无向网络(1-2,2-3,2-1)就是(2,1,2) 等价于E(g)$weight (2)simplify函数函数常规式:simplify(g,remove.multiple = TRUE,remove.loops = TRUE,edge.attr.comb = "mean") 其中loops是指是否循环回自己,比如1-2-1就是一个循环到自己;multiple是指重复比如1-2,2-1。
simplify函数识别了两种重复方式,一种是线重复,比如1-2,2-1,;一种是点重复比如1-1,2-2就是点重复。 remove.multiple=TRUE,把重复的线删除 (编辑:滨州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |