- 0
- 0
- 0
分享
- 惟新前沿丨去“巴尔干化”:微博社会“中心化”趋同现象与结构
-
2022-12-01
去“巴尔干化”:微博社会“中心化”趋同现象与结构
(原文刊载于《新闻记者》2022年10期“理论探索”专栏。本文有所删节,参考文献从略,完整版以原文为准。)
作者:
徐翔:同济大学艺术与传媒学院教授、副院长,主要研究方向为网络传播、社交媒体挖掘、文本数据挖掘。
夏敏:同济大学艺术与传媒学院硕士。
唐颖:上海交通大学媒体与传播学院硕士生。
王晓虹:复旦大学新闻学院助理研究员。
摘 要:在社交媒体用户的连接和趋同过程中,各类用户局部的碎片化、区隔化得以强调,但对碎片化背后全局的同质性和统一性关注不足。重要的问题不仅仅是社交网络是否割裂为“巴尔干化”的一个个孤岛,而是它是否处于一个单一的“整体社会孤岛”之中。本文认为,社交媒体各类用户并非是巴尔干化或去中心化的,而是存在“中心化”的趋同结构,子类的碎片化分布只不过是全局用户中心趋同过程中的表象和局部。通过对微博用户子类的实证分析,研究发现:其一,子类越处于连接网络的中心,与全局各类用户的平均相似度越高,表现出趋同结构的中心化。其二,子类越处于相似网络的中心,与相似中心的相似度越高,表现出趋同结构的单中心性。其三,子类越处于用户子类连接的中心,也就越处于用户子类趋同的中心,并进而在类和类之间的社会连接中形成朝向共同中心的规律化趋同,表现出连接网络和相似网络的同构性。用户子类“巴尔干化”趋异和“中心化”趋同并不是冲突的而是统一的,这种中心趋向性的社交网络结构亟待进一步的理论重视。
关键词:社交网络 微博用户 巴尔干化 中心化 趋同结构
01
问题的提出
在“同声相应,同气相求”的社交背景下,社交媒体能够使人形成“人以类聚,物以群分”的分裂状态。当我们把社交网络用户切分为一个个群落或子类,并将视野从个体、局部放大到整个网络社会层面时,那么,社交网络究竟是碎片化的、在各个子类之间形成趋异的分化,还是有着中心化的趋同结构?这是一个重要的理论问题。
网络巴尔干化(cyber-balkanization)是学界较为主流、有着广泛影响力的观点,它虽然注意到用户群体内容生产的差异性,但对碎片化背后潜在的同质化和统一性关注不足。重要的问题,不仅仅是社交网络是否处于巴尔干化的一个个孤岛之中,而是它是否处于一个单一的、巴尔干化的整体孤岛之中。在分析社交网络结构时,既不能忽视局部的碎片化、多样化,也不能对全局的趋同性视而不见,而是要将两者融入理论整体中。
因此,在社交媒体和微博时代,仍有几个问题需要进一步思考和明确:一是同质性驱动下的社交网络结构究竟是中心化的,亦或是去中心化的?二是在用户“越连接—越相似”的逻辑下,高连接度用户之间会产生更高的相似度,高相似度用户也更容易产生连接,结果是否并不会导致分散的“巴尔干化”,而实际上是“中心化”的趋同现象?三是“巴尔干化”和“中心化”并不是矛盾的,而是统一的,前者可能是后者的表现和表象?即碎片化的用户群体背后是否存在着趋同的统一性?四是如果存在这种统一性,其中的趋同规律和机制是怎样的?
本文提出的核心观点是:各类社交媒体用户并非巴尔干化或去中心化的,而是具有朝向中心子类聚拢和趋同的“中心化”结构;所谓的区隔化、碎片化的表象、现象,背后存在着统一性和趋同性,子类的碎片化分布只不过是全局用户中心趋同过程中的表象和局部。
02
文献回顾和研究假设
在用户及内容同质化的研究中,巴尔干化等观点仅从局部视角强调了用户的碎片化,并不能从理论和实证上对社交网络趋同规律予以充分支撑。在研究社交网络结构时,需要打破对于局部相似人群的分析,而着眼于全局发现用户类与类之间的关联性,得出更具普遍意义的相关结论。
(一)用户之间连接度与内容相似性的正向关联
对于社交网络结构中的用户关系,一般认为,社会关系的连接度与用户内容相似性具有正向的相互作用:即越连接越相似,越相似也越连接。例如,Yu等(2015)发现微博用户间的兴趣相似性与他们的社交关系强度呈显著正相关。这一方面能够导致类同于“人以类聚”的碎片化的用户类;但另一方面,从社交网络全貌来看,高连接度对应的是高相似度,并且这种相似性会带来进一步的相似化,那么各类用户会被编织成一张相互连接且中心化趋同的大网。由此可见,用户内容相似度和社会连接的紧密程度存在双向作用,并且这种相似性会通过社会互动进一步增强用户之间的趋同性,即因为相似而变得更加相似。因此从全局视角来看,在“越连接——越相似”的作用下,社交网络最终会变得更加集中化而非离散化。
(二)网络用户观念与内容的整体趋同性
社交网络模型研究和观念动力学的提出,都表明了网络用户群体是趋同而非趋于异的,群体意见和观点最终会收敛于超级影响者、公众媒体等。有研究表明随着交互的持续进行,网络社群中的个体观点将由混沌无序状态过渡到集中有序状态,不同观点的一致性程度逐步提高,最终可能形成共识,这种观点演化问题在少数观点的幸存(薛娟等,2016)等社会现象中普遍存在。国内外学者也已提出多种模型来解释舆论的形成和演进现象,刻画了用户观点的收敛过程和影响因素。这些分析展现了整个社交网络内容的演化是趋于收敛而非多样化、多中心的可能性,随着相似度的提高,用户的意见交互和趋同速度也随之提高,最终呈现收敛于某一类用户的中心化结构。
(三)核心角色的跨圈层传播与同质化扩散
社交网络中的核心角色也可能是信息跨圈层流动的突破口,如关键意见领袖、超级影响者等,他们会打破传统“巴尔干化”结构下的圈层区隔边界,并形成社交网络中连接全局、相似于全局用户类的中心结构。从传播内容和用户观点上而言,网络群体的趋同化往往是指向意见领袖,即其他用户与社交网络的核心用户越来越相似;这主要是因为意见领袖代表着高影响力用户,作为连接中心拥有着更高的同化能力。例如,韩运荣等(2012)发现意见领袖能够连接起各自离散的节点,使得原来无序、混乱的网络变得紧密。由此可见,存在着一些关键性的用户角色或群体,他们有着与全局用户的高相似性、高连接度、高中心性,能够引导全局趋于共识,其跨圈层性对于形成中心化的网络群体结构有重要作用。
(四)网络结构的不平衡性与集中性
“富人俱乐部”现象等研究不仅探讨了用户关系,更蕴藉着社交网络结构上的不平衡性和集中性。已有研究表明,意见领袖等核心用户群体不仅彼此之间有高连接度和高相似度,而且和边缘群体也具有高连接度。例如,Zhou等(2004)研究发现互联网在自治层的拓扑结构存在一定的富节点,即很少一部分节点具有大量的连接,而且这些节点倾向于互相连接,形成“富人俱乐部”。从整个传播环境来看,巴尼特等(2008)也曾论证了传播网络中的趋同理论。可以看到,这些现象都指向社交网络结构的核心节点,他们与网络中心、边缘用户类都具有高连接度,而边缘节点只和边缘的用户类具有稀疏的连接;并且连接越紧密、越相似的用户类彼此之间也更加趋同和“稠密”,而边缘用户之间则较为分散、差异较大。
综上所述,本研究提出最基本的假设:微博各类用户区隔化、碎片化背后存在着中心化的趋同结构。基于该假设,将“关注-被关注”的微博用户按照内容特征划分为若干子类进行考察,并从3个关键子假设和2个推论来验证中心假设。为方便描述,将由用户子类两两成为关注对的连接概率构成的矩阵简称为“连接网络”,由用户子类两两相似度构成的矩阵简称为“相似网络”。具体假设如下:
H1:各子类在连接网络的中心程度,与其和全局各类的平均相似度呈正相关。
H2:各子类在相似网络的中心程度,与其和相似中心(A2)的相似度呈正相关。
H3:各子类在连接网络的中心程度,与其在相似网络的中心程度呈正相关。
H3(a):各子类和相似中心(A2)的相似度,与该子类在连接网络的中心程度呈正相关。
H3(b):各子类和连接中心(A1)的连接程度,与该子类在相似网络的中心程度呈正相关。
上述子假设和推论的关系如下,H1 是 H2 成立的基础,H1 和 H2 共同构成了 H3 的假设基础,H3(a)和 H3(b)两个推论是 H3 的自然延伸,旨在验证相似性、社会连接度、中心度之间存在一个不断加强的社会强化过程。各假设之间的内在关系图如下(见图 1)。
(图1 子类“中心化”趋同结构及其假设的内在关系图)
03
研究方法
本研究的实施步骤主要如下:首先,随机选取新浪微博上的数万个用户及其对应的关注者,匹配成关注对,分别抓取这些用户个人信息及所属数千万条样本帖,并进行必要的清洗和处理。其次,将这些用户所属的帖子转化为向量进行聚类,从而判定样本用户的类型和所属子类。再次,分别计算类与类两两之间的连接程度和内容相似程度,构建连接网络和相似网络。最后,利用SPSS和社会网络分析方法验证微博用户社会网络的“中心化”趋同结构。
(一)数据采集与清洗
在数据抓取上,采取成本相对较低的多阶段抽样,抓取工具为八爪鱼软件。首先,从新浪微博首页47个内容板块中,每天早晚各抓取一次帖子,持续1个月,获得65650条“种子”帖,种子帖广泛而大致均衡地分布在这47个板块。随后从种子帖做第一阶段“滚雪球”扩散,对这些种子帖抓取得到5053998条评论及其评论者,这些评论者和原种子贴发布者去重后形成3501153个用户的初始库。其后,从该初始库中随机选取并有效抓取得到87739个用户所发的帖子。之后进行第二阶段的“滚雪球”,从这87739个有效用户中,根据每人所关注的100个被关注者随机抽2名。其后对所有用户统一时间口径和帖子数量,确保“关注—被关注”的配对双方都具有符合上述条件的帖子和有效个人资料,最终剩余13762组“关注—被关注”的“1对1”用户关系。
(二)用户内容的特征提取与向量化表示
在数据处理上,把单个用户的各条帖子,无顺序拼接为一个长文本,先通过向量空间模型(VSM)得到每个用户的词频矩阵。词频矩阵的获取,采取常用的模块scikit-learn中的CountVectorizer()函数,其中最低词频数设为50,最大文档频率设为0.2,只采用一元词,得到词频矩阵后转为经L2规范化的TFIDF矩阵X,转换函数为sklearn的TfidfTransformer(norm='l2')。对于矩阵X,采取潜在语义分析(LSA)进行降维和内容特征提取(Dumais,2004)。本研究中,对每个用户的词频矩阵一律通过潜在语义分析降维到1200维。降维工具选择开源模块scikit-learn中的TruncatedS-VD()函数,用尽可能精简的维度,提取和高效保留了原有的数万维矩阵的大部分信息。
(三)用户内容聚类及相似性计算
基于每个用户的帖子向量,通过K-means算法进行若干种聚类类型的试验,最大迭达次数设置为6。结合误差指标,由于随着聚类数量k的增长,其簇内误差平方和(K-meansInertia)变化较为平稳,而太低的聚类数量不利于统计检验,过多的聚类数量会出现类型分布极不均衡的情况,因此根据实际的可操作性,选择将样本用户聚为200类。当k为200时,聚类效果处于平稳变化,是可以接受的选择。用户相似度的计算采用余弦距离这一常用指标,类与类之间的用户平均余弦相似度通过类平均法计算。
(四)社会网络分析:用户子类间的连接网络和相似网络的分析
社会网络分析是将行动者所处节点之间的关系用网络的形式描述出来,从而刻画他们在网络中的结构属性的方法。基于“关注—被关注”的微博用户子类间的连接程度和相似程度,本研究构建了连接网络和相似网络,并通过Ucinet软件分别计算两个网络的点度中心度和特征向量中心性指标(约翰·斯科特,2016:91-96)。
04
研究发现
(一)H1的检验
对各子类在连接网络的中心度指标与其全局均似度进行Spearman相关系数及显著性的检验(以下简称“检验”),结果显示均存在显著的正相关性。这表明在连接网络中,子类自身在连接网络中越趋于中心和重要位置,该子类与全局用户就越相似。也就意味着,越是高连接度的用户子类,就越是全局趋同的中心。
(二)H2的检验
对各子类在相似网络的中心度指标与该子类和相似中心(A2)的相似度进行检验,结果显示均存在显著的正相关性。这表明子类自身在相似网络中越趋于中心和重要位置,该子类与相似中心就越相似。结合H1可知,如果存在另一个中心程度很高的子类,它一定也是在全局意义上具有高相似度的子类,并且离全局相似度最高的子类越近,而不存在趋同于其他中心的可能,即各子类的趋同中心具有单中心性。
结合H1、H2的检验结果,可以推导出:只存在一种中心用户,它和全局各类都具有最高的相似度和连接度,并且全局各类用户都向着与全局相似度最高的中心子类趋同。同时,随着中心度的递增,子类间的相似度也由低到高地变化,越靠近中心位置,子类之间的连接和趋同性也越“稠密”。
(三)H3、H3(a)、H3(b)的检验
根据子假设H3,对各子类在连接网络的中心度指标与在相似网络的中心度指标进行检验,结果均呈显著的正相关性。同时,在Ucinet中利用QAP相关分析进一步计算连接网络和相似网络两个矩阵之间的相关性,结果显示,两者相关系数为0.512,显著性为0.000。这表明连接网络和相似网络呈正相关,并且这种关系在统计意义上是显著的。以上结果表明,从全局意义上而言,子类在社会连接网络和相似性网络中的中心程度具有相关性和一致性,越处于用户子类连接的中心,也就越处于用户子类趋同的中心。
对推论H3(a)、H3(b)进行相应检验,结果同样呈显著的正相关性。这表明中心度、连接度、相似度存在互相强化的关系,再次验证了微博用户连接网络与相似网络的同构性。综合H3、H3(a)、H3(b)的实证结果,无论是连接网络还是相似网络,微博用户各类并不是离散化的,而是存在着趋同的单中心,并呈现在类和类之间的社会连接中形成朝向共同中心的规律化趋同。
05
结论和讨论
基于“关注—被关注”的13762对微博用户样本,本文研究发现如下:(1)趋同结构的中心化:用户子类越处于连接网络的中心,与全局各类用户的平均相似度越高。(2)趋同结构的单中心性:用户子类越处于相似网络的中心,与相似中心的相似度就越高。(3)社会连接和相似网络的同构性:用户子类越处于连接的中心,也就越处于趋同的中心。具体表现为:与相似中心越相似的子类,就越处于连接网络的中心;与连接中心连接越紧密的子类,也越处于相似网络的中心。
本文打破了社交网络“巴尔干化”的惯性认知,探究了“巴尔干化”和“中心化”的统一性,并且提出了不同类型用户在社会连接中形成中心化趋同的规律,对传播学理论具有一定启发意义。同时,社交网络“中心化”背后的趋中心作用机制也让我们重新审视网络社会的用户实践。从用户主体角度而言,“中心化”趋同结构指向了“单向度”、“标准化”主体再生产的可能。随着用户社交媒介使用程度的提升,群体之间的差异性和独特性会不断被消磨,表现出不同程度的趋同与重复。这暗含了网络社会的未知风险,人们的思想内容可能会被禁锢在有限的空间内,形成全局性的“社会回音室”。从网络文化角度而言,网络亚文化的生产并不是随心所欲地形成碎片化的若干局部,在“中心化”趋同结构下,若干亚文化通过同质化传播扩散构成了网络文化整体逻辑的生成张力。因此,重要的问题不仅是网络空间存在怎样的亚文化,而是众多亚文化是否具有深层分化、整合的土壤,这可以成为网络亚文化研究未来的方向和角度。从网络意见和观念角度而言,不同类型用户连接度和内容相似性的社会强化呈现了网络社会思想观念趋于统一、整合的可能性,启示我们社会连接结构对网络意见结构、网络文化结构具有改变和塑造作用。这既是可以进一步剖析的带有规律性的现象,又是需要我们重视的媒介化社会问题。
本文系国家自然科学基金青年项目“社交网络互动中用户‘信息窄化’机理分析:基于微博的数据挖掘”(项目编号:71804126)阶段性研究成果。本文引文格式:徐翔,夏敏,唐颖,王晓虹(2022)。去“巴尔干化”:微博社会“中心化”趋同现象与结构。《新闻记者》,(10),28-40+59。
编辑丨陈越
责编丨程倪萱
-
阅读原文
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文内容由数艺网收录采集自微信公众号同济大学艺术与传媒学院 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。