张洪忠等丨乌合之众的超级节点?AI大模型使用的人机网络结构分析
2024-01-22 07:49:30
  • 0
  • 0
  • 0

以下文章来源于新闻界 ,作者张洪忠等

摘 要 大模型超越“图灵测试”标准,使得机器开始具备接近“人”的行为特征,深刻影响人机混合的网络结构。本文分析大模型在信息传播网络中扮演中心节点角色:大模型及基于大模型的应用直接与大量用户建立“一对一”连接关系,进而推动网络结构向“再中心化”演变,成为一个超级节点。大模型通过学习网络“众人”知识提供新的经验数据,其本质是个体与算法支配下的“众人”互动。随着大模型深入传播实践,本文思考这种趋势是否会带来传受双方的乌合之众,并进一步从传受双方角度讨论了大模型网络结构的可能影响。

关键词 大模型;机器行为;超级节点;网络结构;乌合之众

一、问题提出

随着人工智能技术发展,由人工智能驱动的机器主体更加普遍地参与到人类社会、文化、经济、政治等领域活动中。聊天机器人、虚拟主播、智能语音助手等人工智能技术的机器主体以传播者的身份介入信息生产与扩散,形成“人机共生”的传播主体生态。在社交网络中,以社交机器人为代表的机器主体通过与真人建立网络连接、嵌入真人网络的形式,建构起人机混合的社交网络,人机交互活动逐渐成为常态。根据Sundar的观点,人机交互形成的人机关系有多种可能,双方可能协调共存,也可能出现一方对另一方行为的过度干预。针对以算法技术为核心的机器主体,受限于机器的智能化水平,人机交互关系基本上处于平衡状态,且人类在交互过程中稍占主导地位。同时,社交机器人等机器主体,无论是在身份建构、话语风格,还是行为特征、网络行为等结构特征方面,都与真人存在较为明显差异。当下,机器主体依然能够被真人识别区分,人机交互的体验仍然无法超越人际交互的真实感,机器对人的影响相对有限,即使形成准人机社会交往关系,也更多的是单向、易解除的存在。

但随着新一代人工智能技术的大模型接入,机器主体在身份建构、话语风格、交互体验等方面更加贴近真人交互。大模型是拥有超百亿级参数、数据集规模达TB级的大规模人工智能模型,能够克服专用人工智能单一任务处理的局限性,支持多领域任务处理。随着ChatGPT在国内外火爆出圈,智能对话应用将大模型从幕后推向世人围观的台前,展现出大模型在自然语言对话任务方面的强大优势,人机对话也朝与自然语言交互方向演进。在特定任务场景下,大模型不仅表现出接近人的语言能力和逻辑思维能力,甚至具备超越人类认知能力的可能。

随着大模型泛化能力的增强,相关应用将在更多领域改变人机交互过程,并进一步影响人类社会知识的获取与生产流程。基于大模型的机器主体超越了“图灵测试”的人工智能标准,使机器开始像“人”一样与用户交流,并外显出一定“人”的语言行为特征,实现人机对话水平由“猿猴”向“人”质变。ChatGPT等大模型应用通过对话、聊天、创作等互动功能,让普通用户获得了与人工智能对话的机会。大模型在嵌入信息传播网络、与网络中的节点建立交互关系的同时,也将改变现有的网络传播结构和信息传播模式。

在这一新型人机交互的背景下,本文思考网络空间中是否会产生新形态的乌合之众。在传统意义上,乌合之众是指由原子化的个体构成的、在特定情境下丧失个体主体性并表现出同质化群体行为的集合体。勒庞笔下的乌合之众是负面形象的群体,当拥有理性的个体卷入其中后,个体差异会被隐藏、模糊,并在无意识中表现出作为乌合之众一员的显著群体特征:不讲理性,缺乏判断力和批判精神,思想简单没有主见,显得极其轻信,易受外部刺激因素影响。当我们的视角转向互联网和人工智能语境下,由网络节点连接的群体表现出与勒庞笔下传统群体不同的特征,这样的群体不再是情绪化的集体,而是逐渐趋向个体的相加,但个体也容易受到外部媒介的感染和煽动,其主体性可能会受感官操纵而发生变化,从而可能“失控”变为乌合之众。因而,在大模型介入网络信息传播空间后,是否会带来新的乌合之众,乌合之众的概念是否会有新的解读视角,值得进一步深入探讨。

此外,大模型的机器主体与人类发生网络连接和信息交互等行为,需要从新的机器行为范式角度去理解大模型行为。机器行为范式是指研究人机混合传播中智能机器作为主体性参与者的行为、作用和影响的理论框架,强调机器行为与人、社会之间的复杂互动关系,以及机器行为对重塑传播和社会形态的重要性。

本研究从机器行为范式视角出发,探讨基于大模型的传播应用与人类交互:作为新兴机器主体的大模型将建构起怎样的网络结构?在这种网络结构下,大模型与人建立了何种互动关系?基于大模型的网络结构是否会带来传受双方的乌合之众?

二、从大众传播到大模型:网络结构“再中心化”的超级节点

在网络科学视角下,信息传播过程中的传播者、接收者等主体,在网络中以不同属性的节点形式体现,并通过信息传递、互动等网络行为建立节点间关系连接。网络的中心以节点连接密度等作为评判依据,中心节点对于信息传播的规模和结构影响显著。从大众传播到当前网络传播的发展历程来看,传播网络结构有两次明显的变化。

(一)传播网络结构第一次变化:从中心化的大众传播到分布式的社交媒体

从大众传播到社交媒体,信息传播网络从“点到面”的中心化结构演变为“点到点”的分布式网状结构。在大众传播时代,以报纸、电视、广播为代表的传统媒体掌握着传播内容生产与分发的流程,并按照社会角色、人口特征等社会属性直接定位、覆盖目标受众群体,而作为接收者的受众群体被动接收信息,双方的信息流动呈现单向性。另外,信息传播的网络结构也呈现出中心化特征,处于网络中心位置的信源节点以单向的模式将信息传递给周围节点。

进入社交媒体时代,信息传播网络开始“去中心化”,呈现分布式结构特征。在微博、微信、Twitter等为代表的社交媒体中,传播主体不再局限于传统媒体,信源、中介和受众之间的界限变得模糊。普通用户既可以充当信息的接收者和传播者,又可以参与到内容生产环节主动发布信息,并能够同其他用户进行交流互动。同时,社交媒体的互动与连接功能推动社交网络形成,用户基于价值观、兴趣、共同关注议题等要素建立关系连接,进而建构起错综复杂的网状关系。在社交网络中,多元化的传播主体交错连接,传统媒体等不再成为网络的中心节点,整体网络结构呈现出“去中心化”的分布式特征,而信息在网络节点间双向流动。

随着人工智能技术在社交网络空间的应用,社交机器人等机器主体凭借拟人的人设特征和机器行为特征发展为影响力较强的意见领袖,也形成一些中心化的网络社群,但整体上社交媒体空间的传播高地趋于扁平化趋势,社交机器人等机器还只是众多节点的构成部分。

(二)传播网络结构第二次变化:大模型“再中心化”的超级节点结构

截至2023年6月,ChatGPT已经拥有超过1亿用户,仅当月的访问量即超过16亿次。随着ChatGPT的大火,大模型在多个任务领域持续凸显其技术优势,并聚集起相当规模的用户群。进入即将到来的大模型时代,大模型以超级节点的角色嵌入信息传播网络,网络结构也将朝向“再中心化”演变。大模型本身具有与人互动的机器行为能力,能通过应用程序直接建立起与用户的“一对一”连接关系,相较于其他节点拥有更大规模的连接密度,在网络中扮演“超级节点”的角色。

从机器行为范式来看,作为超级节点的大模型与越来越多的人类互动对象建立连接关系,其在信息网络中的重要性不断增强。在机器个体层面,大模型机器主体凭借算力优势,能够同时处理多领域任务,并对用户个性化的互动行为做出回应,使得大模型同时连接大批量用户并展开互动成为可能。同时,大模型机器主体能够基于习得的人类网络行为数据,尽可能模拟人类互动行为,深度嵌入人类信息网络,吸引更多人类用户与其建立互动联系。以ChatGPT为例,大模型对话应用凭借不断逼近人类话语风格和叙事方式,以及多领域任务处理的功能优势,在短时间内吸引数亿用户群体接入使用。

在机器集群层面,大模型为集群化机器主体的个性化和拟人化提供了丰富的数据支持,如基于基座大模型的社交机器人、数字虚拟人等。不同于以往集群化机器主体在人设打造、网络行为方面千篇一律的短板,大模型能够支持集群中的机器主体形成更加个性化、拟人化的人设,并支持不同机器主体采取各不相同的互动行为,但这并不代表机器集群将更加分布式演化。相反的,大模型支持下的机器集群将成为大模型在社交网络中的延伸。尽管集群中的机器主体差异更加明显,与真人更加接近,但无法改变由同一个大模型控制的事实,也将受限于特定大模型的算力与数据集特征。具体来讲,大模型充当了机器集群“超级中枢”的角色,统一控制机器集群的网络行为方式,这些机器集群节点成为大模型超级节点的“四肢”,向外层连接更大范围的人类主体,形成更大规模的“超级中心节点”。这种网络连接关系意味着大模型直接或间接连接网络中尽可能多的节点,成为信息传播的中心节点,拉动其他节点围绕在超级节点周围,也即“再中心化”过程。但与大众传播时代的中心化网络结构不同的是,由大模型超级节点连接的中心化网络结构具备信息双向流动的特性。图1展示了从大众传播到社交媒体再到大模型的信息传播网络结构演化。

群体的网络结构特征进一步影响信息传播特征和传播效果。而信息传播又会作用于群体网络关系改变。从信息流通和网络关系建构角度来看,大模型超级节点的“再中心化”网络结构主要有三个特征。

一是信息流动层级极简化。在分布式的网络传播结构中,信息可能需要通过多个中介节点的传递才能到达目标接收者,这不仅增加了信息传播的时间,也增加了信息失真的可能性。而在大模型的“再中心化”网络结构中,大模型直接连接到目标节点,能够有效减少中间路径的节点数量,简化信息流动的层级。同时,信息流从超级节点直达目标用户,减少了接触噪音和信息失真的概率,使得信息能直接作用于用户,也使得信息传播的效果显现变得更加直接。

二是传播过程精准自动化。在社交网络结构中,为了适应“一对一”的信息流动,信息的生成、加工、传播模式往往需要针对特定目标节点进行个性化制定。尽管这一过程能够实现精准传播,从而提升传播效果,但在传统的人工生产模式下耗时耗力,成本较高。随着人工智能技术引入信息传播,虽然机器主体能够借助自动化和智能化优势提升信息生产和扩散效率,但机器更多的是批量化工作,较难实现针对单个用户的个性化内容生成与分发。而在大模型“再中心化”的网络传播中,借助大模型的技术优势,信息生成、加工、扩散不仅能够实现完全自动化进行,同时可以根据单个用户的个性化需求自动生成信息服务,并直接传递给用户。这一过程不仅提升了信息精准化传播效果,也实现了信息生产与扩散全链条的自动化。

三是节点连接程度紧密化。在社交媒体分布式网络中,网络节点之间连接程度受节点间关系亲疏、互动行为强弱等因素影响。因而,社交网络中可能因兴趣导向、互动热度等不同而形成多个圈层化社群。这些圈层化社群并不是一成不变的,可能会出现节点逐渐紧密,也可能发生节点由原本紧密转向逐渐疏远的趋势。“再中心化”网络结构中,大模型打通了原本圈层化的网络群体生态,用一种隐形的“边”连接了众人,各节点围绕在大模型超级节点周围。同时,由于大模型与用户交互的“层层递进”“千人千面”特征,用户节点与大模型之间的连接关系可能会不断增强,两者的网络距离不断拉近,整体网络也显现出紧密化趋势。

三、大模型作为超级节点的背后:个体与“众人”的互动

从大模型的内容生成过程来看,大模型的互动模式得益于模型训练环节“多对一”的信息收集与处理逻辑,凸显大模型超级节点下个体与“众人”互动的交互本质。

首先,在技术层面来看,来自“众人”的数据是大模型训练的基石。在人工智能模型研发过程中,数据是首要的、不可或缺的要素。对于大模型来说,来自互联网的海量数据是进行模型学习训练的重要资源。据OpenAI披露,GPT-3.5大模型的训练文本数据达到45TB,随后发布的GPT-4在之前基础上又增加了大规模的多模态数据,足见数据集规模对大模型的重要性。这些海量数据不仅来自主流媒体报道,更多的是抓取自互联网用户产生的多模态内容与行为。同时从模型训练的角度出发,大模型作为互联网产业的一项产品探索,其应用场景离不开互联网环境,因而对于互联网、社交网络中海量用户数据的学习显得更为关键,决定了大模型的适用领域与范围。基于以上,从模型数据集获取的信源本质来看,大模型的“知识”来自互联网“众人”。

其次,从模型计算逻辑来看,大模型是学习众人知识而不是独立创造知识。不同于人类智能学习知识的机制,人工智能大模型的知识学习依赖于数据集和算法,需要明确的数据集规则和算法程序命令。同时,人工智能缺乏对现实物理世界的感知和理解,因而并不具备人类所掌握的创新思想和能力,只能学习已有的数字化网络数据,并根据现有数据中的经验、模式、知识重新组合。因此,大模型在计算结果的过程中,只是对数据集中已有的众人知识进行学习掌握,并根据所获经验形成新的输出结果。那么,为什么大模型在一些任务处理中输出优于常人的解决方案?这一问题的主要原因在于大模型的数据处理能力。同大模型相比,人类大脑的数据存储和处理能力有限,无法在短时间内对海量数据进行计算来支持决策;而大模型的超算力支持对海量数据的计算分析,能够基于更大规模的数据获得普适性更强的经验。对于常人而言,这些普适性更强的经验知识并不是不存在、只是很难由个人短时间习得掌握,处于个人的“知识盲区”,因而也会出现大模型“创造”新知识的错觉。

再次,从技术发展角度看,大模型的“众人”将变得越来越及时。现阶段的主流大模型,如GPT-4、GLM、文心一言等,都是借助网络历史数据进行模型主体的训练。GPT-4大模型虽然与微软Bing建立了插件服务,但这种服务更多关注人机对话与信息检索方面,其自身的插件生态亦是如此。大模型对于实时的网络数据学习仍有很大一段时间滞后。在现阶段,大模型通过学习网络已有历史数据,连接起过往的众人,并将当前交互的个人和过往数据的众人带入同一互动情境中。因而这种人与众人的互动,其实是人与过去众人的互动。但随着算法技术升级,大模型更深层次地嵌入互联网,可能会缩短对网络数据收集与学习的时间滞后,不断拉近其与网络用户的时间距离。值得期望的是,当大模型具备对互联网数据实时学习能力后,将更加深度连接到网络“众人”,也将进一步实现大模型用户个人与网络众人的实时信息互动。

综合来看,无论是对网络历史数据的学习,还是不断探索网络数据的实时学习,大模型超级节点与用户个体的互动其实还是建立在人与人的互动基础之上。大模型看似是创造性生成媒介信源,其实是一种信息处理信源,其交互内容全部来自于人类已有知识。大模型凭借超强算力支持和巨量规模数据处理优势,对超大规模网络用户的知识进行学习,其学习对象从个体扩展至众人。换言之,人与大模型的信息交互本质就是人与众人的互动。

四、大模型带来传受双方的乌合之众吗?

大模型扮演的超级节点角色,网络结构“再中心化”,大模型和用户本身都具有乌合之众的结构特征。

从大模型角度看,大模型的核心内容是“众人”,众人的信息构成了大模型的信息数据集,但众人构成没有形成有机组合,而是比拼数据体量,哪些数据量大就成为更为主导、受到更多信赖的对话内容。作为一项人工智能技术,大模型通过整合海量信息资源,可以更快、更好地响应用户获取信息的需求,但其学习的数据仍来自于当前网络社会的众人,并不是直接生成新的信息资源,也不是全部信息的叠加总和,因而其生成的内容是从众性的。大模型数据训练是算法逻辑导向,当涉及众人偏好、价值观不同的问题时,多数群体的观点往往会被算法采纳,而缺乏代表性的弱势群体的声音则可能被置之不理。因而,大模型在整合全网用户内容数据后,将众人的观点和知识作为自身思想与价值观的体现,看似逻辑严密、结构合理的信息生产,其本质上还是众人观点影响下的结果,其自身不具备批判思考的能力,都是社会“众人”思想的概率化体现。由此来看,大模型作为众人的集合,本身不具备自我意识或主观意愿,在一定程度上与乌合之众的结构特征相吻合。

从用户角度看,当每一个个体都与ChatGPT类大模型产品展开对话,通过机器来获取信息,人-机之间的交互成为主要的信息交互模式。大模型超级节点的网络结构中,用户变成一个个零散的个体,形成围绕大模型的原子化聚合。作为超级节点的大模型居于网络的中心位置,具备“领袖”的节点特征。在用户与大模型机器主体建立连接关系的同时,也一定程度上削弱了真人用户之间的连接强度。因而在这种结构关系的信息交互中,用户可能更容易受到大模型所提供的信息的即时影响,而缺乏对信息的深度分析和批判性思考。这种原子化个体聚合结构就具备了勒庞在《乌合之众——大众心理研究》一书中所描述的乌合之众的构成特征。无论是在大众传播时期,还是在社交媒体时代,乌合之众都被用于定义情感化、非理性的群体,在群体领袖的引导下形成集体认知和行为。勒庞所观察到的乌合之众的时代是被报纸所操纵的,那么大模型时代的乌合之众会被人工智能所操纵吗?ChatGPT为代表的大模型的出现将这一问题变为了现实研究的命题。

进一步深入探讨,在大模型的信息传播网络中,传受双方都具备乌合之众的表面结构特征,但真的是乌合之众的结果吗?

从技术逻辑来看,大模型还不是完全意义上的“众人”,而是算法支配下的“众人”。首先是无监督学习,大模型基于海量互联网语料进行预训练,从这些无标注数据中自我学习,寻找并挖掘知识的潜在结构及规律。经过这一环节,模型能够理解信息、构建语义关系,但并不具备价值判断和逻辑思考能力,这部分是“众人”的构成。其次是监督学习的微调和人类反馈的强化学习,这是基于人类规则的训练环节。在此过程中,引入了由人工标注的数据和人类反馈机制,通过指令精调,大模型的语言理解力得到进一步增强,大模型能够懂得基于情境采取不同的行为,其生成的内容更加符合用户需求和偏好。人的调试作为一种理性判断注入其中,使其能够成为对齐人类价值观和目标的安全大模型。所以,尽管大模型是对网络数据“众人”的学习,算法迭代正在逐步强化模型的能力,但大模型的“众人”数据背后是人工的干预和调优。

对于用户而言,当前的用户并不完全是技术决定论,也不是受众决定论。首先,围绕在大模型超级节点下的用户,在形式上可能呈现出与子弹论相似的被动接受模式。但实际上,他们并不是完全被动的,用户的主体能动性不可被忽视,用户具备独立思考、自主选择、逻辑判断等能力,不会被动、统一接受大模型的观点;用户也有能力对信息进行多角度、批判性的解读。其次,尽管大模型凭借技术特性会影响用户行为,但随着用户与大模型的互动实践逐渐深入,用户也会逐渐加深对其生成算法的感知性,并利用其认知和实践能力积极应对大模型产生的负面影响。当用户对大模型算法逻辑形成认知,其信息获取就会更加自主、理性,接收到的信息会变得多元化,也就不会轻易卷入乌合之众的洪流。再次,尽管用户是一个信息的能动处理者,但也会在一定程度上受到环境和技术影响。用户虽然可以自主选择与大模型的交互方式,但大模型在准确把握用户需求方面还存在一定理解差异,并未百分百接近人类的认知理解水平,且大模型的涌现能力也代表了其不确定、不可预测的一面,不能保证每次响应都能给出用户期待的结果。最后,用户通过自然语言与大模型交互时,也存在差异性表述,即针对同一话题可能输入不同的提示线索,这会导致大模型响应用户需求时输出异质性的理解,而这恰恰又为用户保有的内在理性与自主性提供了介入的空间。

因此,大模型的网络结构可能不会建构真的乌合之众,但会影响社会信息流通方式和社会认知方式。大模型超级节点的网络结构可快速传播、扩散内容,会对用户逐渐构建起一种认知参照。

五、结语

大模型是人工智能技术发展的新阶段,大模型的出现催生了模仿能力更强、更接近真人行为特征的机器主体,人机交互关系发生改变。一方面机器成为一个“平等”的对话者,另一方面大模型以及基于大模型的应用重新建构了人机网络结构。从技术发展角度看,大模型以及基于大模型应用建构的人机关系会更加具有黏性,中心化特点更加明显,就像ChatGPT那样的对话应用可以有上亿用户,每一个用户和大模型都可以是“平等”的交流者。

同时,我们对于大模型代表的人工智能技术对信息传播的改变也不必恐慌,以ChatGPT为代表的人工智能只是一种技术手段,ChatGPT是一种更高效、更便捷的技术,是新技术的迭代。从报纸到电视,从PC互联网到移动互联网,再到今天的大模型,技术的改变会让我们的交流越来越便利,每一次传播技术的革命都会带来人类认知的一次“爆炸”。当然,在实践中我们也需要密切关注人机关系变化带来的一些负面影响。

大模型也带来传播学研究的新命题,2023年的智能传播与2022年的智能传播在底层技术上有了质的变化。纵观2022年的智能传播研究,我们发现其既延续了对社交机器人操控舆论等问题的探讨,又在用户算法参与等方面有所创新,之中不仅体现出学者们对“技术工具论”的突破,也可以看出学界对技术实践中人的能动性愈发重视,研究视角逐渐从宏观向微观转移。而在今天,智能传播要在基于大模型技术基础上来分析才有现实意义,社交机器人、算法等都需要考虑在大模型底层技术逻辑上考察传播特征和规律。

人工智能技术的深度和广泛应用使已有的人类中心主义传播学研究范式在智能传播时代已不具备足够的解释力。机器行为对人的认知、态度和行为产生越来越重要的影响,能够塑造新的社会形态和社会权力关系,基于机器逻辑对机器行为展开综合性研究才显得更为重要,对机器行为进行专门性研究有助于人机交互更加和谐。

作者:张洪忠,北京师范大学新闻传播学院教授,北京100875;王彦博,西北师范大学教育技术学院助理教授,北京师范大学新闻传播学院博士研究生,北京100875;任吴炯,北京师范大学新闻传播学院博士研究生,北京100875;刘绍强,北京师范大学新闻传播学院硕士研究生,北京100875

原文刊载于《新闻界》杂志2023年第10期,参考文献详见原文

编辑: 徐秋染 谢豪莹(实习生)

校对: 孙尚如

审核: 段吉平 杨国庆 

 
最新文章
相关阅读