Center for Studies of Media Development, Wuhan University.
教育部人文社科重点研究基地
article
珞珈问道 | 梁海:计算传播学研究:使用、结构、扩散、内容与效果
发布时间:2023-04-07 作者:CSMD 来源:CSMD

图1 梁海老师讲座海报

2023年4月25日下午,香港中文大学新闻与传播学院梁海副教授应邀出席第92期“珞珈问道·中国传播创新论坛系列讲座”,带来题为 “计算传播学研究:使用、结构、扩散、内容与效果”的学术分享。中心副主任肖珺教授担任本次活动主持人。

梁海现任香港中文大学社会科学学院计算社会科学实验室的副主任,社会与空间网络项目的负责人,香港城市大学互联网挖掘实验室的核心成员。他长期关注计算社会科学、社交媒体分析、政治传播及公共卫生等领域,已发表大量高水平研究成果。

图2 梁海老师讲座中

梁海首先说明本次讲座的主题为什么是“计算传播学研究”,而非“计算传播学”。首先,它还不是一个独立的学科,所以把“计算传播”作为一个研究领域更为妥当;其次,“计算传播”作为一个研究领域还相对较新,它的内延和外涵尚在变动,还难去界定;再次,该研究领域的学者来自各个学科。与“计算传播学研究”高度相关的概念是“计算社会科学”。社会科学家关心的是社会的问题,不管是理论还是实际的问题。在社会科学家解决本身自己的问题时可以用到多种计算的手段,如最简单的Excel,针对问题我们有足够的知识或者方法去解决它就可以了。

图3 讲座现场

接着,梁海总结了计算社会科学所具有的三个基本特征:第一,计算社会科学是经验的而非批判的,它不是来自于顶层设计的,而是自下而上的;第二,计算社会科学是量化的而非质化的;第三,计算社会科学是数值的,而非分析的。计算社会科学的数据获取是非介入的和自动化的,“非介入”是指研究者没有干预数据的产生过程,在传统的量化研究中,无论是调查研究还是实验研究,数据的产生都来自于研究者的主动干预,而因研究者干预产生的数据通常会导致许多问题。此外,计算社会科学的数据分析一般是自动化的、数值的分析。

接下来,针对如何运用计算方法的问题,梁海概括四个要点:

其一,测量(measurement)。量化研究一定涉及测量,因为研究者要测出一些变量的值才能计算,在计算传播研究中也不例外。比如研究者想看某媒体报道了什么不同的主题,我们可以用机器学习帮助实现文本特征的提取;针对网络指标,如果研究者使用社会网络分析的方法,可以“制造”很多变量如中心性、网络密度等并加入到研究中。

其二,描述(description)。例如,虚假信息是当前传播学研究的一个热点,很多人以为互联网上存在大量的虚假信息。但网络空间中真的充斥着虚假信息吗?一项研究对互联网中的虚假信息进行了描述:首相,研究者认为大多数的虚假信息源头应该都是有租住的,而这些组织机构有自己的网站来获取流量。在这个假设前提下,研究者们就可以通过找到了众多虚假信息的源头来估计虚假信息的普遍程度。他们的描述性结果显示虚假信息并没有我们认为的那么多,能够接触这些虚假信息的人可能更少。    

其三,推断(inference),它强调的不是简单的描述,而是因果关系。

其四,干预(intervention),梁老师幽默的说,“干预”研究是“最高级的”,因为干预有很多现实的社会意义,比如减少极化言论与仇恨。

梁海认为,讲计算传播学时需要先了解“什么是传播学”,他将其总结为“使用、结构、扩散、内容、效果”五个阶段。

第一个是使用(use)。相较于传统媒体使用研究,社交平台上关于用户“使用”的研究内容更普遍与宽泛。互联网平台的使用属于用户生活的一部分,相关的研究我们称之为用户分析(user analytics)。

第二个是结构。结构在以前指大结构、宏观的结构。现在,关于结构有一个非常大的变化,就是基于社会网络分析。以前我们研究宏观结构,大家会讲制度、政体、规范、文化等,它处于一个抽象到半抽象的位置,很难落地。社会网络是一个很好的研究结构的载体,它其实就是关系网络的结构特征。你可以把它当作一个宏观的结构。

第三个是扩散。内容是如何在网络中传播的?扩散是经典的传播学理论,来自于卡兹-拉扎斯菲尔德的两级传播理论。互联网或社交媒体刚兴起时,很多人觉得“人到人”的人际传播是主流,但现实是很少有一个信息是这样传递的;相反,特别火的东西往往是大家都从一个信息源看到。

第四个是内容。内容是大家最熟悉的,以前研究用户在网络上生成的内容我们叫UGC(user generated content),现在研究AIGC(AI generated content)。内容涉及的是文本挖掘,简单的文本挖掘就是研究者制造一些变量,高深一点是做因果推断。还有就是,文本挖掘可以跟别的方法一起做,比如网络分析,建一个语义网络等。

第五个是效果。卡茨说所有的传播学研究都是效果研究,如果没有效果,传播学研究很难立足。人们可以从文化的角度去阐释它、从批判的角度去批判它,但所有的前提是假设它有用、有意义,如果没有用那么人们就不需要去研究它。关于观察性数据的效果,我们可以做自然的实验、因果推断、现场试验等。研究者可以将文本作为自变量,用来研究内容效果。此外,还可以把文本作为混淆变量,例如通过深度学习来控制文本中的高维混淆变量,以及作为因变量,来研究诸如文本流行度等问题。

图4 讲座现场

大家如果对量化传播学感兴趣,可以去关注“互联网挖掘实验室”公众号和相关专著,如《大数据时代的计算舆论学》。

最后,梁海阐述他关于计算传播学的理论贡献的一些思考。计算社会科学在现代化(modernize),而非取代传统社会科学。它是社会科学研究方法中的一种,也不能回答所有的研究问题,甚至很难成为最主流的研究方法,因为这不是由计算社会科学本身决定的,而是由人们的沟通方式,媒体环境的发展等决定的。新的理论往往伴随新的方法(研究设计),但这并非必然。我们需要理论,而且理论要够抽象,这样我们就不用去做每一个实验,所以理论具有实用性。

梁海讲座结束后,在场的同学和老师与他积极互动。博士生李龙腾提问,梁海老师以计算为方法的同时,是否有自己的研究偏好、如何选择研究议题?在面对这些议题时,计算方法的边界和局限又在哪里?梁海老师笑称自己的研究兴趣是“自然”延伸、摸索开来的,从心理学、病毒传播到政治传播,他更关心如何用研究切实解决一个有趣的问题。而涉及到人的感知、态度、心理状态等问题,计算方法是难以处理的,尽管也有一些脑神经科学的尝试,但目前还不够有解释力。硕士生贺一飞同学提问到机器学习的因果推断和计量经济学开发的一系列因果推断策略的区别是什么?梁海老师对此的回答是机器学习因果推断的思路是通过机器学习对大规模文本进行特征识别,提炼出大量的“混淆因素”并加以控制;而计量经济学开发的因果推断策略本质是通过研究设计来识别外生冲击带来的随机性。还有硕士生徐艺萌同学提问到,内容分析法对于某些变量的划分可能并不全面,例如将文本情感属性划分为正面与负面,而实际中的文本所包含的情感属性更复杂。如何采用计算传播的方法保留这些更为复杂的变量划分?哪种情感属性的文本信息转发量更高?梁海老师对此谈到,内容分析法的一个“弊端”是它只能将变量划分出人为可以观测到的、有限的类别,有时会过度拟合。而实际上潜在的类别可能有几十个甚至上百个,人为难以区分,而机器可以做到。同时,机器可以挖掘出相当多的高流行度的文本特征,你是无法穷尽的。社会科学是由理论驱动的,背后需要有内在的因果逻辑,所以一定要有一个好的问题或假设,不需要那么全面,甚至不需要具有因果,但是体现了一种理论逻辑,你只需要借助计算的工具证实或证伪。

图5 博士生李龙腾提问

            图6 硕士生贺一飞提问

学生提问后,中心研究员、贾煜副教授就在研究中使用部分文本数据和二手数据时如何更匹配,慕文龙博士就在顶刊论文发表中使用中国样本数据因其特殊环境会不会遇到数据不完整的情况,如果审稿人提出相应问题我们如何去解决等问题与梁海展开讨论。

    

图7慕文龙老师(左2) 、贾煜老师(左3)交流中

中心研究员、新闻与传播学院副教授董庆兴作为与谈人分享其对梁海老师报告的几点感受。首先,董庆兴认同梁老师对计算传播概念的界定,认为计算传播研究是利用计算手段研究传播学问题,计算的方法是解决问题的工具,重点还是要回应传播学领域的议题。计算方法和非计算方法如质化研究本身没有优劣之分,只是在特定研究问题上有适配度的差别。董老师认为大家在研究中可以秉承方法上的“拿来主义”原则,以更好地解决问题为目标,不要被研究方法束缚。其次,董老师认为梁老师总结的 “测量、描述、推断、干预”恰好构成了社会科学研究的四个重要议题。传播学作为一个社会科学学科,需要回应上述议题。计算手段的发展,给我们带来了一些更好、更快的工具去解决这四个领域的问题。最后,董老师回应了梁海老师关于理论的讨论。他以张五常的“事实不能解释事实”这一观点作为引子,认为一定程度的抽象依然有其必要,因此计算传播研究的核心依然是理论。此外,虽然现在是大数据时代,但是我们依然无法获得全集数据,所以理论推断在计算社会科学研究中处于核心位置。计算传播研究往往需要大量数据,很容易让人忘记理论的重要性。但是即使是数据驱动的研究,也必须要有理论关切。

图8 董庆兴老师发言

活动最后,肖珺代表主办方感谢梁海的精彩讲座。她提到,近年来,计算社会科学对新闻传播学研究产生了明显的影响。梁海老师结合自己这些年的研究经历,严谨地提出,当下研究更多是计算社会科学和新闻传播学的结合,还不能“贸然”提出“计算传播学”。他自己的研究给我们一些示范,比如,如何认知数据的学术价值?如何进行提问和研究设计?计算社会科学可以解决什么,但不能解释什么新闻传播学问题?特别是,梁海老师从人类传播的五个阶段出发,分别解释计算社会科学可以解释的现象,以及如何通过设计可以更好地描述和分析。计算社会科学呼应当下数据驱动的传播生态,但我们需要深入思考的是,数据从何而来?数据为谁所有?数据能解释所有的人类传播活动吗?进而,如梁海老师所说,计算传播学研究只是众多研究方法和路径中的一种,我们作为新闻传播学的研究者,需要结合具体的研究对象、问题和情境,选择适合的、科学的方法,通过研究之间的彼此验证和支撑,更充分和深入地揭示社会事实,这也正是新闻传播学百花齐放的价值。

本次活动在中心331会议室举行。除肖珺、董庆兴、贾煜、慕文龙参加讨论外,《新闻与传播评论》副主编刘金波编审、罗晨老师和贾瑞雪老师也参与了活动。活动当时,窗外春雷滚滚、暴雨如注,但中心会议室内,有近30位师生全程参与近3小时的学术活动。

图9 与会老师合影

 

图文 张琪云

编辑 张琪云

关于我们
关注我们
  • 微信公众号:武汉大学媒体发展研究中心
找到我们
  • 地址:湖北省武汉市武昌区珞珈山樱园路
  • 邮编:430072
  • 电话:027-68756616
  • 邮箱:whucsmd@163.com