岛主寄语
这是计传岛的第一篇推送,我是岛主樱丹,就读于斯坦福大学传播系。
十二月末的一个再普通不过的工作日晚上,我从代码中醒来,终于找到片刻闲暇让我可以回望过去几年的研究学习。身为一名计算传播领域的研究者,我常常惊叹于它的发展和变化——这些变化既包括了研究范式和计算方法的日臻成熟,同侪前辈佳作频出,还包括了人们对这一领域逐渐升温的好奇心,以及那些不断涌现的新问题和新困惑。它们都需要被介绍,被分享;需要被探索,也需要被解答。在这些激励之下,我邀请了两位志同道合的学界好友,就读于波士顿大学的伊妍和威斯康星大学麦迪逊分校的泽宁,一起创建了这个公众号,开辟了这座属于每一位计传学人的小岛。
作为计传岛和大家正式见面的第一篇推送,我们设想过很多方式。我们在一次讨论中发现,尽管我们三个人的学习经历各异,但一路摸索学习的过程中都面临着一些相似的困惑。我们也同样好奇,很多想进入或者刚进入计算传播领域的海内外青年们又有哪些疑问。因此,我们从不同平台收集了十个关于计算传播的提问,希望以讨论的形式展现我们对这些问题的个人理解,也希望这些疑问不再成为大家迈入这个领域的拦路石。
正如计算传播领域本身正在不断拓展变化一样,以下每个问题目前也没有恒定的标准答案。但正因“真理越辩越明”,所以我们尝试用Q&A的方式,来分享我们的思考,和大家一同改进答案。同时,这个小小的Q&A也是计传岛这个公众号的召集令,我们期待,更多志同道合的朋友登上我们的小岛,也期待听见更多值得思考的问题。
欢迎大家登上计算传播的小岛!
1.什么是计算传播?是传播学还是计算机学?计算传播和传播学的关系是什么?
樱丹:计算传播是传播学近年来的一个新兴分支。2019年,Martin Hilbert等十余名用计算方法研究传播现象的先驱学者发表了一篇总结性的论文,将计算传播定义为“通过在观察性研究、理论类研究和实验性研究中开发并应用高度自动化的数字工具从而理解人类传播”(“understand human communication by developing and applying digital tools that often involve a high degree of automation in observational, theoretical, and experimental research”, pp. 3915)。我个人把它理解为计算社会科学和传播学的交叉领域,在我看来是传播学未来发展的重要方向。虽然名字含有“计算”二字,但这个计算强调的是用计算的方法解决传播学中的具体问题,而不是“计算机学“或者简单等同于“大数据”、“代码”等工具概念。
泽宁:计算传播(Computational Communication)是传播学的一部分,它强调对计算工具的训练和运用,但它关注的依然是人类的信息传播问题。因此,它与以信息和计算应用研究为主的计算机科学有着本质区别。计算传播并不是一个排他性的标签。举个例子,一项关于Twitter平台新冠疫情假消息的研究,从研究方法上看,它可被认为是一项计算传播研究;而从研究问题上看,它也可以被划入科学传播的范畴。目前的一个共识是,计算传播并不是一门独立学科。我个人认为,计算方法的出现为传播学带来了又一次自我发展。某种程度上,人们现在对于计算传播的期待和思考,和上世纪30年代问卷研究(survey)作为一种新方法刚出现时的讨论,有相似之处。
2.计算传播与哪些学科有交叉或者潜在联系?
樱丹:就我个人的学习观察而言,计算传播采取了计算机、统计、神经科学、工程等不同学科中的基本工具和方法。而依托计算社会科学的大背景,计算传播和社会科学其他学科(政治学、心理学等)的学科联系和交流在近年也有逐渐加强的趋势。
泽宁:计算传播研究天生具有跨学科基因。计算传播研究常常从其他学科借鉴方法和数据处理手段来解答传播学问题。举个笼统的例子,计算传播从计算机科学借鉴了自然语言处理、图像处理等技术手段,从网络科学借鉴了网络分析的方法。当然,计算传播研究也反哺了学科河的另一侧,有时也引领了跨学科的研究合作。
3.计算传播目前的发展情况如何?前景如何?
樱丹:四个字来形容——“蒸蒸日上”。列举几个基本事实:2016年国际传播学会(ICA)成立了计算方法研究小组(Computational Methods Interest Group),短短四年之后计算方法研究小组就升格为计算方法分会(Computational Methods Division),目前已经拥有近300名会员,2019年还创办了以计算传播和计算方法为主的开源期刊《Compuational Communication Research》。2018年4月21日,中国新闻史学会计算传播学研究委员会正式成立,而之后在全国计算社会科学高端论坛等大型以计算社会科学为主的学术交流中也多有传播学学者的身影,从参与和社群来说整个领域日渐壮大。另一个更直观的感觉是计算传播这一领域的学术产出越来越多,就我自己而言,感觉身边对计算传播感兴趣的学生也越来越多,每次去开会和大家交流感觉有很多新老朋友都在这个领域之中探索,对这个领域也越来越有信心!
伊妍:樱丹列出的数字已经能很好的说明问题了。我提供另一个角度:在近几年高校教职招聘启事里面, "big data", "computational", "data analytics", "data journalism" 都是一些很常出现的关键词,可见需求还是比较大的。除了学术导向的需求之外,广告、公关、市场营销还有新闻这些比较实务性的专业都在招收有计算传播授课能力的老师。当然近几年进入这个领域的人也非常多,什么时候达到饱和就很难说了,不过目前需求与供给之间的空间还是比较大的。
图片来源:
https://www.marketing91.com/top-10-communication-skills/
4.除了在社交网络上收集数据、分析传播现象,计算传播还有其他的研究场景和语境吗?
樱丹:有的。除了社交媒体数据,越来越多的研究正在利用更多类型的数据。以我自己的研究为例——我所在的The Human Screenome Project课题组利用数以千万的手机图像数据对手机使用行为以及行为背后的注意力、性格等媒介心理学中的重要问题进行研究。计算方法也革新了实验研究,使得大样本的问卷实验、跨平台的在线田野实验(online field experiment)成为可能。
伊妍:我的好几个项目就是利用计算传播方法处理新闻网站数据,我们系也有其他人在研究其他场景下的问题,比如手机app下载行为。社交网络平台只是提供了一个比较便捷观察人们行为的窗口和获取数据的接口,很多人研究它不代表它是唯一的应用场景。
泽宁:当然,新的研究场景值得我们去想象和探索。
5.如果想学计算传播,本科最好是哪些专业?本科需要有代码基础吗?
樱丹:我认为没有专业限制。但是如果对计算传播感兴趣的话其实建议大家在本科阶段学习或者接触一些代码和统计的相关知识,提前打一些基础,或者参与一些老师指导的学术项目,积累经验,这样可能对于之后正式进行学术训练会有帮助。
伊妍:我认为跟你从事的计算传播内部的细分方向相关。我高中时特别想学的一个专业是应用语言学,到现在我也认为它是一个为我使用自然语言处理方法打下良好基础的专业,所以很后悔没能报上哈哈。不过我也同意樱丹说的,我的同事里面有理工科出身的,也有学历史的、教育学的、经济的。至于本科打下代码基础,我个人认为可能对你的研究生申请比较有帮助。但即使没有基础,我也见过很多读研之后很快自学赶上来的例子。跟个人的时间分配和学习能力比较相关吧。
泽宁:不受限制。代码训练早学早受益。每个人的学习曲线不同,在任何时候开始学习都不晚。
6.一开始怎么对计算传播感兴趣的?怎样进入这个领域的?
樱丹:我在本科的时候因为关注社交媒体研究开始接触大量的文本数据,但那个时候没有系统学习过如何用量化的方式使用并且分析这些数据。后来我来到斯坦福读硕士的时候,感觉这边计算社会科学的氛围很浓厚,接触到了很多计算社会科学方面的优秀学者(比如Jennifer Pan教授、Justin Grimmer教授、Sharad Goel教授等等),选修了他们开设的量化方法、程序语言、机器学习这些基础课程,慢慢进入这个领域。读博之后我开始正式地进行方法训练,因为几个研究项目涉及到计算传播中的不同方法,所以让我在项目中巩固了一些技能,到现在才能说是刚刚上岸。在这个过程中很重要的一点——我博士阶段的导师一直都在计算传播领域进行前沿探索,在方法上面给予了我很多的指导,同时身边有很多优秀的朋友也都是做这个方向的,所以也算是良师益友助我上岸。
伊妍:我也是本科的时候开始接触计算传播方法的。大四的时候因为在北大新媒体研究院的舆情实验室当研究助理,跟着师兄师姐去旁听了一些硕士的方法课,开始对社会网络分析产生兴趣。不过那个时候也懵懵懂懂的,不知道这些方法有什么用处。来到美国读博士之后,我开始更多从研究问题出发去学习我需要的模块化知识。因为我的研究项目要求对大量社交媒体和新闻文本进行分析,我才去学习主题建模和基于机器学习的一些自然语言处理方法。我和樱丹一样,导师在其中扮演了很重要的作用。我的博士导师和计算机科学的学者有很多合作,也开设了入门的计算传播课程,所以接触计算传播对我来说好像是一个自然而然的过程。
泽宁:我学习计算传播的时间晚一些。在北师大念硕士一年级的时候, 我开始接触计算的概念。那时候学校开设了一门计算社会科学的公选课,任课老师是张伦教授,我选修了一学期。硕导张洪忠教授也热心推荐我去参加其他研究团队的组会,比如在信息系统学院的王文旭教授的组会里,我听了很多关于脑神经网络和阿尔兹海默症干预的相关研究。虽然一知半解,但这段经历帮助我打开了想象力的边界——原来数据可以这么玩。后来因缘际会去了香港城市大学媒体与传播系, 我在那里系统地学习了编程语言、媒体数据处理和网络分析。在祝建华教授的Web Mining Lab里的训练也给了我很多的帮助与成长。19年我来到威斯康星大学新闻学院读博,学院里计算传播的训练和研究传统悠长,学生教授之间的合作氛围非常融洽。学生们有多门计算方法和数据分析的课程可以选择,各个研究组里也有很多与计算相关的选题可以参与;除此之外,学生们开办和运营了面向全校的计算方法兴趣小组,隔周便有一次计算方法工作坊。和樱丹和伊妍一样,因缘巧合、兴趣使然,我走上了计算传播的学习道路。
图片来源:https://www.eschoolnews.com/2020/03/25/full-computer-science-curriculum-and-coding-platform-at-no-cost/
7.计算传播的研究方法是什么? 常用工具有哪些?
泽宁:很难毫无遗漏地介绍所有的计算方法,原因主要有两点:计算方法的边界是模糊的,举个例子,在线自然实验兼具实验和计算两种特征。其二,计算方法的边界在不断地拓展,旧方法在迭代,新方法和新应用被不断地涌现。
按照国际传播学会计算方法分会的网站介绍,计算方法包含了“计算化工具和算法”,它们被用于“数据的收集、处理、分析和可视化”。同时,数据来源有很多种,比如“社交媒体,新闻网站,和其他形式的信息交流等”。可见计算方法是一种方法学(Methodology)。
我的拙见是,计算传播的研究方法是用计算工具来解决传播学问题的方法。一些常用的计算方法有社会与语义网络分析、自然语言处理、语音图像分析、生理数据(如皮层、脑电数据)处理等。常用的工具如Python、R等编程语言,STM和NetworkX等提供主题建模和网络分析的软件包,Amazon Mechanical Turk 和IBM Cloud等提供众包和云计算服务的第三方平台等。尽管数据抓取不属于分析范畴,但掌握通过编程语言或第三方平台抓取数据的方法,也是计算传播研究者的必修课。在接下来的推送里,我们也会和大家逐一介绍这些研究方法的使用和常用工具的优势与陷阱。
8.常用的统计方法和模型是不是适用于计算传播?学习计算传播的同时还需要学习统计吗?怎么学习统计知识?
樱丹:适用,需要去学。我感觉支撑计算传播研究很重要的一点就是过硬的统计知识,尤其是在数据量非常庞大的时候,如何以科学的方法和模型去刻画数据背后的意涵非常重要,了解更多的统计知识也能够帮助我们更好地去开发和利用手里面的数据。我是在博一的时候在政治系学习了一整年Political Methodology的系列课程,之后也上过本系的时间序列分析课程和其他系的统计方法课程。但即便如此,到现在我还是感觉自己在统计的训练上不够完备,每年基本都得上统计课去补补脑或者回回炉(虽然一把年纪写作业真的很伤……)。
伊妍:需要的。我自己是本科通过经济学双学位学了计量方法,在社会学系旁听了社会科学统计方法,来美国之后又在传播学院学了时间序列分析,并且在心理学系上了结构方程模型的课,但是目前还是觉得自己的统计知识很不够……这种四处蹭课的现象好像也体现了我们的跨学科性哈哈。谈到统计方法和计算传播方法的结合,举个例子来说,我通常会用API爬取一些社交媒体或是新闻数据,用主题建模、机器学习分类或者语义网络分析对文本进行分析,最后还是会使用传统的统计回归模型或者时间序列分析来讨论不同文本之间的关系,或是文本阅读对人们态度和行为的影响。所以这两者可以说是密不可分的吧。
泽宁:适合,统计工具和计算方法在研究中是相辅相成的,它们解答的是不同研究阶段的问题。
图片来源:
https://www.marketing91.com/five-types-of-communication/
9.计算传播学除了发展方法,在理论方面如何进行发展呢?
樱丹:非常好的问题,无论采取什么样的方法,最后都要回归到问题和理论。我的基本观察是,计算传播在近年来的方法革新的确带动了理论发展。以我所在的图像分析领域为例,传统方法下大多数的研究都集中于分析图像所带来的框架效应,但是利用计算机视觉和深度神经网络等量化视觉分析技术,我们可以更加全面地研究图像在多个维度的特点以及这些特点所带来的媒介效果,比如图像的颜色特征如何影响人们对于内容的参与。与此同时,我们也可以在海量数据的支撑下去验证传统方法中发展出的理论。比如我们通过对百万级别的手机图像数据进行分析后发现,趋同化(homogenization)和本土化(localization)这两种理论并非是对立理论,而是可以同时存在于用户的手机使用行为之中。方法和理论相互发展的问题其实也是一个能让我保持研究清醒的问题,我也希望自己的研究能够通过计算的方法来发展理论。
伊妍:这也是一个挺难回答的问题,希望我们以后采访的学界前辈们能有更好的答案xD。我个人的看法是,研究方法和方法论的发展是可以促进理论发展的。比如我在研究的议程设置理论中,传统的方法就是把单次的问卷调查结果和总体的新闻议程进行相关分析。这种方法一直以来就备受质疑,也有很多人认为在现在这种碎片化的新闻阅读环境下,这个理论已经过时了。但大家看看近年来发表的议程设置理论相关文献就可以发现,随着引入固定样本数据、时间序列分析、自然语言处理、社会网络分析等等方法,不仅发展出“网络议程设置(networked agenda-setting)”这样的新理论,也让之前没有办法实证探索的假设也变得可证伪。我的毕业论文在研究的一个话题就是“反向议程设置”,想看看普通人在社交媒体上的发言是如何反向影响媒体议程的。这样的研究在我们拥有能够抓取和处理上百万条的社交媒体和新闻数据之前,可能是无法进行的。所以我的观点和我一开始进入这个领域的路径一致:我们仍然是从传播学其他子学科的研究问题出发,从计算传播学中汲取养分,再通过扎根现象来发展计算传播学。这可能会是一个循环往复的过程。
10.可以推荐一些入门课程和handbook等书籍吗?
樱丹:我想推荐的是哈佛大学的Kosuke Imai(今井耕介)教授的《Quantitative Social Science: An Introduction》,最近刚刚出了中文版(《量化社会科学导论》,今井耕介著,祖梓文、徐轶青译)。这本书是我们系传播学方法课程所用的教材,在统计学和R语言编程上都有所涉及,而且写作一点都不枯燥晦涩,很适合入门使用。我们的公众号之后也会对一些入门课程以及资源进行分享推送,我们目前也为关注我们的朋友们准备了“上岛”大礼包,欢迎关注我们呀!
伊妍:Coursera和EdX这类的网课平台上都有很多好的入门课程,以"applied"、"computational"、"network"和"natural language processing"等关键词搜寻就能找到不少。其中我推荐一门密歇根大学的"Applied Data Science with Python Specialization" (https://www.coursera.org/specializations/data-science-python。文末点击”阅读原文“即可跳转哦~)。从如何使用Python开始介绍,内容涉及了简单的机器学习和文本处理。不过这门课程的节奏比较快,可能需要反复观看才能完全学会。
泽宁:我推荐普林斯顿社会学系Matthew J. Salganik教授的“Bit by Bit: Social Research in the Digital Age”。Salganik教授好几年前就已经把这本书写完,现在看依然觉得思路清晰,豁然开朗。这本书是一个关于计算社会科学研究的地图,适合想了解计算社会科学的初学者,相信这本书读完后一定会让你对计算研究兴趣倍增。在之后的推送里,我们也会详细和大家分享这本书。说到入门学习和训练,我想引述祝建华教授的一句话:“算法是入场券,很重要;数据是故事,更重要;理论是灵魂,最重要”。在我看来,计算传播研究的学习也可以分为这三部分:一是对计算工具的掌握,伊妍推荐的课程是很好的自学资源;二是计算思维和数据敏锐性的训练;三是社会科学研究的实践,樱丹上面推荐的书非常值得一读。
结语
我们在这次的问题征集中还收集到了一些好问题,比如“如何评价一个好的计算传播学研究?”“开放科学(Open Science)对于计算传播的意义如何?”等等,但因为篇幅有限,无法在这篇文章中对所有问题进行解答。我们希望通过之后与海内外知名学者的对谈或者更多社区内的讨论中得到更多的真知灼见,也请大家多多关注我们的公众号,我们也会第一时间为大家总结分享这些答案。
我们是谁?
“计传岛COMputation”公众号由斯坦福大学、波士顿大学、威斯康星大学麦迪逊分校的青年传播学者于2021年1月创立。我们从传播学和计算社会科学的交汇领域出发,关注数据驱动下的传播现象,探索人类传播行为可计算的基础问题。我们立足于计算传播领域的经典研究和前沿学术动态,开展线上线下学习研讨活动,推动计算传播学的学术发展和成果转化;分享海内外计传学术资源,打造具有国际影响力的华人计传青年学生学者社群,让社会计算学术成果服务社会。
版权信息
转载说明:本公众号文章版权归“计传岛COMputation”团队所有,欢迎转发交流。未经授权请勿转载。如需要转载授权,请通过以下方式联系我们:
热门跟贴