機(jī)器的心報(bào)道

機(jī)器心臟編輯部

病毒影響著人們的身體,并且正在改變?nèi)藗冎g的關(guān)系。

美國(guó)羅切斯特大學(xué)的計(jì)算機(jī)科學(xué)家正從推特輿情中分析新型冠狀病毒大流行帶來(lái)的社會(huì)影響,其結(jié)果令人深思。

自今年 1 月底以來(lái),新冠肺炎(COVID-19)逐漸呈現(xiàn)全球范圍流行趨勢(shì),成為國(guó)內(nèi)外人們議論的中心。雖然早在 2 月世界衛(wèi)生組織(WHO)就將該病毒命名為 2019 冠狀病毒?。–OVID-19),但在國(guó)外社交網(wǎng)絡(luò)上仍有不少用戶使用「武漢肺炎」、「中國(guó)病毒」這類(lèi)完全錯(cuò)誤的說(shuō)法。

但使用這些詞匯的人到底有多少?他們是什么樣的人?使用這些詞匯的心理動(dòng)機(jī)是什么?近日,羅切斯特大學(xué)的研究人員對(duì)此進(jìn)行了一系列研究。

根據(jù) GDELT 數(shù)據(jù),全球線上媒體報(bào)道范圍內(nèi),提到「中國(guó)流感」一詞的新聞報(bào)道量從 1 月 18 日開(kāi)始上升,而世界衛(wèi)生組織 WHO 的官方標(biāo)準(zhǔn)名詞是 COVID-19。同時(shí),與 COVID-19 有關(guān)的種族襲擊事件的報(bào)道量也在增加。

隨著新冠病毒的全球大流行,新冠病毒成為社交平臺(tái)上用戶討論的熱點(diǎn)。這些用戶在提到 COVID-19 的時(shí)候,主要有兩種提法,一種是使用「中國(guó)病毒」(Chinese Virus)或者「武漢病毒」(Wuhan Virus)這類(lèi)詞匯,另一種是使用「新冠病毒」(Coronavirus)這類(lèi)詞匯。

羅切斯特大學(xué)的研究團(tuán)隊(duì)使用 Tweepy API 抓取大量數(shù)據(jù),并對(duì)選擇這兩種用詞的人群從年齡、性別、政治傾向、地理位置以及更深層的心理層面進(jìn)行了分析。

社交媒體上說(shuō)「中國(guó)病毒」的都是什么人

該研究團(tuán)隊(duì)于 4 月中旬發(fā)表了系列研究的第一篇論文《Sense and Sensibility: Characterizing Social Media Users Regarding the Use of Controversial Terms for COVID-19》,作者為羅切斯特大學(xué) Goergen 數(shù)據(jù)科學(xué)中心 Hanjia Lyu、計(jì)算機(jī)科學(xué)系 Long Chen 和羅杰波,以及政治學(xué)系 Yu Wang。

論文鏈接:

該研究團(tuán)隊(duì)使用 Tweepy API 抓取了一千七百萬(wàn)條推特及其作者信息,試圖研究選擇這兩種用詞的人群在年齡、性別、用戶層面特征(如粉絲數(shù)量、是否為大 V 用戶)、政治傾向(在推特上粉了哪些重要的兩黨人物),以及地理位置上的區(qū)別。在研究中,團(tuán)隊(duì)還設(shè)計(jì)了分類(lèi)器用于預(yù)測(cè)哪些推特用戶更傾向于使用如「中國(guó)病毒」這類(lèi)詞匯。

根據(jù)對(duì)上百萬(wàn)條推特的分析,研究人員得出了很多值得關(guān)注的結(jié)論:

使用「中國(guó)病毒」這類(lèi)表述的男性占比 61%;

使用新冠病毒這類(lèi)表述的男性占比 56.2%;

使用新冠病毒這類(lèi)表述的人里面,一半以上年齡在 35 歲以下;

來(lái)自鄉(xiāng)村地區(qū)和城郊的推特用戶更具有使用「中國(guó)病毒」這類(lèi)表述的傾向;

在可確定政治傾向的人群中,唐納德·特朗普的支持者最傾向于使用「中國(guó)病毒」這類(lèi)表述,伊麗莎白·沃倫、皮特·布特吉(均為 2020 民主黨前總統(tǒng)候選人)的支持者最傾向于使用中立詞匯 ;

推特賬戶建立時(shí)間越長(zhǎng)的用戶越傾向于使用新冠病毒這類(lèi)表述。

圖 1 是全球有關(guān)「中國(guó)流感」以及 COVID-19 相關(guān)的種族襲擊新聞報(bào)道的體量時(shí)間線。與 COVID-19 有關(guān)的種族襲擊事件的新聞報(bào)道量仍在不斷上升。已有研究發(fā)現(xiàn)部分媒體將 COVID-19 與「中國(guó)病毒」直接掛鉤的報(bào)道對(duì)在全球范圍內(nèi)旅行的中國(guó)人精神健康造成了負(fù)面影響。除此之外,社交平臺(tái)上「中國(guó)病毒」或「中國(guó)流感」的使用量也在增加。3 月 16 日,美國(guó)總統(tǒng)唐納德·特朗普使用其推特賬戶明確將 COVID-19 稱作「中國(guó)病毒」。盡管他在之后聲稱這種用法并沒(méi)有種族含義,但針對(duì)在美亞裔的種族主義與歧視仍在美國(guó)社會(huì)蔓延。

圖 1:「中國(guó)流感」與 COVID-19 相關(guān)種族襲擊新聞報(bào)道的密度。

Matamoros-Fernandez 曾提出「平臺(tái)種族主義」(platformed racism)的概念,如推特這樣的社交平臺(tái)其實(shí)是種族主義的放大器。使用有「中國(guó)病毒」這類(lèi)表述指向 COVID-19 的時(shí)候可能是在發(fā)布仇恨言論,仇恨言論反映了存在于社會(huì)內(nèi)的矛盾。在社交平臺(tái)上,仇恨言論的傳播極度迅速,甚至可以跨平臺(tái),并且留存較長(zhǎng)的時(shí)間。即便事后被有意識(shí)刪除,人們?nèi)耘f可以在互聯(lián)網(wǎng)的其他地方甚至線下找到痕跡。

羅切斯特大學(xué)的研究聚焦于分析使用「中國(guó)病毒」詞匯或「新冠病毒」詞匯的人群在年齡、性別、用戶層面特征(如粉絲數(shù)量、是否為大 V 用戶)、政治傾向(在推特上粉了哪些重要的兩黨人物),以及地理位置上的區(qū)別。

為了找到這樣的用戶,該研究以「中國(guó)病毒」和「新冠病毒」為關(guān)鍵詞,抓取使用了這兩類(lèi)詞匯的推特及其發(fā)布者,將推特里有「中國(guó)病毒」的劃分為CD組,將推特里有「新冠病毒」的劃分為ND組。經(jīng)過(guò)分析,該研究得到了以下發(fā)現(xiàn)。

年輕人更傾向于使用 ND 詞匯

圖 2 展示了兩組人的年齡分布。在兩組內(nèi),25-34 歲是用戶數(shù)量最多的年齡段,這也與全體推特用戶的年齡分布一致。然而兩個(gè)組的各年齡段占比卻顯著不同(p

圖 2:CD 與 ND 組用戶的年齡分布。

該研究進(jìn)而發(fā)現(xiàn),ND 組里女性用戶占比比 CD 組里女性占比更高。而在比較了用戶的粉絲數(shù)(#followers)、好友數(shù)(#friends)、狀態(tài)數(shù)(#statuses)、點(diǎn)贊數(shù)(#favourites)、小組數(shù)(#listed_membership)這 5 個(gè)用戶特征(推特上的「社會(huì)資本」)后可知,社會(huì)資本(social capital)更高的用戶使用「中國(guó)病毒」這類(lèi)詞匯的比例更低。

對(duì)于這一點(diǎn)觀察原因的推測(cè)是,這些用戶有更多的觀眾,所以會(huì)在發(fā)布內(nèi)容時(shí)更加謹(jǐn)慎。有發(fā)現(xiàn)表明,推特用戶認(rèn)為自己的狀態(tài)(哪怕不是自己原創(chuàng)的)是自己的「財(cái)產(chǎn)」,所以在發(fā)布狀態(tài)時(shí)會(huì)格外謹(jǐn)慎,在好友之間分享時(shí)也更加小心。

另一方面,研究發(fā)現(xiàn) ND 組的用戶賬號(hào)成立時(shí)間中位數(shù)為 74 個(gè)月,而 CD 組里的賬號(hào)成立時(shí)間中位數(shù)為 63 個(gè)月,差距幾乎是一年。

此外,還有一些統(tǒng)計(jì)結(jié)果:傾向于共和黨和支持唐納德·特朗普的用戶更加傾向于使用「中國(guó)病毒」這類(lèi)詞匯;居住在鄉(xiāng)村的用戶更加傾向于使用「中國(guó)病毒」這類(lèi)表述。

在使用這類(lèi)詞匯時(shí),他們?cè)谙胄┦裁矗?/p>

喜歡說(shuō)「中國(guó)病毒」的人通常關(guān)注共和黨,進(jìn)入社交網(wǎng)絡(luò)時(shí)間較短比較莽撞?如果你覺(jué)得這些結(jié)論看起來(lái)比較淺顯,該團(tuán)隊(duì)在第二篇論文的進(jìn)一步研究中,給出了對(duì)推特用戶更深層次的分析。

論文 2:《In the Eyes of the Beholder: Sentiment and Topic Analyses on Social Media Use of Neutral and Controversial Terms for COVID-19》

論文鏈接:

該團(tuán)隊(duì)這次獲取了更多數(shù)據(jù)。通過(guò) Tweepy API,研究人員共獲取 2,607,753 條 CD 推特文本,69,627,062 條 ND 推特文本,從兩個(gè)組中分別抽樣兩百萬(wàn)條作為最終的研究數(shù)據(jù)集。研究人員使用 Latent Dirichlet Allocation (LDA) 提取文本話題信息,最終在 CD 和 ND 組中分別提取出最重要的 5 個(gè)話題,每個(gè)話題包含 10 個(gè)單詞。

下表展示了研究者根據(jù) LDA 模型獲得的 CD 與 ND 組的話題關(guān)鍵詞。

表 1:CD 與 ND 組的前 5 話題。

為深入了解兩組用戶,該研究使用 Linguistic Inquiry and Word Count 2015 (LIWC2015) 提取文本所帶的作者情緒以及心理層面信息,最終提取出 4 個(gè)總結(jié)性語(yǔ)言學(xué)變量,以及 12 個(gè)更詳細(xì)的語(yǔ)言學(xué)變量。LIWC2015 是一個(gè)以預(yù)置字典為基礎(chǔ)的文本分析工具,通過(guò)計(jì)算每種類(lèi)型詞匯在一篇文章中出現(xiàn)的頻率,反映并捕捉文本的情感、作者的心理層面信息、作者的動(dòng)機(jī)和時(shí)間(過(guò)去、現(xiàn)在、未來(lái))關(guān)注度,以及作者所關(guān)心的事物信息。

經(jīng)過(guò)分析,研究人員得出了以下結(jié)論。

ND 組用戶的語(yǔ)言邏輯性更強(qiáng),表達(dá)更真誠(chéng),情緒相對(duì)更積極正面

圖 1 展示了 CD 和 ND 組文本在 4 項(xiàng)總結(jié)性語(yǔ)言學(xué)變量的得分。

圖 1:CD 與 ND 組總結(jié)性語(yǔ)言學(xué)變量。

CD 和 ND 組在「Clout」一項(xiàng)的得分相近。較高的「Clout」得分代表作者在寫(xiě)下這些文字的時(shí)候更多地站在一個(gè)專業(yè)的角度。與此同時(shí),ND 組的「Analytical thinking」、「Authentic」以及「Emotional tones」得分都比 CD 組高。

「Analytical thinking」得分反映的是文本的邏輯性,較高的「Analytical thinking」分?jǐn)?shù)意味著該文本更正式、更有邏輯?!窤uthentic」分?jǐn)?shù)越高意味作者在寫(xiě)下這些文字的時(shí)候表達(dá)更為真誠(chéng)。CD 和 ND 組的「Emotional tones」的得分都比 50 低,意味著兩個(gè)組的文本主要情緒基調(diào)都是負(fù)面的,然而研究者從中發(fā)現(xiàn)了一些細(xì)微的差異:ND 組的文本相對(duì) CD 組的文本更積極正面。

ND 組更關(guān)注自己未來(lái)的行為,CD 組用戶更關(guān)注別人的現(xiàn)在或過(guò)去

圖 2 展示了 CD 與 ND 組在更為詳細(xì)的 12 個(gè)語(yǔ)言學(xué)變量上的得分。

圖 2:CD 與 ND 組詳細(xì)語(yǔ)言學(xué)變量得分。

「future-oriented」和「past-oriented」分?jǐn)?shù)通過(guò)分析作者使用的動(dòng)詞時(shí)態(tài),來(lái)反映作者對(duì)時(shí)間點(diǎn)的關(guān)注。從上圖中可以看出,ND 組的文字顯示作者更關(guān)注未來(lái),而 CD 組的文字顯示作者更關(guān)注過(guò)去。為了更好地理解這兩項(xiàng)分?jǐn)?shù)的差異,本文采取了和 Gunsch et al. 類(lèi)似的研究方法。

該研究進(jìn)一步提取了另外 5 項(xiàng)語(yǔ)言學(xué)變量,包括 4 項(xiàng)人稱代詞的使用占比分?jǐn)?shù),以及 1 項(xiàng)時(shí)間點(diǎn)關(guān)注度分?jǐn)?shù)。CD 與 ND 組這 5 項(xiàng)分?jǐn)?shù)的情況如表 2 所示。

表 2:「i」、「we」、「she/he」、「they」以及 present-orientation 的得分。

CD 組的文本顯示更多的是 other-reference (「they」),而 ND 組的文本顯示的更多的是 self-reference (「i」、「we」)。兩個(gè)組在「she/he」一項(xiàng)上的得分相近。對(duì)于現(xiàn)在的關(guān)注度,CD 組得分比 ND 組更高。

以上的發(fā)現(xiàn)與 Gunsch et al. 的發(fā)現(xiàn)類(lèi)似,由此可以推測(cè)出,CD 組的文本更關(guān)注其他人在現(xiàn)在或過(guò)去的舉動(dòng)上,而 ND 組的文本更關(guān)注自己在未來(lái)的舉動(dòng)。

ND 組表現(xiàn)出更多的悲傷與焦慮,CD 組用戶表現(xiàn)出更多憤怒

現(xiàn)有的研究發(fā)現(xiàn),LIWC 可以識(shí)別出作者在書(shū)寫(xiě)時(shí)所表達(dá)的情緒。從上文的分析中研究者發(fā)現(xiàn),CD 與 ND 組文本表達(dá)的主要情緒是負(fù)面的,其中 ND 組文本表達(dá)的情緒相對(duì)正面。這與研究者在圖 2 中更詳細(xì)的語(yǔ)言學(xué)變量「positive emotions」與「negative emotions」的發(fā)現(xiàn)是一致的。

然而,研究者在更為細(xì)致的」sadness」、「anxiety」與「anger」的變量中發(fā)現(xiàn)了微妙的差別。當(dāng)人們?cè)谔峒?COVID-19 時(shí),ND 組的文本表現(xiàn)出更多的悲傷與焦慮,而 CD 組的文本表現(xiàn)出更多的憤怒。

ND 組用戶的文本著重描述事實(shí),CD 組用戶的文本著重表達(dá)想法

「tentativeness」與「certainty」這兩項(xiàng)語(yǔ)言學(xué)變量的得分反映的是作者所經(jīng)歷事件的發(fā)展程度,比方說(shuō)事件已告一段落,抑或事件正在不斷演變。在文本中,如果較多地使用」always」或者」never」這類(lèi)詞匯,會(huì)產(chǎn)生一個(gè)較高的「certainty」分?jǐn)?shù);如果較多地使用」maybe」或者」perhaps「這種詞匯,文本則會(huì)產(chǎn)生一個(gè)較高的「tentativeness」分?jǐn)?shù)。

在 CD 組的文本中,「certainty」和「tentativeness」分?jǐn)?shù)較高,而 ND 組文本的這兩項(xiàng)得分均相對(duì)較低。

對(duì)于這一微妙差別,該研究有一個(gè)有趣的猜想。從 1986 年開(kāi)始,Pennebaker et al. 開(kāi)始從不同的文本范疇中收集語(yǔ)言樣本,包括博客、expressive writing、小說(shuō)、日常對(duì)話、紐約時(shí)報(bào)、以及推特。他們將 LIWC 應(yīng)用于這些樣本,與該研究一樣提取出了這些語(yǔ)言學(xué)變量的得分。在他們的發(fā)現(xiàn)中,紐約時(shí)報(bào)文本的「tentativeness」與「certainty」分?jǐn)?shù)都是最低的,而博客、expressive writing、以及日常對(duì)話的這兩項(xiàng)語(yǔ)言學(xué)變量的分?jǐn)?shù)都相對(duì)較高。該研究的猜想與這一發(fā)現(xiàn)相關(guān):CD 組的文本更類(lèi)似博客、expressive writing 或者日常對(duì)話,更關(guān)注表達(dá)想法,而 ND 組的文本更類(lèi)似于紐約時(shí)報(bào)這樣的新聞報(bào)道,著重描述客觀事實(shí)。

ND 組表現(xiàn)出更強(qiáng)烈的對(duì)成功的需求

McClelland 發(fā)現(xiàn)人們?cè)诿枋鰰r(shí)使用的詞匯會(huì)反映出個(gè)人需求,「achievement」分?jǐn)?shù)便是通過(guò)計(jì)算該類(lèi)詞匯的使用頻率來(lái)反映作者對(duì)于「achievement」的需求。

ND 組文本的「achievement」分?jǐn)?shù)比 CD 組文本分?jǐn)?shù)更高。關(guān)于這一發(fā)現(xiàn)的假設(shè)是,這一分?jǐn)?shù)偏高,可能反映了 ND 組用戶對(duì)于戰(zhàn)勝 COVID-19 疫情更強(qiáng)烈的心理需求。

ND 組相對(duì)而言更關(guān)注工作及財(cái)務(wù)話題

關(guān)于個(gè)人所關(guān)注的事物,ND 組文本的「work」與「money」分?jǐn)?shù)更高,說(shuō)明 ND 組的用戶可能更關(guān)注工作及財(cái)務(wù)話題。對(duì)于工作的討論不僅是在家辦公所帶來(lái)的工作狀態(tài)的改變,也有很大一部分與失業(yè)率上升有關(guān)。

經(jīng)過(guò)大量數(shù)據(jù)分析后,研究人員得出了對(duì)使用「中國(guó)病毒」這類(lèi)表述人群的一系列結(jié)論,讓我們對(duì)有偏見(jiàn)人群有了更深層的認(rèn)識(shí)。

同時(shí)這也提醒我們,語(yǔ)言除了溝通用途外,還承載了社會(huì)、文化等諸多內(nèi)涵。除了在這件事中用合適的詞匯表示「COVID-19」之外,對(duì)于語(yǔ)言的使用,我們還需要思考更多。

參考文獻(xiàn)

A. Matamoros-Fernández, ``Platformed racism: The mediation and circulation of an Australian race-based controversy on Twitter, Facebook and YouTube." Information, Communication & Society, 20(6), 930-946, 2017.

C. Lin, “Social reaction toward the 2019 novel coronavirus (COVID-19)." Soc Health Behavior, 3:1-2, 2020.

D. C. McClelland, “Inhibited power motivation and high bloodpressure in men.,”Journal of Abnormal Psychology, vol. 88,no. 2, p. 182, 1979.

I. Gagliardone, D. Gal, T. Alves, and G. Martinez, ``Countering online hate speech." Unesco Publishing, 2015.

J. W. Pennebaker, R. L. Boyd, K. Jordan, and K. Blackburn,“The development and psychometric properties of liwc2015,”Tech. Rep., 2015.

M. A. Gunsch, S. Brownlow, S. E. Haynes, and Z. Mabe,“Differential forms linguistic content of various of politicaladvertising,”Journal of Broadcasting & Electronic Media,vol. 44, no. 1, pp. 27–42, 2000.

Y. R. Tausczik and J. W. Pennebaker, “The psychologicalmeaning of words: Liwc and computerized text analysis meth-ods,”Journal of language and social psychology, vol. 29,no. 1, pp. 24–54, 2010.

Y. Zheng, E. Goh, and J. Wen, ``The effects of misleading media reports about COVID-19 on Chinese tourists’ mental health: a perspective article." Anatolia, 1-4, 2020.

Z. Waseem and D. Hovy, ``Hateful symbols or hateful people? predictive features for hate speech detection on twitter." In Proceedings of the NAACL student research workshop pp. 88-93, 2016.

1.《怎么安裝Word2015?我來(lái)告訴你答案「中國(guó)病毒」這類(lèi)詞匯被哪些人使用?這是一份令人深思的研究結(jié)果》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無(wú)關(guān),侵刪請(qǐng)聯(lián)系頁(yè)腳下方聯(lián)系方式。

2.《怎么安裝Word2015?我來(lái)告訴你答案「中國(guó)病毒」這類(lèi)詞匯被哪些人使用?這是一份令人深思的研究結(jié)果》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。

3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來(lái)源地址,http://f99ss.com/gl/2996949.html