從新聞敘事學角度看機器人新聞寫作的局限性
摘 要:機器人記者是人工智能技術在新聞寫作領域的一次有益實踐,機器人記者在數據挖掘和寫作速度方面存在著優勢。但是從新聞敘事學的角度分析,其作品在文本和話語結構存在局限性,具體變現為:語義理解缺陷,段落結構混亂和新聞要素缺失。受到模板的限制,敘事行為方面也存在...
關鍵詞:機器人新聞;新聞敘事學;新聞話語;敘事行為
作 者: 李薇薇 [ 南開大學文學院][論文查重]
正 文:
 
“新聞”是我們司空見慣的一種敘事形態,“敘事”是報道新聞和傳播信息的一種手段,穆青就曾經說過“新聞是一種敘事文”。[1]對新聞敘事學的建構問題是21世紀初學界的熱門話題,1969年茨維坦·托多洛夫第一次提出“敘事學”這個術語[2]。隨著“敘事學”體系建構的不斷完善,許多學者開始將目光轉向新聞敘事的研究上,不少學者開始提出“新聞敘事學”的概念,比如范步淹提出,“新聞敘事學是以新聞事件、敘述及敘述目的為對象,研究新聞敘事的學科”[3],比如黃挺提出“新聞敘事學是研究新聞敘事的本質、屬性、功能和形式的學科,它的研究對象包括一切新聞敘事作品和新聞敘事行為”。[4]
 新聞生產傳播的目的是運用一定的語言系統,敘述、重構受眾欲知、應知而不知的新聞事實,它的編碼方式應滿足人類對新聞信息的取舍和信息效益最大化的需求,即新聞話語。[5]新聞話語是新聞敘事研究的邏輯起點,新聞話語詳述的事件——故事是新聞敘事研究的所指,而“敘事行為”是新聞話語完成故事的動作。新聞敘事學的話語研究包括新聞話語事實建構的字詞選擇、句式選擇和意識形態;“故事研究”包括故事的內涵和故事的敘事節奏、頻率和順序安排;敘事行為包括敘述者、敘事角度和敘述方式的研究。[6]
技術總是在更新迭代,猶如人類社會的推動器。計算機新聞已經成為新聞生產提高效率的核心技術,“計算機生產新聞”(CGC)將和“專業記者生產新聞”(PGC)以及“用戶自生產新聞”(UGC)共同成為信息生產的主要方式。[7]
最早將人工智能技術應用于新聞生產的是在2006年,美國信息供應商湯姆森金融公司開始運用電腦程序來替代財經記者,自動撰寫經濟和金融方面的新聞,湯姆森公司稱,它的機器人記者可以在公司發布信息后的 0.3秒內提取有效數據。而后西北大學、美國“敘述科學公司”和“自動洞察力”公司紛紛開發這樣的軟件,美聯社在2014年正式使用。[8]國內此類人工智能的新聞寫作軟件也已經出現,如騰訊在2015年開發的軟件“DreamWriter”, 2015年11月新華社使用智能軟件“快筆小新”進行新聞稿件的寫作,今日頭條的“張小明”在2016年奧運會報道中大放異彩,百度的“度秘解說”和南方都市報的“小南”以及廣州日報的“阿同”等機器人新聞寫手的出現使得自動化生產成為新聞學研究的前沿領域。
機器人新聞話語依賴豐富的數據庫和模式化的數據整合,內容和結構有相對固定的模式,在新聞敘事的完整度、敘事風格和語言特色等方面存在著“先天不足”,“非人格化”和“表達局限”成為機器人新聞的短板。本文根據機器人新聞的特點,著重從其新聞話語和敘事行為兩方面對其局限性進行探討。
一、新聞話語和文本結構的局限性
新聞傳播活動的本質是一種敘事行為,敘事行為離不開語言,新聞敘事有一套獨特的話語體系——新聞話語。新聞話語典型的結構代表是“倒金字塔結構”,其他結構可以看作是這種結構的變形,都是由新聞核心事件、背景和評論等組成。機器人依賴程序和模板嵌入性完成寫作,其作品缺乏靈活性,存在表達不清、銜接不順和缺少新聞要素的弊病。
(一)語義理解缺陷
機器人寫作新聞可以分為三種模式:模板填充式,抽取式和生成式。[9]摸板填充式和抽取式依賴建立的數據庫,機器人只能在現有數據的支持下進行詞匯和語句進行抓取,然后進行排列組合,真正的個性化生產還沒有辦法實現。機器人記者的理解能力和邏輯能力遠遠低于人類,因此依賴算法的自動化新聞寫作常見于數據為主體的財經新聞和體育新聞領域。本文以“張小明”在2016年8月17日寫作的一條快訊為例:
北京時間8月17日06:40時,奧運會羽毛球女子單打四分之一決賽在里約會議中心-4號館如期舉行,耗時3場大戰,比賽中選手山口茜表現不理想,絕望之際,失敗女神朝其拋出了橄欖枝。最終現世界排名第6的選手奧原希望以2:1的比分戰勝了日本選手山口茜,成功晉級下一輪,繼續向冠軍發起沖擊。各局小分分別為: 11:21,21:17,21:10。
雖然這篇報道可以看出機器人記者嘗試在寫作中注入更多的情感色彩來增強可讀性,比如“耗時”、“橄欖枝”和“發起沖擊”等等,但是文本中仍然存在著明顯的語法錯誤,如“耗時三場大戰”和“失敗女神朝其拋出了橄欖枝”,這些語言顯然不會出現在人類寫作的新聞文本中,這表明一些簡單的邏輯錯誤仍然是機器人新聞無法避免的。
(二)段落邏輯混亂
機器人記者新聞的寫作依賴于記者輸入的寫作模板,不可避免的帶來邏輯的混亂,體現在文章的結構上就是段落之間鏈接障礙,缺少過渡性的語言。
本文選取騰訊公司的財經智能記者“Dreamwriter”發布的《8月CPI同比上漲的2.0% 》為例。
騰訊財經訊 國家統計局周四公布數據顯示,8月CPI同比上漲2.0%,漲幅比7月的1.6%略有擴大,但高于預期值1.9%,并創12個月新高。
國家統計局城市司高級統計師余秋梅認為,從環比看,8月份豬肉、鮮菜和蛋等食品價格大幅上漲,是CPI環比漲幅較高的主要原因。
……
8月份,全國居民消費價格總水平環比上漲0.5%。
銀河證券的分析報告認為,預計到年末生豬價格將超過上一輪“豬周期”價格高點,如果豬肉價格集中在四季度上漲,并且重合蔬菜上漲周期。
……
文章第一段開門見山,列舉了8月CPI的漲幅,之后的兩個自然段用專家的觀點解釋了發生上漲的原因。第三自然段以“8月份,全國居民消費價格總水平環比上漲0.5%”獨立成段,將文章的內容引向另一個層次,但是之后的論述并沒有圍繞“居民消費價格增長”,反而是引用了專家對未來CPI漲幅的預測,第二層次的內容論述過于分散,甚至專家觀點還有沖突的地方,因此存在段落之家銜接不緊密,邏輯混亂的問題。
(三)新聞要素的缺失
機器人記者在寫作過程中依賴數據源而沒有獨立采訪的能力,在報道過程中經常會出現缺少新聞要素的缺點。
作者以兩條關于同一事件的新聞報道為例:
上周末,今日頭條獲得了中國人工智能最高獎項吳文俊獎。
獲獎項目是寫作機器人張小明。2016年6月上線以來,張小明創作超過兩萬篇文章。包括體育、財經、房產等十幾個領域。
2017年12月23日,第七屆吳文俊人工智能科學技術獎頒獎盛典在蘇州舉行。今日頭條人工智能實驗室憑借“互聯網信息摘要與機器寫稿關鍵技術及應用”項目榮獲吳文俊人工智能技術發明獎。本年度獲得該獎項的機構還包括清華大學、中科院以及北京航空航天大學等國內頂尖高校。
前者來自于機器人記者“張小明”寫作的新聞文本,后者來自于界面新聞發布的記者采寫的新聞。就新聞要素“5W+H”來說,機器人新聞文本包含的新聞要素包括“上周末(時間)”、“今日頭條(人物)”以及“今日頭條獲得了中國人工智能最高獎項吳文俊獎,獲獎項目是寫作機器人張小明”(事件)這三個要素。人類記者寫作的新聞文本中包含了“2017年12月23日(時間)”、“蘇州(地點)”、“今日頭條人工智能實驗室(人物)”、和“今日頭條人工智能實驗室榮獲吳文俊人工智能技術發明獎”(事件)這四個新聞要素之外,還包括了今日頭條人工智能實驗室獲獎的原意以及此次獎項的背景。
機器人記者依賴模板,它們寫作的新聞更多就事論事,局限在“時間”、“地點”、“人物”、和“事件”這四個新聞要素。與之對應的專業記者寫作的新聞報道,更能體現人類思維的創造性和靈活性。事件的意義和背景都會介紹,能夠增加新聞的深度,也能讀者在閱讀過程中興趣盎然。
二、新聞敘事行為的局限性
敘事行為分為“理解”和“講述”兩個層面,前者強調敘事文本的內容和意義層面,后者強調敘事文本的風格和特色。[10]新聞敘事行為作為一種普遍的社會傳播行為,要求其行為堅持“真實性”和“時效性”,在保證這兩個要求的前提下,最大程度的提供可讀性是判斷新聞文本優劣的標準。
新聞敘事行為研究的一個層面是風格敘事。所謂風格敘事,就是把某個原始事件呈現為新聞事件的過程中保證真實性、不損害真實性的前提下所進行的個性化表達和差異化表達。[11]風格敘事背后的動力機制在于對傳播效果和傳播目的的關注,風格敘事又囊括了敘事語言和敘事角度等。機器人新聞寫作基于數據庫和“定制指令”,在敘事風格方面存在局限性。
(一)語言機械化
機器人新聞依靠人工輸入的模板,由于報道題材、報道環境、新聞時效性以及技術水平的較多制約,其文本在人情味方面依然有不可避免的制約和缺陷。
本文以 “DreamWriter”寫作的《8月CPI同比上漲2.0% 創12個月新高》這篇文章為例。
騰訊財經訊 國家統計局周四公布數據顯示,8月CPI同比上漲2.0%,漲幅比7月的1.6%略有擴大,但高于預期值1.9%,并創12個月新高。
國家統計局城市司高級統計師余秋梅認為,從環比看,8月份豬肉、鮮菜和蛋等食品價格大幅上漲,是CPI環比漲幅較高的主要原因。
這篇文章的首段先介紹了國家統計局公布的數據。第二段直接引用國家統計局城市司高級統計師余秋梅的觀點,內容分別是雞蛋、蔬菜和肉類等和上個月相比CPI的上漲指數,而對百姓的生活確實的影響卻很少提及。
與之對比的是央廣網的記者采寫的新聞。
央廣網北京9月10日消息 據中國之聲《全國新聞聯播》報道,國家統計局今天發布數據顯示,8月份全國居民消費價格總水平(CPI)同比上漲2%,漲幅時隔1年重回“2時代”,也創下12個月來新高。
進入夏季以來,細心的市民們肯定會發現,豬肉的價格上漲了不少……
8月不僅是豬肉價格在持續上漲,蛋價環比也上漲了10.2%……
姚景源:肉禽蛋菜的價格還有可能再進一步回升,總的來說,即使是這些類的產品回升,我們全年也就是個2%左右這么一個狀態,和我們年初預期的要把物價總水平控制在3%以內啊,應當講我們還有比較大的空間。
首段同樣是介紹國家統計局的數據,采用了“漲幅重回‘2時代’”這樣的背景介紹,無形之中拉近了與讀者的距離。其次,第二段的第一句是“進入夏季以來,細心的市民們肯定會發現,豬肉的價格上漲了不少”拉近與讀者的距離。在第三段的內容中,同樣是介紹專家的觀點,但是語言更加生活化,比如出現的“物價”、“回升”等字樣,這些字樣不僅有助于讀者更好的理解文本內容,更能使讀者產生一種閱讀下去的興趣。
(二)角度同質化
機器人記者只能通過數據歸納和簡單語法寫稿件,對于報道角度的把握還需要依靠專業記者的嗅覺。機器人記者報道一般都選擇“零聚焦敘述視角”,就事論事,平鋪直敘,缺少發掘焦點事件的報道角度。
作者以今日頭條的機器人記者“張小明”寫作的新聞文本為例。“張小明”寫作的新聞文本主要集中在體育類新聞的報道,2017年3月24日的,“張小明”共發表了6篇關于NBA新聞報道,本文發現新聞的報道角度都是以全知的敘事者來陳述事實,標題都是比分和結果,導語是時間、比賽雙方和得分,主體部分是對每小節的比賽賽況進行簡單描述,結尾是雙方得分情況。對于球迷來說可能結果更加重要,但是對于大多數讀者來說,對一些場面、賽點和個人表現的描寫更能引起讀者的閱讀興趣,而且角度同質化的報道也使新聞個性化缺失。相比之下,專業記者寫作的稿件,除了報道比分之外,還將一部分關注放到賽場上的精彩瞬間或者是烏龍事件上,從多個角度還原精彩的賽事,也能引發讀者的閱讀興趣。
(三)報道淺顯化
由于新聞寫作對時效性的要求較高,快速的發稿必然要使用已經存在的觀點,而某些新的內容還沒有數字化,舊的觀點堆砌使機器人寫作的新聞呈現淺顯化的特點。
作者以2015年NPR駐白宮前任商業記者Scott Horsley和自動機器軟件WordSmith撰寫的新聞稿件進行對比,他們寫作的題材都是Denny’s餐飲公司公布的財報數據在同一時間進行寫作。
丹尼斯公司在周一報告稱第一季度的利潤為850萬美元。這家南加州斯帕坦堡的公司表示每股獲利10美分。該結果高于華爾街的預期。四位來自扎克斯投資研究公司的分析師的平均預計為每股獲利9美分。
丹尼斯公司在第一季度完成了一記全壘打,由于餐廳的銷售額躥升超出7%,贏得了高于預期的10美分每股……丹尼斯成為全國最大的全品類連鎖餐飲服務公司之一。銷量的上升表明消費者在打開他們的錢袋子來購買薄煎餅、土豆和雞蛋。收入增長還受益于價格更低的原材料。[12]
第一條新聞為機器人記者寫作,第二條是專業記者寫作的。機器人新聞首先舉出了該公司在第一季度的利潤收益額,之后表示每股的收益額和整體的收益額都高于華爾街的預期。記者寫作的新聞在開頭也介紹了該公司的整體收益額,之后也分別比較了實際的股價和華爾街的預期。和機器人新聞不同的是,記者新聞最后分析了“目前該公司成為全國最大的全方位服務連鎖餐飲公司之一”,“銷量上升表明消費者在打開他們的錢袋來購買煎餅、雞蛋和土豆煎餅”,“收入增長還受益于價格更低的原材料以及擁有高客流量的拉斯維加斯皇家賭場餐廳的重新開張”等等,分別從受益上升的原因、結果和影響等方面進行了分析,使整個文本更有意義,對讀者也更有價值。Scott寫作的文本不僅在遣詞造句方面更加簡潔、形象,而且在原有數據上的總結不僅使信息的深刻性大大提升,有助于讀者在第一時間把握住文章的主旨。
三、結語
麥克盧漢將媒介視為一種訊息,認為信息技術和媒介形態將會給人類帶來無限的可能。不可否認,機器人記者的出現是“技術改變生活”的有力佐證,一方面人工智能技術大大解放了人力,使記者從電腦屏幕前解放出來;另一方面也提高了報道的時效性,實現了信息的有效傳播。但是,機器人記者寫作的新聞目前來說仍然存在著不少的弊端,僅從敘事學的角度來分析,首先存在話語和結構的局限性,其次在敘事行為方面,也體現出同化有余而個性不足。
本文運用概念分層的方法將新聞報道分為三類:淺層報道、連續報道和深度報道。淺層報道即不詳述事件的細節和經過,著重報道事件的五要素,財經報道和體育報道多屬于此類。深度報道是一種反映重大社會問題的新聞報道,強調挖掘事件原因和闡釋事件意義。連續報道介于兩者之間,反映完整的新聞事件經過及影響。目前機器人尚不能做到對情緒的判斷,對形容詞的選擇依靠數據庫的檢索,同時機器人很難做到歸因和舉證,所以機器人記者目前主要應用于淺層報道,對需求故事內核的連續報道和深度報道仍然需要人類記者來完成。機器人記者與人類記者仍然有顯著的區別,人類記者的創造性是機器人記者難以媲美的。
因此,首先需要明確的是在日新月異的技術沖擊下,記者要發揮特長,找準方向,提升新聞寫作中的人文價值;同時,也提示機器人寫作技術要朝著更加智能化的方向發展,不斷豐富數據庫,解決新聞寫作的“硬傷”。
參考文獻:
[1]穆青.新聞散論[M].北京:新華出版社,1996:16.
[2][3]范步淹.新聞敘事學芻議[J].新聞前哨,2000,12.
[4]黃挺.學好新聞敘事學[J].軍事記者,2003,1.
[5]楊琴.新聞敘事與文化記憶:史態類新聞研究[M].北京:華夏出版社,2008:101.
[6]蔡之國.新聞敘事學研究框架的構想[J].南通大學學報·社會科學版,2006,4.
[7]何苑,張洪忠.原理、現狀與局限:機器寫作在傳媒業中的應用[J].新聞界,2018,3.
[8]申屠曉明.機器人寫稿的技術原理及實現方法[J].傳媒評論,2017,9.
[9]何苑,張洪忠.原理、現狀與局限:機器寫作在傳媒業中的應用[J].新聞界,2018,3.
[10][11]齊愛軍.關于新聞敘事學理論框架的思考[J].現代傳播,2006,4.
[12]《資深記者與機器人比賽寫稿,誰會贏?》,好奇心日報http://www.qdaily.com/articles/9871.html
 
 
 
 
 
 

雜志封面

學術不端

本刊推薦

新媒體時代下的品牌營銷傳播策略 ——

隨著互聯網和信息技術的不斷發展,傳統的諸如平面廣告、電視廣播等媒體營銷傳播方式已經不能滿足時代發展的...[詳情]

關于微新聞的傳播特征的若干思考

當前時期下,信息化發展速度非常之快,人們的生產生活和學習工作已經越來越離不開信息技術。微博微信等自媒...[詳情]

少兒圖書選題如何在新時代繼承創新

本文闡述少兒圖書出版選題,特別是如何以新時代的新要求,進行新創造、實現新發展,創新進行少兒圖書的選題...[詳情]

版權信息

主管 黑龍江日報報業集團

主辦 黑龍江日報報業集團

出版 《傳播力研究》編輯部

主編 李濤

主任 李航

編輯 趙彩云 楊奧贏

聯系方式

地址 哈爾濱道里區地段街1號(150010)

電話 0451-58863788

手機 13704505745

郵箱 [email protected]

本刊聲明

因近期不斷有人冒用本刊名義,向學界和業界廣泛征稿,并索取所謂版面費,對本刊造成損害。現本刊聲明如下:

一、 本刊投稿信箱為:[email protected],任何別的信箱與本刊無關;

二、 本刊從未授權任何單位代為受理此事。因此,作者與外間各種所謂代理發表論文的機構簽約以及由此產生的矛盾、糾紛,都與本刊無關。

另外,因本刊編輯部人力所限,對于稿件的處理方式也聲明如下:

一、本刊對來稿一律不退,不發用稿通知。如所投稿件兩個月內未被錄用,作者可將稿件另投他處。有時因版面所限,編輯會在尊重原文的基礎上,對錄用稿件略作刪改。如有異議,請在來稿中說明。

二、本刊堅決反對一稿多投。

重庆欢乐生肖全天计划