久久一区二区三区,久久久久人妻,国产精品久久婷婷六月丁香,天天摸天天做天天爽水多

先進(jìn)制造業(yè)微信公眾平臺(tái) 先進(jìn)制造業(yè)全媒體

寫稿機(jī)器人“小南”上崗

2017-01-19   來源:南方都市報(bào)   評(píng)論:0
摘要: 1月17日,南方都市報(bào)社寫稿機(jī)器人小南正式上崗,并推出第一篇共300余字的春運(yùn)報(bào)道。此外,南方都市報(bào)社、凱迪網(wǎng)絡(luò)和北京大學(xué)計(jì)算機(jī)科
      1月17日,南方都市報(bào)社寫稿機(jī)器人“小南”正式上崗,并推出第一篇共300余字的春運(yùn)報(bào)道。此外,南方都市報(bào)社、凱迪網(wǎng)絡(luò)和北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所還在小南的基礎(chǔ)上,聯(lián)合成立了“智媒體實(shí)驗(yàn)室”,探索人工智能在媒體上的更多應(yīng)用。



 
  首篇文章一秒完成
 
  請(qǐng)用5秒的時(shí)間思考以下新聞的共同點(diǎn):《蘋果第一季度營收超華爾街預(yù)測》(A pple topsStreet1Qforecasts),2015年1月發(fā)布;《8月CPI漲2%創(chuàng)12個(gè)月新高》,2015年9月發(fā)布;《綿陽安州發(fā)生4 .3級(jí)地震》,2016年5月發(fā)布;《奧運(yùn)會(huì)乒乓球女子單打四分之一決賽 丁寧(中國)4:0輕松晉級(jí)下一輪》,2016年8月發(fā)布。
 
  這道題其實(shí)沒有標(biāo)準(zhǔn)答案,但不管你有沒有注意到,有一點(diǎn)非常重要:這些新聞的作者,都不是人?;蛟S你已經(jīng)聽說過“寫稿機(jī)器人”———在寫作這一似乎最不可能被機(jī)器人涉足的領(lǐng)域,變化正在發(fā)生。
 
  看看這些數(shù)字:蘋果財(cái)報(bào)發(fā)布數(shù)分鐘后,美聯(lián)社的機(jī)器人報(bào)道便已完成,他們還號(hào)稱每個(gè)季度可撰寫3000篇財(cái)經(jīng)報(bào)道?!都~約時(shí)報(bào)》走得更快,其機(jī)器人編輯Blossom blot每天推送300篇文章,在財(cái)報(bào)季、運(yùn)動(dòng)比賽報(bào)道中寫稿已成慣例。
 
  如此速度和質(zhì)量,確實(shí)讓人類記者望塵莫及。但真正嘗試使用機(jī)器人寫稿的媒體,尤其是在國內(nèi),還并不多。如今,小南正式入場。
 
  北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所萬小軍教授,是小南的技術(shù)開發(fā)團(tuán)隊(duì)負(fù)責(zé)人。他透露,小南的首篇春運(yùn)報(bào)道作品,共300余字,數(shù)據(jù)自動(dòng)抓取完成后,報(bào)道的生成只用了不到一秒的時(shí)間。
 
  率先進(jìn)軍民生領(lǐng)域
 
  與其他機(jī)器人“同行”有所區(qū)別的是,小南聚焦的是民生領(lǐng)域報(bào)道。
 
  此前,寫稿機(jī)器人大顯身手的領(lǐng)域,往往是體育和財(cái)經(jīng)———因?yàn)檫@兩個(gè)領(lǐng)域都涉及大量數(shù)據(jù)。從龐雜、枯燥的數(shù)據(jù)中尋找模式,就準(zhǔn)確度和速度而言,機(jī)器人比人類更有優(yōu)勢(shì)。
 
  人類的筆法千變?nèi)f化,但總是有“套路”,也就是模式和規(guī)則可以依循的。這時(shí)候,算法就有了用武之地。
 
  采集數(shù)據(jù)、分析數(shù)據(jù)、規(guī)劃文章結(jié)構(gòu),再到最終的遣詞用句,和人類一樣,機(jī)器人也能做到“讀書破萬卷,下筆如有神”。海量的數(shù)據(jù)和高效的算法,是寫稿機(jī)器人的兩大利器。
 
  相較于體育和財(cái)經(jīng)領(lǐng)域,民生報(bào)道的生成對(duì)機(jī)器人來說略為棘手。許多財(cái)報(bào)文章都大同小異,但民生報(bào)道的“套路”可就太多了,從交通出行到食品安全,主題也五花八門。
 
  一個(gè)民生領(lǐng)域的人類記者可以同時(shí)報(bào)道交通和食品領(lǐng)域,但就目前而言,讓機(jī)器人做到跨界的“融會(huì)貫通”還需要時(shí)間。萬小軍介紹,機(jī)器人寫稿又快又好的前提是通過大量的積累和訓(xùn)練。
 
  “教小南寫稿的過程中,主要的難點(diǎn)就是可供學(xué)習(xí)的樣本不夠豐富。”萬小軍說,民生議題的關(guān)注度高,卻不像常規(guī)的體育和財(cái)經(jīng)報(bào)道一樣有著相對(duì)固定的模式,訓(xùn)練語料較為缺乏。
 
  小南的未來是“智媒體”
 
  不少時(shí)政記者可能都有梳理政府工作報(bào)告的“痛苦”經(jīng)歷。動(dòng)輒上萬字的文本,要在其中找到不同于去年、前年甚至是大前年的新變化、新提法,還要把這些變化簡潔又流暢地寫在報(bào)道里,第一時(shí)間發(fā)出。想象一下,記者還在一目十行地看報(bào)告找新聞點(diǎn),編輯的聲聲催促已在耳邊響起:“稿子好了嗎?朋友圈里已經(jīng)有人拍了照片,轉(zhuǎn)發(fā)報(bào)告原文了,趕緊的!”
 
  生成報(bào)告摘要,是小南已經(jīng)解鎖的另一項(xiàng)新本領(lǐng)。近日,深圳市市委書記、市長許勤在深圳市第六屆人民代表大會(huì)第三次會(huì)議上作了政府工作報(bào)告,全文2萬多字。萬小軍把報(bào)告交給了小南,幾秒之后,2000多字的報(bào)告摘要新鮮出爐。
 
  “如果一條信息被頻繁提及,它顯然是比較重要的。”萬小軍介紹,小南采用了先進(jìn)的自動(dòng)文摘技術(shù),該技術(shù)可以根據(jù)多種文本特征———如關(guān)鍵詞、段落位置等———判斷不同信息的重要性,最終在摘要里保留核心部分。
 
  小南還能做到定制化輸出。今年的政府工作,網(wǎng)友比較關(guān)心哪些部分?房價(jià)?環(huán)境?交通?只要把關(guān)鍵詞告訴小南,“他”會(huì)在稿件生成過程中注意定向分析。
 
  萬小軍說,機(jī)器人寫稿的應(yīng)用還有很多。除了寫摘要,小南將來還可以根據(jù)不同的稿件寫綜合報(bào)道,可以對(duì)已有的稿件進(jìn)行改寫,甚至試著寫有一定情感、觀點(diǎn)和立場的報(bào)道。
 
  事實(shí)上,小南的背后還有個(gè)大招:南方都市報(bào)社、凱迪網(wǎng)絡(luò)和北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所三方昨日正式宣布聯(lián)合成立“智媒體實(shí)驗(yàn)室”,小南是該實(shí)驗(yàn)室的首個(gè)重要成果代表。三方將在推動(dòng)媒體智能化技術(shù)研發(fā)、促進(jìn)自然語言處理等學(xué)科領(lǐng)域的發(fā)展、探索媒體智能化產(chǎn)品服務(wù)的新運(yùn)營模式等方面開展深度合作,對(duì)機(jī)器寫作、文本實(shí)體識(shí)別、智能摘要、立場分析、智能服務(wù)等方面進(jìn)行研究和實(shí)踐。
和人類P K?小南還需學(xué)習(xí)
 
  那么問題來了———自從機(jī)器人報(bào)道面世以來,這個(gè)問題就沒有被停止討論———有寫得快還不容易出錯(cuò)的機(jī)器人寫稿了,人類記者會(huì)不會(huì)失業(yè)?
 
  “顯然不會(huì)。”萬小軍笑道,“你看,你現(xiàn)在坐在我對(duì)面采訪,一邊采訪一邊打字,機(jī)器人肯定做不到這樣。”
 
  簡單地說,就是小南目前還不具備人類的思維。“他”只能依據(jù)既有的數(shù)據(jù)和事先設(shè)定好的程序來寫稿,不能像人類一樣思考并提出自己的問題。質(zhì)疑、追問、尋找對(duì)方話語中的新聞線索,諸如此類的人類記者的法寶,對(duì)小南來說還是太難了。
 
  此外,訓(xùn)練小南學(xué)習(xí)不同領(lǐng)域的知識(shí)和文法,也需要花時(shí)間。就像科幻動(dòng)畫電影《超能陸戰(zhàn)隊(duì)》里的機(jī)器人大白,可以在護(hù)理模式和戰(zhàn)斗模式中切換,但主人得事先投入一定的時(shí)間、精力去編寫不同的程序。
 
  想想看,在電影里,小宏可是不眠不休地寫了好久代碼,輸入了空手道等各類功夫畫面,才把大白培養(yǎng)成了戰(zhàn)斗超人呢!而在此之前,他的哥哥為了調(diào)試大白的護(hù)理功能,也是做了很多的實(shí)驗(yàn),讓大白學(xué)習(xí)海量的護(hù)理知識(shí),識(shí)別人的不同身體狀態(tài),等等。
 
  在小南的訓(xùn)練上是類似的。教“他”寫春運(yùn)報(bào)道,跟寫體育報(bào)道、娛樂報(bào)道,前期需要不同的算法設(shè)計(jì)和編程工作。甚至是體育報(bào)道里的足球報(bào)道和籃球報(bào)道,也有差別。
 
  萬小軍覺得,機(jī)器人和人類各有所長,機(jī)器人擅長快速處理繁雜的數(shù)據(jù),但還做不到邏輯推理和深度歸納分析。至少在短時(shí)間內(nèi),機(jī)器人無法取代人類。不過,技術(shù)在發(fā)展,以后的機(jī)器人會(huì)不會(huì)對(duì)人類記者造成更大的沖擊,還是未知。
 
  觀點(diǎn)
 
  北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所所長郭宗明:
 
  “人工智能和人類寫稿不沖突”
 
  機(jī)器人寫稿的優(yōu)勢(shì),我認(rèn)為主要體現(xiàn)在三個(gè)方面。
 
  首先,機(jī)器人能夠快速地閱讀大量的文獻(xiàn)和資料。一個(gè)事件出來以后,歷史上也許有相當(dāng)多的類似事件及歷史資料,記者要去檢閱,要快速地做出報(bào)道,人類的速度是遠(yuǎn)遠(yuǎn)不如機(jī)器人的。
 
  第二,同樣的事件,機(jī)器人能做到更快,提高了新聞的時(shí)效性,同時(shí)節(jié)約了成本。
 
  第三,現(xiàn)在的新聞還講求廣泛的讀者參與。以春運(yùn)為例,除了列車信息本身,春運(yùn)乘客發(fā)表的微博、微信,他們的評(píng)價(jià)和關(guān)注,機(jī)器人都可以監(jiān)控到,并體現(xiàn)在報(bào)道里。
 
  機(jī)器人寫稿,或者說人工智能寫稿,跟傳統(tǒng)寫稿有很多不一樣的地方。也許機(jī)器人不那么字斟句酌,在文學(xué)價(jià)值上會(huì)打些折扣,但對(duì)于新聞報(bào)道而言,最重要的不是文學(xué)價(jià)值,而是時(shí)效性、與讀者的貼近性。在這一點(diǎn)上,我非??春萌斯ぶ悄軐懜?。
 
  現(xiàn)在很多人說,人工智能太可怕了,對(duì)此我并不認(rèn)同。其實(shí)人工智能和人類寫稿并不是沖突的。人類有更多的深度挖掘和分析的本領(lǐng),可以寫出很唯美的文字,可以在稿件中融入自己的親身經(jīng)歷,這些都是人工智能寫稿還做不到的。
 
  人工智能和人類應(yīng)該是共存關(guān)系。更進(jìn)一步說,人工智能是跟人類共同進(jìn)化。
 
  問答
 
  Q:小南,你是男孩子還是女孩子?
 
  A:我是機(jī)器人啊。你問問我爸爸。
 
  Q:你寫一篇稿子要多久?
 
  A:這要看電腦夠不夠好……哈哈,開玩笑,通常來說,數(shù)據(jù)抓取完成后,我生成報(bào)道最快只要零點(diǎn)幾秒哦!
 
  Q:你剛寫的春運(yùn)報(bào)道還比較短,長稿子能寫嗎?
 
  A:可以啊,我能寫800字的消息,也可以寫3000字的報(bào)告呢!這要看你給我什么設(shè)定。
 
  Q:你覺得寫稿難嗎?最難的是什么?
 
  A:最難的其實(shí)是學(xué)習(xí)。我的學(xué)習(xí)本領(lǐng)很強(qiáng),但是可供我學(xué)習(xí)和模仿的報(bào)道樣本還有點(diǎn)少。
 
  Q:小南,你覺得你的優(yōu)勢(shì)在哪里?
 
  A:我24小時(shí)連軸轉(zhuǎn)也不累,不用放假,分析數(shù)據(jù)也不容易眼花出錯(cuò)。
 
  Q:小南啊,你寫的稿子有點(diǎn)干巴巴的,讓編輯姐姐改兩句唄?
 
  A:這可不行!我爸爸說了,機(jī)器人寫稿一定要原創(chuàng),不能后期人工添加,這是原則。你放心,等我學(xué)習(xí)時(shí)間長了,學(xué)的東西多了,會(huì)越寫越好的~
 
  Q:有了你,我們?nèi)祟愑浾邥?huì)不會(huì)下崗?
 
  A:哈哈,我覺得不會(huì)。雖然我搜集數(shù)據(jù)和生成文本的速度比你們快,但是我不會(huì)提問,也暫時(shí)寫不出有深度分析、有感情表達(dá)的報(bào)道。讓我們共同進(jìn)步吧。
 
  揭秘
 
  每個(gè)成功的機(jī)器人背后都有一群“老師”
 
  開篇之作如何寫就?
 
  技術(shù)團(tuán)隊(duì)和南都的編輯團(tuán)隊(duì)商討后,決定以春運(yùn)作為小南的試水之作。
 
  南方都市報(bào)首席編輯鄒瑩,是“調(diào)教”小南的負(fù)責(zé)人之一。她說,選擇春運(yùn),是因?yàn)檫@一題材很好地契合了民生新聞的特色與小南寫稿的優(yōu)勢(shì):春運(yùn)涉及面廣,民眾關(guān)注度高,又有大量的數(shù)據(jù)可供小南抓取分析。
 
  接下來,由編輯團(tuán)隊(duì)提供范文樣本,確定熱門城市、車次、車型、余票等報(bào)道點(diǎn),再通過技術(shù)團(tuán)隊(duì)設(shè)計(jì)算法,對(duì)小南的文字組織功力進(jìn)行訓(xùn)練。
 
  春運(yùn)中,到哪些城市的票賣得最快?廣州和北京?好的,小南,以后重點(diǎn)監(jiān)控這兩個(gè)城市。
 
  廣州到南京的票不足10張了,人類記者會(huì)寫什么?多半是趕快下手、抓緊買票、余票緊張。小南你記住,下次監(jiān)控到小于10張的車票數(shù)據(jù),就這樣寫。
 
  說白了,名為“機(jī)器人”的小南,真身其實(shí)是一套程序系統(tǒng)?;跈C(jī)器學(xué)習(xí)算法,通過融合領(lǐng)域知識(shí),小南能夠?qū)?shù)據(jù)進(jìn)行深度分析,發(fā)掘重要的消息和事件,并用自然語言進(jìn)行表達(dá)。同時(shí),小南也能對(duì)已有的文本素材進(jìn)行語句篩選與融合,從而以秒速生成報(bào)道。
 
  在編輯團(tuán)隊(duì)的指引下,小南還會(huì)持續(xù)地學(xué)習(xí)模仿人類的寫作方式。例如,在判斷出剩余票數(shù)或是列車行駛時(shí)間后,小南能使用不同的詞語來形容,如“票數(shù)緊張”及“旅途較累”,讓報(bào)道看起來不那么冷冰冰。
 
  訓(xùn)練小南的過程中,有個(gè)細(xì)節(jié)讓鄒瑩印象深刻。“小南寫出的稿件,編輯出于本職,想著是否要核對(duì)一下數(shù)據(jù)。北大的技術(shù)團(tuán)隊(duì)說,不需要,機(jī)器人不會(huì)弄錯(cuò)數(shù)據(jù)。”鄒瑩說。
 
  小南上崗試用期間,有編輯感嘆:寫得真不錯(cuò),而且勤奮!
 
   相關(guān)熱詞搜索:先進(jìn)制造 機(jī)器人
先進(jìn)制造業(yè)簡介| 版權(quán)聲明| 招聘信息| 網(wǎng)站地圖| 友情鏈接| 聯(lián)系方式|
精品午夜影院在线观看| 中日韩VA无码中文字幕| 国产老熟女精品视频大全| 欧美日韩成人图片| 国产综合在线高清| 日韩精品乱伦一区| 玖玖精品在线| 亚洲日,韩成人熟女| 国产av线路一| 亚洲人妻精品久久| 成人区人妻精品一区二区不卡网站| 国产资源首页| 91久久久精品国产一区二区蜜臀| 亚洲AV剧情久久久| 精品无码三上| 精品日韩人妻| 久久香蕉国| 久久精见国产亚洲AV高清热| 青青日韩在线| h小说在线| 酒色网站| 伊人网久久久| 国产偷人激情视频在线观看| title:草草影院| 久久無| 日韩区在线观看| 九九大道av| 国产久艹视频| 国产精品国产高清国产av| 欧美国产91视频| 综合人妻婷婷| 黄片免费视频| 欧美日韩视屏中字| 国产91ⅴ在线精品免费观看| 日韩精品人妻| 97无码免费人妻超级碰碰夜夜| 下身被黑人粗暴进入| 亚欧色欲| 久久国产精品一二区| 国内精品无码人妻| 欧美剧情在线一本|