新華社技術局技術研發中心主任成鵬
近年來,技術創新成為推動媒體融合發展的重要的推動力,作為主流媒體的技術人我有幸多次參與新聞記聯的王選獎評選工作,見證了媒體的技術進步與發展,接下來向大家分享我的經驗和思考。
首先讓我們通過分析王選獎的獲獎項目來探討一下媒體行業技術發展變化的趨勢。先介紹一下王選獎。王選獎是王選新聞技術獎的簡稱,旨在表彰在新聞、出版、傳媒、科技領域作出杰出貢獻的個人和組織。通過對近十年來共計485個獲獎的王選獎進行分析,我們可以看到,媒體機構技術發展的過程分成兩個階段,第一個階段是數字化建設階段,在媒體融合的初期,各大媒體機構通過建設海量存儲,高速網絡,高性能計算,融媒體生產平臺實現了云網化和生產流程的數字化。第二個階段是智能化發展階段,伴隨著媒體融合向縱深發展,媒體機構順應時代潮流,發展重點向全媒化,社交化和智能化發展。這一階段新聞生產智能化成為最顯著的特點,從統計數據來看獲獎的智能化項目的數量呈逐年上升的態勢。
接下來以2021年榮獲王選獎一等獎的項目新華智媒工程向大家展示新華社在智能化應用上取得的成果。智能化當中,我們圍繞新聞生產的6個環節實現了新聞生產流程的智能化,構建了全媒體的智慧中臺,研發了191項先進技術賦能工具。
新華較真是基于新華社的權威數據和先進的人工智能算法,我們研發的一款符合主流價值觀的智能審校平臺,較真在政治術語、敏感詞、敏感標識、地圖等標識上的識別表現突出,目前較真已經通過了國產化的信創認證,全面實現了多A組,多模態,多場景的內容審校,值得一提的是新華社的編輯每天都在使用新華較真,也使得較真可以持續的學習業界最佳的表述數據,進而保持其準確性的持續提升。這里還要介紹一下技術賦能新聞產品制作的情況。當下新技術融入了新聞產品當中,成為新聞供給側解決的重要的語義,近年來新華社努力實現內容+技術+靈感+美學的有機統一,研發了五大類超過了百余款的產品,以智能化為代表新技術在賦能新聞業務方面取得了顯著的成果,當然看到成果的同時,我們也要看到面臨新的挑戰和問題。2020年英國衛報利用GPT3模型生成一篇評論文章,從那時起GPT就開始撬動了媒體人的神經,隨著ChatGPT的問世,我們進一步感受到媒體融合是一場持續深入系統的變革,為了在變革中贏得主動需要著力解決以下突出問題。
一是技術上卡脖子問題,二是傳播上卡嗓子問題,三是議題上的牽鼻子問題。這些問題在以往也存在,大模型之后讓這些問題更具有挑戰性,面對問題和挑戰媒體技術人迎難而上,從2020年以來開展大模型研究,同時我們認為媒體融合的技術發展進入了一個新階段,即:大模型再造階段。2021年啟動了新融合工程,圍繞新搜索、新模型、新標尺、新范式開啟了新一流流程采編再造。
第一個新,新搜索,即多模態、跨模態搜索,我們對外合作基于新華社圖文數據,訓練多模態大模型,實現了以圖搜圖搜視頻,以文搜圖搜視頻,既實現了基于語義的智能搜索功能。比如我們要做一個反映新疆人民幸福生活的圖片新聞,傳統的搜索僅靠搜索文字找不到可用的素材,現在通過新的多模態搜索技術在同樣一個數據庫,我們搜新疆人民的幸福生活可以看到大量的符合我們需求的有效素材,可見新的技術挖掘了歷史數據的新價值。
第二個新是新模型,即生成式大模型,基于開源模式,利用新華社高質量數據級,以及質量級,打造了近百億參數的mediaGpt大模型,已經實現了新聞評論,新聞大綱的內容生成。
以美食帶動旅游生成一篇評論,經過我們的編輯測評,這個模型在新聞中文場景生成效果優于ChatGPT,也說明高質量的數據級對模型的生成效果有顯著的影響,后續我們將向可控的文本生成,和300億或者更大參數的模型發起挑戰。
第三新是新標尺,我們需要找到一個分辨真假的技術標尺,防止虛假信息進入我們稿件庫,為此我們研發了AI生成檢測識別工具,目標就是既要研制導彈,也要建立反導防御系統,努力打造大模型時代攻防一體的武器庫。
第四個新,新范式,我們積極與編輯部門合作,共同探索實踐出AI生成視頻的新聞生產新范式。過去制作一分鐘短視頻大約需要兩三周時間,現在從腳本制作,分鏡頭,音效,配音,特效每個環節實現機器生產,制作時間壓縮到三天。這個AI視頻發布到推特以后廣受歡迎,受到了外交部領導的點贊和轉推。我們認為大模型等新興技術為媒體融合帶來新機遇,希望推動媒體融合贏得新一流采編流程再造的先機,塑造技術賦能新聞業務的新格局。