欧美极品一区二区,国家aaa的一级看片,欧美精品一区免费,超碰av男人的天堂,狠狠色狠狠色综合久久一,久久涩综合,爽好久久久欧美精品

中國(guó)網(wǎng)首頁

首頁  >   向young云  >

專家:加強(qiáng)數(shù)字中文建設(shè)需從三個(gè)維度重塑發(fā)展格局

2025-04-01 09:07

來源:中國(guó)網(wǎng)

分享到:
鏈接已復(fù)制
字體:

中國(guó)網(wǎng)4月1日訊(記者 劉佳)20世紀(jì)中文信息處理技術(shù)解決了漢字進(jìn)電腦、上網(wǎng)絡(luò)的歷史性問題,迎來從“鉛與火”到“光與電”的革命。時(shí)至今日,人工智能技術(shù)快速發(fā)展,中國(guó)如何加強(qiáng)數(shù)字中文建設(shè),從而推動(dòng)中文信息處理技術(shù)創(chuàng)新發(fā)展?

在教育部3月31日舉行的新聞發(fā)布會(huì)上,中國(guó)網(wǎng)記者就此提問北京大學(xué)王選計(jì)算機(jī)研究所所長(zhǎng)湯幟。他認(rèn)為,要聚焦關(guān)鍵垂直領(lǐng)域建設(shè)語料基礎(chǔ)設(shè)施,構(gòu)建支持大模型訓(xùn)練的高質(zhì)量中文數(shù)據(jù)集,同時(shí)形成“技術(shù)突破—場(chǎng)景落地—生態(tài)繁榮”的良性循環(huán)。

中國(guó)網(wǎng)記者現(xiàn)場(chǎng)提問。中國(guó)教育報(bào)記者 張勁松/攝

20世紀(jì)80年代,王選院士的團(tuán)隊(duì)發(fā)明激光照排技術(shù),并結(jié)合漢字的編碼標(biāo)準(zhǔn),突破了中文數(shù)字化的空間限制,讓承載中華文化的中文在全球互聯(lián)網(wǎng)空間獲得新生。當(dāng)前,大語言模型技術(shù)對(duì)大規(guī)模高質(zhì)量語料提出前所未有的需求,賦予了數(shù)據(jù)中文化新的歷史內(nèi)涵和使命任務(wù)。中文信息處理技術(shù)的發(fā)展從以往解決漢字輸入輸出的基礎(chǔ)性問題,進(jìn)階到當(dāng)先釋放語言文字?jǐn)?shù)據(jù)要素價(jià)值的全方位突破。

湯幟認(rèn)為,加強(qiáng)數(shù)字中文建設(shè)需從三個(gè)維度重塑發(fā)展格局,推動(dòng)中文信息處理技術(shù)發(fā)展進(jìn)入新階段:即從重要資源轉(zhuǎn)化到數(shù)據(jù)要素價(jià)值;從廣泛存在聚焦到關(guān)鍵領(lǐng)域應(yīng)用;從基礎(chǔ)支撐提高到賦能全局發(fā)展。

湯幟表示,新形勢(shì)下,語言文字將實(shí)現(xiàn)從“靜態(tài)符號(hào)”向“動(dòng)態(tài)數(shù)字資產(chǎn)”,從“信息載體”向“生產(chǎn)要素”的轉(zhuǎn)型,要重點(diǎn)推動(dòng)語料庫、數(shù)據(jù)標(biāo)注與評(píng)價(jià)等標(biāo)準(zhǔn)的研制,支持文本生成與理解、語言翻譯、情感分析等各種任務(wù)。

語言文字“日學(xué)而不察、日用而不覺”,廣泛存在于社會(huì)生產(chǎn)各個(gè)方面。新形勢(shì)下,語言文字將實(shí)現(xiàn)從符號(hào)存儲(chǔ)到智能建模的質(zhì)變,要聚焦關(guān)鍵垂直領(lǐng)域建設(shè)語料基礎(chǔ)設(shè)施,構(gòu)建支持大模型訓(xùn)練的高質(zhì)量中文數(shù)據(jù)集。

當(dāng)前,人工智能技術(shù)發(fā)展迅速,語言文字信息處理技術(shù)創(chuàng)新應(yīng)用正經(jīng)歷從“GB2312字符集”到“萬億參數(shù)大語言模型”的范式變革。湯幟強(qiáng)調(diào),新形勢(shì)下,語言文字將實(shí)現(xiàn)與信息技術(shù)的深度融合,要形成“技術(shù)突破—場(chǎng)景落地—生態(tài)繁榮”的良性循環(huán),打造數(shù)字化引領(lǐng)品牌,有力服務(wù)教育發(fā)展、助力科技創(chuàng)新、賦能文化傳承、推動(dòng)產(chǎn)業(yè)升級(jí)、促進(jìn)社會(huì)進(jìn)步。

編審:張艷玲 王月博