(相關(guān)資料圖)
超大模型依賴于海量的數(shù)據(jù),研究機(jī)構(gòu)Epoch AI認(rèn)為,對(duì)數(shù)據(jù)需求急劇增加,以至于可用于訓(xùn)練的高質(zhì)量文本可能會(huì)在2026年耗盡。
人工智能模型的兩個(gè)基本要素就是數(shù)據(jù)集和處理能力,系統(tǒng)在數(shù)據(jù)集上接受訓(xùn)練,模型通過處理能力檢測(cè)這些數(shù)據(jù)集內(nèi)外部之間的關(guān)系。在某種程度上,這兩大基本要素可以相互替代:一個(gè)模型可以通過吸收更多數(shù)據(jù)或增加更多處理能力加以改進(jìn)。然而,在專業(yè)人工智能芯片短缺的情況下,后者正變得越來越困難,這導(dǎo)致模型構(gòu)建者加倍專注于尋找數(shù)據(jù)。東北證券分析稱,在本輪AI浪潮下,疊加數(shù)據(jù)要素市場(chǎng)的快速變革,本身是數(shù)據(jù)源、或接近數(shù)據(jù)源的公司能夠更好地使用AI創(chuàng)造出更大價(jià)值,成為AI新時(shí)代真正的受益者。
據(jù)財(cái)聯(lián)社主題庫顯示,相關(guān)上市公司中:
中文在線擁有海量的正版中文數(shù)據(jù)資源,公司擁有網(wǎng)絡(luò)原創(chuàng)駐站作者440余萬名,超萬億字的中文文字資源。
中信出版是全國優(yōu)秀出版機(jī)構(gòu),擁有圖書、報(bào)刊、電子、音像和網(wǎng)絡(luò)出版及批發(fā)零售全牌照,主營圖書出版與發(fā)行、數(shù)字閱讀與服務(wù)業(yè)務(wù)和書店業(yè)務(wù)。
關(guān)鍵詞: