欧美日韩激情电影,久久亚洲精品毛片,日日夜夜天天综合入口,亚洲激情六月丁香

您的位置: 首頁 >科技 >

AI大模型無米下鍋 合成數據優勢凸顯 硅谷巨頭加速布局

2023-05-21 17:18:32 編輯:江卿辰 來源:
導讀 微軟,谷歌,英偉達等一系列硅谷的商業巨頭,對于合成數據領域相關的業務正在加速布局,合成數據也顯示出了多種的優勢。合成數據是通過計算...

微軟,谷歌,英偉達等一系列硅谷的商業巨頭,對于合成數據領域相關的業務正在加速布局,合成數據也顯示出了多種的優勢。合成數據是通過計算機技術人工所生成的,數據類型并不由真實的事件將數據產生,但合成數據同樣也具有可用性的特點,在數學和統計學領域,能夠將原始數據屬性反映出來可以作為原始數據的一種代替品,對于AI大模型進行訓練,并且驗證大模型的準確性。

大模型訓練過程中除了要有龐大數據量,支撐數據本身的質量也是極為重要的,ChatGPT在訓練的時候一共使用數據達到45TB,有將近1萬個單詞包含在內, ChatGPT等一系列大模型的訓練,主要是從書籍、期刊、維基百科等眾多方面得來的,總體來看,數據方面是比較依賴互聯網現有的公開數據。

在互聯網上文本參考的數量畢竟是有限的,GPT-3在數據參考方面已經達到了千億級別,下一代的大模型在參考數量上達到萬億級別以上之后,就會出現數據短缺這一問題,讓訓練出現瓶頸,在這種背景之下,合成數據的重要性就不斷的顯現出來。

合成數據擁有更低成本,更高效率和更高的質量這三大特點,這也是合成數據所具有的優勢,根據市場的調研機構在預測中看到2024年人工智能數據分析中的數據其中大約60%都是從合成數據當中得來的。

以自動駕駛領域作為例子,在實際駕駛方面擁有著較為復雜的路況和很多的變量,極端天氣下會對路況信息獲得較為困難,通過合成數據,就可以將各種場景進行模擬的駕駛,既保證了安全,同時也讓駕駛能力提高。


免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ   備案號:

本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。

郵箱:toplearningteam#gmail.com (請將#換成@)

主站蜘蛛池模板: 达州市| 台东市| 阳高县| 韶山市| 土默特右旗| 安图县| 行唐县| 张掖市| 沙坪坝区| 遂川县| 西华县| 辽宁省| 石台县| 乐陵市| 芦山县| 吕梁市| 龙门县| 汾西县| 延川县| 呼玛县| 梅河口市| 苗栗县| 太仓市| 黎平县| 富源县| 中超| 定南县| 丹阳市| 和顺县| 临潭县| 大荔县| 平乡县| 伊通| 轮台县| 郴州市| 定结县| 宁晋县| 女性| 嘉荫县| 叙永县| 泰和县|