www288cd.com-国产精品久久99,手机在线一区二区三区,久久精品国产一区二区三区,午夜精品区一区二区三

大模型行業,根本沒有什么“真”開源?

394次瀏覽

最近一段時間開源大模型市場非常熱鬧,先是蘋果開源了70億參數小模型DCLM,然后是重量級的Meta的Llama 3.1 和Mistral Large 2相繼開源,在多項基準測試中Llama 3.1超過了閉源SOTA模型。g8q知多少教育網-記錄每日最新科研教育資訊

不過開源派和閉源派之間的爭論并沒有停下來的跡象。g8q知多少教育網-記錄每日最新科研教育資訊

一邊是Meta在Llama 3.1發布后表示:“現在,我們正在迎來一個開源引領的新時代。”另一邊是Sam Altman在《華盛頓郵報》撰文,直接把開源閉源的矛盾上升到國家和意識形態層面。g8q知多少教育網-記錄每日最新科研教育資訊

在前段時間的世界人工智能大會上,李彥宏直言“開源其實是一種智商稅”,因為閉源模型明明性能強,推理成本更低,再次引發討論。g8q知多少教育網-記錄每日最新科研教育資訊

隨后,傅盛也發表了他的看法,他認為開源和閉源這兩個陣營是彼此共同競爭,共同發展。并對“開源其實是一種智商稅”這一觀點進行了反駁:“開源大語言模型是免費的,他怎么來的智商稅呢,誰在收稅?”,“如果今天企業用付費閉源大語言模型,那才叫'智商稅',尤其是收很高的模型授權費、API費用,一年花了數百上千萬,最后買回去當個擺設,甚至員工根本用不起來(模型)。”g8q知多少教育網-記錄每日最新科研教育資訊

這場爭論的核心涉及到技術發展的方向和模式,反映了不同利益相關者的觀點和立場,在我們談論大語言模型的開源和閉源之前,需要厘清先“開源”和“閉源”這兩個基本概念。g8q知多少教育網-記錄每日最新科研教育資訊

“開源”一詞源自軟件領域,指在軟件開發過程中公開其源代碼,允許任何人查看、修改和分發。開源軟件的開發通常遵循互惠合作和同儕生產的原則,促進了生產模塊、通信管道和交互社區的改進,典型代表包括Linux,Mozilla Firefox。g8q知多少教育網-記錄每日最新科研教育資訊

閉源軟件(專有軟件)由于商業或其他原因,不公開源代碼,只提供計算機可讀的程序(如二進制格式)。源代碼僅由開發者掌握和控制。典型代表包括Windows,安卓。g8q知多少教育網-記錄每日最新科研教育資訊

開源是一種軟件開發模式,基于開放、共享和協作,鼓勵大家共同參與軟件的開發和改進,推動技術的不斷進步和廣泛應用。g8q知多少教育網-記錄每日最新科研教育資訊

選擇閉源開發的軟件更有可能成為一個穩定、專注的產品,但是閉源軟件通常需要花錢,且如果它有任何錯誤或缺少功能,只能等待開放商來解決問題。g8q知多少教育網-記錄每日最新科研教育資訊

至于什么是開源大模型,業界并沒有像開源軟件一樣達成一個明確的共識。g8q知多少教育網-記錄每日最新科研教育資訊

大語言模型的開源和軟件開源在理念上是相似的,都是基于開放、共享和協作,鼓勵社區共同參與開發和改進,推動技術進步并提高透明性。g8q知多少教育網-記錄每日最新科研教育資訊

然而,在實現和需求上有顯著區別。g8q知多少教育網-記錄每日最新科研教育資訊

軟件開源主要針對應用程序和工具,開源的資源需求較低,而大語言模型的開源則涉及大量計算資源和高質量的數據,并且可能有更多使用限制。因此,雖然兩者的開源都旨在促進創新和技術傳播,但大語言模型開源面臨更多的復雜性,社區貢獻形式也有所不同。g8q知多少教育網-記錄每日最新科研教育資訊

李彥宏也強調了兩者的區別,模型開源不等于代碼開源:“模型開源只能拿到一堆參數,還要再做SFT(監督微調)、安全對齊,即使是拿到對應源代碼,也不知道是用了多少比例、什么比例的數據去訓練這些參數,無法做到眾人拾柴火焰高,拿到這些東西,并不能讓你站在巨人的肩膀上迭代開發。”g8q知多少教育網-記錄每日最新科研教育資訊

大語言模型的全流程開源包括將模型開發的整個過程,從數據收集、模型設計、訓練到部署,所有環節都公開透明。這種做法不僅包括數據集的公開和模型架構的開放,還涵蓋了訓練過程的代碼共享和預訓練模型權重的發布。g8q知多少教育網-記錄每日最新科研教育資訊

過去一年,大語言模型的數量大幅增加,許多都聲稱是開源的,但它們真的有多開放呢?g8q知多少教育網-記錄每日最新科研教育資訊

荷蘭拉德堡德大學的人工智能研究學者Andreas Liesenfeld和計算語言學家Mark Dingemanse也發現,雖然“開源”一詞被廣泛使用,但許多模型最多只是“開放權重”,關于系統構建的其他大多數方面都隱藏了起來。g8q知多少教育網-記錄每日最新科研教育資訊

比如Meta和微軟等科技雖將其大語言模型標榜為“開源”,卻并未公開底層技術相關的重要信息。而讓他們意外的是,資源更少的AI企業和機構的表現更令人稱贊。g8q知多少教育網-記錄每日最新科研教育資訊

該研究團隊分析了一系列熱門“開源”大語言模型項目,從代碼、數據、權重、API到文檔等多個方面評估其實際開放程度。研究還將OpenAI的ChatGPT作為閉源的參考點,凸顯了“開源”項目的真實狀況。g8q知多少教育網-記錄每日最新科研教育資訊

圖片g8q知多少教育網-記錄每日最新科研教育資訊

圖片圖片?為開放,~為部分開放,X為封閉
g8q知多少教育網-記錄每日最新科研教育資訊

結果顯示,項目間差異顯著,根據這個排行榜,Allen Institute for AI的OLMo是最開放的開源模型,其次是BigScience的BloomZ,兩者都是由非營利組織開發。g8q知多少教育網-記錄每日最新科研教育資訊

論文稱,Meta的Llama以及 Google DeepMind的Gemma 雖然自稱開源或開放,但實際上只是開放權重,外部研究人員可以訪問和使用預訓練模型,但無法檢查或定制模型,也不知道模型如何針對特定任務進行微調。g8q知多少教育網-記錄每日最新科研教育資訊

最近LLaMA 3和Mistral Large 2的發布引起了廣泛關注。在模型在開放性方面,LLaMA 3公開了模型權重,用戶可以訪問和使用這些預訓練和指令微調后的模型權重,此外Meta還提供了一些基礎代碼,用于模型的預訓練和指令微調,但并未提供完整的訓練代碼,LLaMA 3 的訓練數據也并未公開。不過這次LMeta帶來了關于LLaMA 3.1 405B 的一份93頁的技術報告。g8q知多少教育網-記錄每日最新科研教育資訊

Mistral Large 2的情況類似,在模型權重和 API 方面保持了較高的開放度,但在完整代碼和訓練數據方面的開放程度較低,采用了一種平衡商業利益和開放性的策略,允許研究使用但對商業使用有所限制。g8q知多少教育網-記錄每日最新科研教育資訊

谷歌表示,該公司在描述模型時“在語言上非常精確”,他們將Gemma稱為開放而非開源。“現有的開源概念并不總能直接應用于 AI 系統,”g8q知多少教育網-記錄每日最新科研教育資訊

這項研究的一個重要背景是歐盟的人工智能法案,該法案生效時,對歸類為開放的模型實施較寬松的監管,因此關于開源的定義可能會變得更加重要。g8q知多少教育網-記錄每日最新科研教育資訊

研究人員表示,創新的唯一途徑是通過調整模型,為此需要足夠的信息來構建自己的版本。不僅如此,模型還必須接受審查,例如,一個模型在大量測試樣本上進行了訓練,那么它通過特定測試可能并不算一項成就。g8q知多少教育網-記錄每日最新科研教育資訊

他們也對如此多的開源替代方案的出現感到令人欣喜,ChatGPT非常受歡迎,以至于很容易讓人們忘記對其訓練數據或其他幕后手段一無所知。對于那些希望更好地了解模型或基于構建應用的人來說,這是一個隱患,而開源替代方案使得關鍵的基礎研究成為可能。g8q知多少教育網-記錄每日最新科研教育資訊

硅星人也對國內部分開源大語言模型的開源情況進行了統計:g8q知多少教育網-記錄每日最新科研教育資訊

圖片g8q知多少教育網-記錄每日最新科研教育資訊

從表中我們可以看到,和海外的情況類似,開源較為徹底的模型基本是由研究機構主導,這主要是因為研究機構的目標是推動科研進步和行業發展,更傾向于開放其研究成果。g8q知多少教育網-記錄每日最新科研教育資訊

而商業公司則利用其資源優勢,開發出更為強大的模型,并通過適當的開源策略在競爭中獲得優勢。g8q知多少教育網-記錄每日最新科研教育資訊

從GPT-3到BERT以來,開源為大模型生態系統帶來了重要的推動力。g8q知多少教育網-記錄每日最新科研教育資訊

通過公開其架構和訓練方法,研究人員和開發者可以在這些基礎上進行進一步的探索和改進,催生出更多前沿的技術和應用。g8q知多少教育網-記錄每日最新科研教育資訊

開源大模型的出現顯著降低了開發的門檻,開發者和中小企業能夠利用這些先進的AI技術,而不必從零開始構建模型,從而節省了大量的時間和資源。這使得更多創新項目和產品得以快速落地,推動了整個行業的發展。開發者們在開源平臺上積極分享優化方法和應用案例,也促進了技術成熟和應用。g8q知多少教育網-記錄每日最新科研教育資訊

對教育和科研而言,開源大語言模型提供了寶貴資源。學生和新手開發者通過研究和使用這些模型,能快速掌握先進AI技術,縮短學習曲線,為行業輸送新鮮血液。g8q知多少教育網-記錄每日最新科研教育資訊

然而,大語言模型的開放性并非簡單的二元特性。基于Transformer的系統架構及其訓練過程極為復雜,難以簡單歸類為開放或封閉。開源大模型并非一個簡單的標簽,更像一個光譜,從完全開源到部分開源,程度各異。g8q知多少教育網-記錄每日最新科研教育資訊

大語言模型的開源是一項復雜而細致的工作,并非所有模型都必須開源。g8q知多少教育網-記錄每日最新科研教育資訊

更不應以“道德綁架”的方式要求全面開源,因為這涉及大量技術、資源和安全考量,需要平衡開放與安全、創新與責任。正如科技領域的其他方面一樣,多元化的貢獻方式才能構建一個更豐富的技術生態系統。g8q知多少教育網-記錄每日最新科研教育資訊

開源和閉源模型的關系或許可以類比于軟件行業中開源和閉源軟件的共存。g8q知多少教育網-記錄每日最新科研教育資訊

開源模型促進了技術的廣泛傳播和創新,為研究者和企業提供了更多可能性,而閉源模型則推動著整個行業的標準的提升。兩者的良性競爭激發了持續改進的動力,也為用戶提供了多樣化的選擇。g8q知多少教育網-記錄每日最新科研教育資訊

正如開源和專有軟件共同塑造了今天的軟件生態,開源和閉源大模型之間也并非二元對立,兩者的并存發展是推動AI技術不斷進步、滿足不同應用場景需求的重要動力。最終,用戶和市場會作出適合自己的選擇。g8q知多少教育網-記錄每日最新科研教育資訊


g8q知多少教育網-記錄每日最新科研教育資訊

本文鏈接:http://knowith.com/news-23-478.html大模型行業,根本沒有什么“真”開源?

聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

熱門文章

延伸閱讀

相關閱讀

熱點精選

最新推薦

您可能感興趣

關于延續實施文化體制改革中經營性文化事業單位轉制為企業有關稅收政策的公告(2023年第71號)

《關于北京市全面優化營商環境打造“北京服務”的意見》

北京市國防科學技術工業辦公室關于轉發市委軍民融合辦關于組織召開5G融合應用創新大賽線下解讀會的通知

【解讀】《關于加強科技型企業全生命周期金融服務的通知》

【解讀】《北京經濟技術開發區小微企業貸款風險補償資金管理辦法》政策解讀

央企研發經費投入連續兩年破萬億

首屆中關村數字傳播論壇在京舉辦

2023年度《中國國際科技合作網工作年度報表》

《自然資源數字化治理能力提升總體方案》

《綠色建材產業高質量發展實施方案》

大吉大利:佛山禪城代還信用卡墊還,最便宜的地方,多年經驗誠信

印度奧希替尼價格多少錢正式公布:剛2025官宣低價2800元國內代購

喜從天降:上海閔行區墊還信用卡,專業公司可靠,值得信任

大吉大利:深圳光明上門代還信用卡,最好還款服務,多年經驗誠信

銳意進取:花唄大額度怎么提現出來 - 試試最新的十個方法

經典-羊小咩消費額度怎么刷出來,羊小咩享花卡最新TX方法

2024全網輕松:DY月付怎么找套取商家!

大環境~微信分付額度怎么套出來(3個提現方法很多人不知)

指定:羊小咩享花卡出來這個額度了怎么弄出來,快速變現

小白必知:DY月付怎么找秒到商家分享四大技巧:

www288cd.com-国产精品久久99,手机在线一区二区三区,久久精品国产一区二区三区,午夜精品区一区二区三
91成人免费网站| 久久久久国产精品免费免费搜索| 欧美一级电影网站| 中文字幕一区视频| 久久超碰97人人做人人爱| 色偷偷88欧美精品久久久| 久久久久久久久久久黄色| 五月婷婷久久综合| 色先锋aa成人| 国产精品毛片大码女人| 久久99精品久久久久婷婷| 欧美日韩一区高清| 亚洲欧洲三级电影| 国产精品亚洲午夜一区二区三区| 欧美精品亚洲一区二区在线播放| ...xxx性欧美| 丁香啪啪综合成人亚洲小说| 日韩欧美中文字幕公布| 亚洲五月六月丁香激情| 97久久超碰国产精品| 亚洲国产精品国自产拍av| 韩日精品视频一区| 日韩一区二区三区电影在线观看| 亚洲电影你懂得| 91成人免费在线| 亚洲色图.com| av电影一区二区| 国产精品日日摸夜夜摸av| 国产精品1区2区3区| 日韩欧美的一区二区| 日韩激情av在线| 欧美精品久久天天躁| 亚洲成人自拍一区| 欧美性大战久久久久久久蜜臀| 亚洲人123区| 色综合天天综合狠狠| 18涩涩午夜精品.www| 成人开心网精品视频| 国产女同性恋一区二区| 国产成人夜色高潮福利影视| 国产午夜一区二区三区| 国产一区二区三区综合| 久久综合久久综合久久| 国产一区二区精品久久99| 久久久久青草大香线综合精品| 韩国精品主播一区二区在线观看| 欧美电影免费观看高清完整版在| 久久精品国产一区二区| 日韩美一区二区三区| 激情亚洲综合在线| 国产午夜亚洲精品理论片色戒| 国产成人一级电影| 国产精品日韩成人| 色婷婷综合久色| 亚洲成人免费视| 日韩一区二区麻豆国产| 韩国成人福利片在线播放| 欧美精品一区二区三区在线| 国产大陆a不卡| 国产精品久久福利| 在线中文字幕不卡| 丝袜亚洲另类欧美综合| 欧美一卡2卡3卡4卡| 久88久久88久久久| 国产三级欧美三级日产三级99 | 暴力调教一区二区三区| 自拍av一区二区三区| 欧美最猛黑人xxxxx猛交| 午夜精品福利久久久| 日韩视频永久免费| 国产福利一区在线| 亚洲天堂a在线| 欧美日韩和欧美的一区二区| 美女脱光内衣内裤视频久久网站 | 亚洲高清中文字幕| 日韩欧美国产麻豆| 高清日韩电视剧大全免费| 亚洲免费成人av| 91精品久久久久久久99蜜桃| 国产在线麻豆精品观看| 中文字幕在线不卡视频| 欧美日韩第一区日日骚| 国产一区二区在线免费观看| 成人欧美一区二区三区1314| 欧美久久高跟鞋激| 国产91在线观看| 亚洲国产精品精华液网站| 精品人在线二区三区| aaa国产一区| 日韩成人一区二区三区在线观看| 久久九九久久九九| 欧美性大战久久久久久久| 狠狠狠色丁香婷婷综合久久五月| 17c精品麻豆一区二区免费| 777久久久精品| 丁香婷婷综合激情五月色| 亚洲一区在线播放| 久久久亚洲高清| 在线免费视频一区二区| 捆绑紧缚一区二区三区视频| 综合色天天鬼久久鬼色| 日韩欧美国产综合| 91麻豆国产在线观看| 久久99久久精品| 一级日本不卡的影视| 久久久久亚洲蜜桃| 欧美精品一二三| 99re66热这里只有精品3直播 | 国产在线播放一区| 亚洲在线观看免费视频| 久久综合久久鬼色| 欧美丝袜第三区| 高清国产午夜精品久久久久久| 午夜精品久久久久久久蜜桃app| 国产午夜精品一区二区三区视频| 欧美亚洲综合一区| 丰满少妇在线播放bd日韩电影| 丝袜亚洲另类欧美综合| 成人免费一区二区三区视频| 精品国产一区二区三区忘忧草| 日本伦理一区二区| 粉嫩绯色av一区二区在线观看| 日本午夜精品视频在线观看| 亚洲人精品一区| 久久精品亚洲精品国产欧美| 6080午夜不卡| 91啪亚洲精品| 国产精品996| 蜜桃av一区二区在线观看| 一区二区三区四区在线免费观看| 国产视频一区在线观看| 日韩免费观看高清完整版| 欧美午夜精品久久久久久孕妇 | 欧美三级乱人伦电影| 成人亚洲一区二区一| 精品制服美女久久| 天天操天天干天天综合网| 亚洲女爱视频在线| 国产精品毛片a∨一区二区三区| 精品久久久久久久久久久久包黑料| 欧美色图激情小说| 色综合中文字幕| 播五月开心婷婷综合| 国产精品一区2区| 精品一区二区影视| 免费久久99精品国产| 视频精品一区二区| 亚洲午夜电影在线| 一区二区视频在线看| 国产精品久久777777| 欧美激情一区二区三区在线| 精品盗摄一区二区三区| 欧美一二三区精品| 欧美精品一二三四| 欧美日韩成人在线一区| 在线观看欧美精品| 一本到三区不卡视频| 91免费小视频| 91丨九色丨尤物| 91丨porny丨国产入口| 9久草视频在线视频精品| 成人午夜电影网站| 成人动漫一区二区在线| 成人午夜短视频| 成人av电影免费在线播放| 成人网男人的天堂| 99免费精品在线观看| 99久久精品国产毛片| 91在线视频18| 色美美综合视频| 欧美午夜视频网站| 欧美精品色综合| 日韩一区国产二区欧美三区| 日韩视频中午一区| 欧美精品一区二区三区久久久| 精品国产制服丝袜高跟| 久久久久国产一区二区三区四区 | 欧美aaa在线| 久久国产精品72免费观看| 久久99国产精品久久| 国产在线播放一区二区三区| 国产成人综合在线观看| 成人免费高清在线| 色综合天天天天做夜夜夜夜做| 色视频成人在线观看免| 欧美日韩亚洲丝袜制服| 欧美一三区三区四区免费在线看| 91精品国产免费| 日韩欧美中文字幕公布| 久久色中文字幕| 国产精品美女久久福利网站| 亚洲四区在线观看| 亚洲一区二区三区四区中文字幕| 午夜久久电影网| 蜜臀av亚洲一区中文字幕| 极品尤物av久久免费看| 成人性生交大合| 欧美亚洲国产一卡| 日韩欧美卡一卡二| 中文在线资源观看网站视频免费不卡|