OpenAI員工在推特上,像極了上班的你

OpenAI發布旗艦推理模型o3和o3-mini,成為他們2024年的收官之作,制造了一波小熱潮。和往常一樣,Twitter (x.com)依然是外網討論的主陣地。
但有件事不知你發現沒,這次來自OpenAI“自己人”的聲量明顯增強了——幾乎所有擁有x賬號的OpenAI員工都在發文,為公司的重大模型更新站臺助威。
網友們越刷推越發現,放眼望去,怎么滿世界都是OpenAI的工程師和研究員。而且這次不再局限于那幾個耳熟能詳的名字,整個團隊都出來了。
此情此景,是不是還挺熟悉~Twitter上的OpenAI員工們,像不像在朋友圈奮力為東家“營業”的你?
1 OpenAI全員共創o3盛事之:領導班子帶頭PR
掌門人奧特曼不用多說了:從發布前按捺不住以“oh oh oh”暗示新品,邀請大家申請o3測試權限;
到強調o3-mini編程表現以顯著降低的成本超越o1,在線感激團隊成員的辛勞付出,稱大家一起工作是“人生中最大的快樂之一”;
再到各種一鍵三連同事們的o3推文,熱鬧非常。
上個月剛結束"人生中最長假期"的OpenAI聯合創始人兼總裁Greg Brockman,回歸后一直在緊密配合公司的每一步動作,勤勞搞宣發。
o3上線后他發聲力贊:新模型在最具挑戰性的測試中實現了質的飛躍,直接達到一個全新的高度。
首席產品官Kevin Weil和研究副總裁Mark Chen分別轉發ARC-AGI測試突破和o3-mini團隊的推文。
新任OpenAI首席信息安全官Dane Stuckey也來“一二三,上鏈接”了,感嘆這是“多么令人興奮的一天”。
有意思的是,Stuckey大約四年前就注冊了推特賬號,而直到今年10月他離開Palantir Tech,官宣加入OpenAI后,才開始正式發文。并且一改往日低調,變得異常活躍。
主創團隊攜手登場
在這次發布直播中,年輕的華人研究員Hongyu Ren作為團隊代表,詳細介紹了輕量級模型o3 mini。
他隨后在推特上發文,重點講解o3 mini的卓越性能,包括其高效性、成本效益以及靈活可調的推理時間。還特別提到了幾位參與o3-mini研發的核心成員,向他們致敬。
幾位主創也紛紛發文回應,稱o3-mini是“一個聰明的小怪獸”、“速度極快”、擁有“驚人的數學和代碼性能”,言語間自豪之情盡顯。
其實,這些研究員們在業內已經頗有建樹。查看他們的背景就會發現,不少人都是o1和o1-mini的關鍵貢獻者。不過這一波官宣也確實讓更多公眾認識了他們,以OpenAI的造星能力來看,出幾個新的大模型界KOL或許指日可待。
各組同事扎堆夸夸
此次“OpenAI夸夸團”的團友之多:只要點進一位員工的x賬號,就大概率能順著各種"套娃式"轉發,連環點進其他幾位同事夸贊o3的推文里。
搞得我們都懷疑奧特曼是不是下達了什么指標,把增加o3曝光度也算進員工KPI里。
在微軟研究院工作了十年、曾擔任AI副總裁及杰出科學家的知名計算機大佬Sébastien Bubeck,于今年10月入職了OpenAI。他在置頂推文中坦言,o3和o3-mini是自己截至目前最喜歡的模型,o3各項評估簡直封神,特別是前沿數學25%的測試成績。
領導過GPT-4o預訓練和o1開發的研究員Aidan Clark更是連發五條,激贊“Hongyu 真得太厲害了”,表示o3-mini是第一個讓他真正能提出難題的模型。
專注GPT增長的技術團隊成員Anshita Saini說,o3給人的感覺很不一樣。整個o3系列的理念會讓她停下來思考“一個將AGI產品化的世界是什么樣子”。
研究人員在線剖析
除了以上這種直給式力挺,還有一些OpenAI研究員承擔了答疑解惑的角色,試圖通過分享觀點來澄清一些問題。
o3和o3-mini的發布給社區帶來振奮的同時,也引發了一些爭議和質疑。有人因為ARC-AGI的測試結果歡呼AGI近在咫尺,甚至已經實現;也有人嗤之以鼻,對o3高昂的算力需求和運營成本表示擔憂,吐槽這不過是又一個"畫餅"產品。
對此,OpenAI多模態推理研究員Noam Brown發文表示:外界對ARC-AGI測試的反應有些過度,突破ARC-AGI基準并不意味著模型已達到AGI水平。他還提到了AI領域的一個普遍現象:人們往往認為某個基準測試需要"超智能"才能完成,但當真的有模型攻克這個基準時,人們又會因為它沒有達到預期中的"超智能"水平而感到失望。
言外之意:請理性對待,不要捧殺。
OpenAI API工程主管Sherwin Wu對此深表贊同,Sherwin提醒社區:比起ARC-AGI測試,o3在編程和數學上的突破才更值得關注——o3的編程水平已經超越了自己,而o3能答對四分之一的前沿數學題目自己更是一道都解不出。
另外,針對o3模型是否使用特定數據集、通過特定領域優化、或人為調整提示格式來提高評估結果的質疑,公司研究員Brandon McKinzie和Rhythm Garg相繼回應:
評估中使用的arc-agi公共訓練集僅是更大o3訓練數據的一小部分,無法決定模型表現;o3是通用模型,未進行任何特定領域的微調;ARC-AGI高分并非依賴調整提示,而是模型通用性和訓練結果的自然體現。
關于o3的高昂價格,研究員Nat McAleese這樣解釋:雖然o3是目前測試階段成本最高的模型,但它開啟了一個"用計算換性能"的新時代。通過增加測試階段的計算量,o3將模型性能提升到了一個"令人難以置信的水平"。
Nat認為,盡管目前確實很貴,但隨著技術進步,token價格會逐漸降低。更關鍵的是,團隊已經找到了一種能夠高效地將計算量轉化為性能提升的方法,這預示著未來AI模型的能力還將大幅提升。
最后是OpenAI模型訓練速度的問題。在中文社區頗有影響力的Jason Wei表示:從o1到o3的升級僅用了三個月時間,證明了基于思維鏈的強化學習新范式,比傳統預訓練方式每1-2年才能推出一個新模型的節奏要快得多。
連OpenAI日本辦公室總裁Tadao Nagasaki也出來捧場:“我們不是才在九月份發布了 o1?現在已經開始對o3 早期評估了!”
2 集體營業要傳達什么信息
這次OpenAI員工集體為o3發布背書,首先是出于對產品的高度自信。通過不同角度的解讀,他們希望外界能夠更全面地了解o3在數學、編程和推理方面的突破性成就。OpenAI有意向外界展示:自己依然是AI技術的領導者,在競爭者四起的市場上存在感依舊。
此外,在當前OpenAI面臨外界質疑、競爭壓力加劇的關鍵時間點,加之核心員工頻繁流失以及“吹哨人”風波的影響,全員營業也帶有了些許“抱團取暖”的意味。他們試圖借這次發布向社區傳遞幾個信號:
1. 擴展法則有新突破
多位OpenAI研究員指出,o3和o3-mini驗證了增加計算資源、數據量和模型參數確實能帶來顯著性能提升,并且突破了傳統擴展法則“遞減效益”的限制,證明模型在未來仍有巨大的提升空間。
2. 技術創新沒有“撞墻”
員工們通過轉發測試數據和詳細解讀,強調o3系列的理念和性能突破了許多人對AI模型邊界的想象,不僅在性能上取得了超越預期的突破,也展現了更廣泛的適用性。相比外界對GPT-5“難產”的傳言,OpenAI想證明他們正在開辟另一條創新之路。
3. 訓練速度并未放緩
面對外界關于OpenAI模型迭代速度的質疑,特別是在全球AI競爭日益激烈的背景下,從o1到o3的迅速升級成了明確回應。表明OpenAI有能力突破傳統預訓練1-2年的開發周期,以更快的速度推出高質量模型,穩固市場信心。
回過頭看,從上線o1正式版到官宣o3,這12天技術直播更像一場聲勢浩大的OpenAI大秀。去年這個時候,那場震撼全網的"OpenAI is nothing without its people"全員聲援才剛剛落幕。一年過去,OpenAI不能說不好,卻也不復曾經GPT時的巔峰輝煌。在經歷了各種高低曲折后,或許每位員工都想在年底拼一把來make OpenAI great again。
本文鏈接:http://knowith.com/news-23-149803.htmlOpenAI員工在推特上,像極了上班的你
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
【申報】關于發布《2024年北京市支持中小企業發展資金實施指南(第一批)》的通知
國務院辦公廳印發《關于加快內外貿一體化發展的若干措施》的通知
【解讀】金融監管總局有關負責人就《國務院關于推進普惠金融高質量發展的實施意見》答記者問
【圖解】《海淀區積極應對疫情影響助企紓困的若干措施》
經濟結構不斷優化 就業形勢總體改善 經濟增速名列前茅 2023年我國GDP同比增長5.2%
中電數據科學與智能工程研究院成立
科技部關于印發《國家科學技術獎提名辦法》的通知
白銀高新區入選全國首批減污降碳協同創新試點園區
圖說外觀設計|一圖概覽外觀設計本國優先權制度
科技部辦公廳 財政部辦公廳關于開展2023年度科技成果轉化年度報告工作的通知
大吉大利:深圳龍華墊還信用卡,真實商戶積分,實體店多種方式
印度恩西地平代購渠道以及代購價格公布!2025印度恩西地平哪里買?
2025全新:DY月付套出來可以嗎最新操作分享-
大吉大利:東莞萬江上門代還信用卡,放心的選擇,值得信任
聲情并舉: 羊小咩消費額度誰能提現? 具體如何申請操作
如登春臺:石家莊晉州市代還信用卡最好還款服務,值得信任
急用必看:羊小咩便荔卡秒到賬商家!大額必看:
已公開!印度曲美替尼(2024年)靶向藥yb詳細價格表已經公布
真實的技巧:羊小咩便利卡套取商家怎么找?
重大: 羊小咩的額度如何套出來 (誠信商家教會你怎么做)