国产精品99久久久久久人小-av在线免费观看小说-女同志一区二区你懂的在线-日韩一区二区三区精品丝袜

Internet Develppment
互聯(lián)網(wǎng)開發(fā)& 推廣服務(wù)提供商

我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

OpenAI王炸第二彈強(qiáng)化微調(diào):12個(gè)例子搞定專業(yè)學(xué)習(xí)推理,Altman稱為今年最大驚喜

發(fā)布時(shí)間:2024-12-07 09:59:33來(lái)源:華爾街見聞

  OpenAI研究員演示,強(qiáng)化微調(diào)后的o1 mini測(cè)試通過(guò)率甚至比正式版o1高24%,比未強(qiáng)化微調(diào)的o1 mini提高了82%。

  OpenAI連續(xù)12天“王炸”的第二彈來(lái)了。不同于第一日聚焦人工智能(AI)模型,第二日的王炸專注于服務(wù)企業(yè)等組織的一款新功能,雖然看起來(lái)不太側(cè)重于普通消費(fèi)者,但據(jù)介紹它甚至可以簡(jiǎn)易版推理模型o1 mini的效果超過(guò)本周四發(fā)布的正式版o1、即所謂滿血o1。

  美東時(shí)間12月6日周五,OpenAI在社交媒體X公布第二日活動(dòng)的主題是新功能“強(qiáng)化微調(diào)”(Reinforcement Fine-Tuning)。這個(gè)主題是指,企業(yè)組織將能夠通過(guò)“強(qiáng)化微調(diào)”微調(diào)o1 mini,滿足他們的特定需求。

  OpenAI CEO Sam Altman在X發(fā)帖稱,強(qiáng)化微調(diào)的效果非常棒,是他今年最大的驚喜之一,期待看到大家利用這種功能的創(chuàng)造。
  OpenAI的研究員本周五介紹,科學(xué)家、開發(fā)人員和研究人員可以根據(jù)自己的數(shù)據(jù)、而不是僅僅使用公開可用的數(shù)據(jù),量身定制OpenAI的強(qiáng)大推理模型o1。不同行業(yè)的人可以使用強(qiáng)化學(xué)習(xí)來(lái)創(chuàng)建基于 o1 的專家模型,從而提高該領(lǐng)域的整體專業(yè)知識(shí)水平。開發(fā)者、研究者和機(jī)器學(xué)習(xí)工程師將首次能運(yùn)用強(qiáng)化學(xué)習(xí),打造在精通他們各自專業(yè)領(lǐng)域的專家模型。

  OpenAI的研究員稱,強(qiáng)化微調(diào)并不是單單教模型模型輸出,它的運(yùn)作方式是,當(dāng)模型發(fā)現(xiàn)一個(gè)問題的時(shí)候,研究者給模型空間區(qū)仔細(xì)思考這個(gè)問題,然后評(píng)估模型給出的最終解答,運(yùn)用強(qiáng)化學(xué)習(xí),研究者可以強(qiáng)化產(chǎn)生正確答案的思路,抑制產(chǎn)生錯(cuò)誤答案的思路,只需要“幾十個(gè)例子”(a few dozen examples)、甚至12個(gè)例子,模型就能以有效的新方式學(xué)習(xí)特定領(lǐng)域的推理。

  通過(guò)強(qiáng)化學(xué)習(xí),用戶可以用大模型在特定數(shù)據(jù)上訓(xùn)練其他模型。這對(duì)于涉及到大量數(shù)據(jù)的復(fù)雜領(lǐng)域或需要專家領(lǐng)域知識(shí)的新研究非常有用。研究者舉例稱,最近和湯森路透合作,運(yùn)用強(qiáng)化微調(diào)微調(diào)o1 mini,讓充當(dāng)法務(wù)助理,幫助他們的法律專業(yè)人士完成大部分分析工作流。

  OpenAI稱,OpenAI的定制模型平臺(tái)將支持強(qiáng)化學(xué)習(xí),強(qiáng)化學(xué)習(xí)也是OpenAI內(nèi)部用于訓(xùn)練自家前沿模型的技術(shù),如GPT-4o和o1系列模型。在OpenAi的內(nèi)測(cè)中,強(qiáng)化微調(diào)已經(jīng)在生物化學(xué)、安全、法律和醫(yī)療保健領(lǐng)域取得成功。OpenAI計(jì)劃,2025年初讓強(qiáng)化微調(diào)面向公眾發(fā)布,目前已對(duì)企業(yè)、大學(xué)和研究院開放申請(qǐng)測(cè)試通道。

  伯克利大學(xué)罕見遺傳病研究員 Justin Reese參與了OpenAI本周五對(duì)o1 mini模型的現(xiàn)場(chǎng)演示。演示中,研究者試圖從樣本數(shù)據(jù)池中獲取可能導(dǎo)致疾病的模型 ID 基因。

  研究員展示了一個(gè)評(píng)估表,下圖可見,第一行是本周四OpenAI發(fā)布的正式版o1測(cè)評(píng)表現(xiàn),第二行是o1 mini的測(cè)評(píng)結(jié)果 ,第三行結(jié)果來(lái)自經(jīng)過(guò)最終強(qiáng)化微調(diào)的o1 mini。研究員進(jìn)行了三類評(píng)估,其中,top @1是測(cè)試模型給出的正確答案出現(xiàn)在列表最前列中的概率,top@5是正確答案出現(xiàn)在前五列的概率,top@max是答案出現(xiàn)在所有正確答案列表的概率。

  如圖所示,正式版o1的測(cè)試通過(guò)率為25%,o1 mini為17%,而強(qiáng)化微調(diào)后的o1 mini竟然達(dá)到31%,超過(guò)了正式版o1,比正式版o1的測(cè)評(píng)結(jié)果高24%,而且相比未強(qiáng)化微調(diào)前,微調(diào)后的結(jié)果提高了82.3%?!?/p>

  據(jù)OpenAI所說(shuō),用戶可以綜合運(yùn)用o1、微調(diào)和數(shù)據(jù)創(chuàng)建定制的小型 o1模型 o1 mini。用戶要做的就是提供數(shù)據(jù),然后在強(qiáng)化微調(diào)方面,設(shè)置一個(gè)數(shù)據(jù)集和一個(gè)“評(píng)分器”,根據(jù)訓(xùn)練和驗(yàn)證數(shù)據(jù)集評(píng)估模型的性能,其他工作交給OpenAI。

最新資訊
? 2018 河北碼上網(wǎng)絡(luò)科技有限公司 版權(quán)所有 冀ICP備18021892號(hào)-1   
? 2018 河北碼上科技有限公司 版權(quán)所有.
中国熟女色av夜夜嗨| 啊啊啊啊大鸡巴操我视频 | 日韩精品一区av在线| 天天舔操操操av| 97精品人妻人人做人人爽| 亚洲精品美女久久久| 日本入室强伦姧人妻中文| 亚洲精品美女久久久| 久久精品国产自清天天线| 2021国产精品自在自线| 国产综合精品一区二区青青| 免费男人和女人黄片| 猛哥操女人B视频| 亚洲乱码专区一区二区三区四区 | 精品麻豆国产免费一区二区三区| 大黑屌日本另类肛交| 美女穿黑丝被大鸡巴猛操| 国产剧情使劲操我逼| 欧美成人精品一区二区免费看| 五月天国产成人免费视频 | 亚洲欧美一区二区爽爽爽| 日韩在线中文字幕在线视频| 国产精品久久一区二区三区夜色| 男人扒开女人腿狂躁免费| 国产精品免费99久久久| 国产91视频观看| 欧美 日韩 亚洲 熟女| 日本成人精品一区二区三区| 内射白嫩少妇超碰| 正在播放舔穴视频| 激烈18禁高潮视频免费| 欧美亚洲熟妇视频在线观看| 亚洲福利小视频在线观看| 把美女日到高潮喷水视频| 乱伦美女小骚货视频| 国产亚洲欧美日韩在线观看一区 | 99爱这里只有精品| 乱伦美女小骚货视频| 成人黄色网破处在线播放| 在线无码一区二区三区不卡| 欧美大鸡巴操穴日韩|