- 首頁
- 民文
- English
- 網(wǎng)站無障礙
- 舉報

- 登錄
清華團(tuán)隊推出“安全增強(qiáng)版DeepSeek”
2025年02月24日16:54 | 來源:人民網(wǎng)
人民網(wǎng)北京2月24日電 (記者趙竹青)2月23日,清華大學(xué)計算機(jī)系相關(guān)研究團(tuán)隊宣布推出大語言模型RealSafe-R1。該模型基于DeepSeek R1進(jìn)行深度優(yōu)化與后訓(xùn)練,在確保性能穩(wěn)定的基礎(chǔ)上,顯著提升了安全性,為開源大模型的安全發(fā)展與風(fēng)險治理提供了創(chuàng)新性解決方案。
近日來,國產(chǎn)開源大模型DeepSeek在自然語言處理和多任務(wù)推理方面展現(xiàn)了強(qiáng)大的技術(shù)實力,但在面對越獄攻擊等安全性挑戰(zhàn)時仍存在一定局限性。為此,清華團(tuán)隊提出了基于模型自我提升的安全對齊方式,將安全對齊與內(nèi)省推理相結(jié)合,使大語言模型能夠通過具有安全意識的思維鏈分析來檢查潛在風(fēng)險,實現(xiàn)基礎(chǔ)模型自身能力的自主進(jìn)化。
基于該方法,團(tuán)隊對DeepSeek-R1系列模型進(jìn)行后訓(xùn)練,正式推出RealSafe-R1系列大模型。實驗數(shù)據(jù)表明,RealSafe-R1安全性提升顯著,在多個基準(zhǔn)測試中有效增強(qiáng)了對各種越獄攻擊的抵抗力,并減輕了安全與性能之間的“蹺蹺板”現(xiàn)象。
據(jù)悉,RealSafe-R1各尺寸模型及數(shù)據(jù)集將于近期向全球開發(fā)者開源。
(責(zé)編:趙竹青、呂騫)
關(guān)注公眾號:人民網(wǎng)財經(jīng)
分享讓更多人看到
熱門排行
微信掃一掃提供新聞線索
推薦閱讀
打開客戶端體驗更多服務(wù)
打開





























第一時間為您推送權(quán)威資訊
報道全球 傳播中國
關(guān)注人民網(wǎng),傳播正能量