谷歌 DeepMind 通過強(qiáng)化學(xué)習(xí)微調(diào)提升 AI 決策能力 近期,谷歌 DeepMind 團(tuán)隊與約翰?開普勒林茨大學(xué) LIT AI 實驗室合作,開展了一項關(guān)于人工智能語言模型的新研究。他們采用了強(qiáng)化學(xué)習(xí)微調(diào)(RLFT)技術(shù),旨在提升語言模型的決策能力... 蘇輕衣 2025-05-20 960 AIbase基地