近日,谷歌在人工智能領(lǐng)域再掀波瀾,宣布推出基于Gemma模型的三款全新變體:MedGemma、SignGemma和DolphinGemma。這些模型分別針對(duì)醫(yī)療、手語(yǔ)翻譯和海豚語(yǔ)言研究領(lǐng)域,展現(xiàn)了AI技術(shù)在跨領(lǐng)域應(yīng)用的巨大潛力。以下,AIbase為您詳細(xì)解讀這三款模型的亮點(diǎn)與應(yīng)用前景。
MedGemma:革新醫(yī)療AI,助力精準(zhǔn)診療
MedGemma是谷歌專為醫(yī)療領(lǐng)域打造的AI模型,提供兩個(gè)版本以滿足不同需求。4B多模態(tài)模型能夠處理圖像與文本的組合任務(wù),經(jīng)過(guò)針對(duì)胸部X光片、皮膚科圖像、眼科圖像和病理切片等醫(yī)療數(shù)據(jù)的預(yù)訓(xùn)練,展現(xiàn)了在醫(yī)療影像診斷、報(bào)告生成和患者分診等任務(wù)中的強(qiáng)大能力。27B文字推理模型則專注于純文本處理,憑借更強(qiáng)的推理能力,適用于病歷分析、醫(yī)療問(wèn)答等需要深入理解的場(chǎng)景。這兩款模型均可在單塊GPU上高效運(yùn)行,為醫(yī)療開(kāi)發(fā)者提供了靈活的開(kāi)發(fā)選擇。
谷歌表示,MedGemma通過(guò)其Health AI Developer Foundations計(jì)劃發(fā)布,旨在加速醫(yī)療應(yīng)用的開(kāi)發(fā)。未來(lái),開(kāi)發(fā)者可利用這些模型構(gòu)建更智能的醫(yī)療工具,為精準(zhǔn)醫(yī)療注入新動(dòng)能。
SignGemma:打破溝通壁壘,手語(yǔ)翻譯更進(jìn)一步
SignGemma是一款專為手語(yǔ)翻譯設(shè)計(jì)的開(kāi)放模型,重點(diǎn)支持美國(guó)手語(yǔ)(ASL)到英語(yǔ)的翻譯。這款模型能夠?qū)⑹终Z(yǔ)動(dòng)作轉(zhuǎn)化為口語(yǔ)文本,為聾病患者和開(kāi)發(fā)者提供了全新的交互方式。據(jù)悉,SignGemma在手語(yǔ)理解方面表現(xiàn)卓越,被譽(yù)為“迄今為止最強(qiáng)大的手語(yǔ)理解模型”。
谷歌計(jì)劃在未來(lái)進(jìn)一步擴(kuò)展SignGemma的多語(yǔ)言支持,助力全球聾病社區(qū)實(shí)現(xiàn)無(wú)障礙溝通。開(kāi)發(fā)者可基于此模型開(kāi)發(fā)創(chuàng)新應(yīng)用,例如實(shí)時(shí)手語(yǔ)翻譯工具或教育平臺(tái),為聾病群體帶來(lái)更多便利。
DolphinGemma:解碼海豚語(yǔ)言,探索跨物種溝通
DolphinGemma是谷歌與Wild Dolphin Project(WDP)和喬治亞理工學(xué)院合作開(kāi)發(fā)的創(chuàng)新模型,旨在分析和生成海豚的復(fù)雜聲音。這款模型基于40年積累的北大西洋斑點(diǎn)海豚聲學(xué)數(shù)據(jù),能夠識(shí)別簽名哨聲、脈沖爆裂聲等特定聲音模式,并預(yù)測(cè)聲音序列,類似于人類語(yǔ)言模型的預(yù)測(cè)機(jī)制。
DolphinGemma已集成到WDP的CHAT(Cetacean Hearing Augmentation Telemetry)系統(tǒng)中,通過(guò)智能手機(jī)界面實(shí)現(xiàn)實(shí)時(shí)海豚聲音分析。研究人員甚至嘗試通過(guò)合成哨聲與海豚進(jìn)行簡(jiǎn)單交互,例如請(qǐng)求海豚與特定物體互動(dòng)。谷歌計(jì)劃于2025年夏季將DolphinGemma開(kāi)源,允許更多研究者將其應(yīng)用于其他鯨類物種,加速跨物種溝通的研究進(jìn)程。
開(kāi)源與未來(lái):AI賦能跨領(lǐng)域創(chuàng)新
谷歌強(qiáng)調(diào),這三款模型均基于Gemma架構(gòu),兼顧高效性和適應(yīng)性。MedGemma現(xiàn)已通過(guò)Health AI Developer Foundations計(jì)劃開(kāi)放使用,SignGemma和DolphinGemma也將在未來(lái)陸續(xù)開(kāi)源。 然而,Gemma系列的非標(biāo)準(zhǔn)許可條款也引發(fā)了一些開(kāi)發(fā)者對(duì)商業(yè)應(yīng)用的擔(dān)憂,未來(lái)谷歌可能需要進(jìn)一步優(yōu)化許可政策以提升模型的商業(yè)化潛力。
技術(shù)與社會(huì)價(jià)值的雙贏
從醫(yī)療診斷到手語(yǔ)翻譯,再到海豚語(yǔ)言研究,谷歌的三大Gemma模型變體展現(xiàn)了AI技術(shù)在解決實(shí)際問(wèn)題和探索未知領(lǐng)域的無(wú)限可能。MedGemma為醫(yī)療行業(yè)帶來(lái)了高效工具,SignGemma推動(dòng)了無(wú)障礙溝通,而DolphinGemma則為人類與自然界的對(duì)話打開(kāi)了新窗口。AIbase認(rèn)為,這些創(chuàng)新不僅體現(xiàn)了技術(shù)的前瞻性,也彰顯了AI在社會(huì)價(jià)值與科學(xué)研究中的重要作用。
標(biāo)簽:谷歌 Gemma 模型變體 AI醫(yī)療 手語(yǔ)翻譯 海豚語(yǔ)言