AI模型產業

Gemini Embedding 正式推出,企業搜尋與 RAG 成本開始有新底價

Gemini Embedding 正式推出,企業搜尋與 RAG 成本開始有新底價 AI, 產業, 能源

Gemini Embedding 正式推出,定價每百萬 input tokens 0.15 美元,讓企業搜尋和 RAG 的成本有了新的比較基準。Embedding 不像聊天模型那麼吸睛,卻是文件搜尋、客服知識庫、內部問答和向量資料庫的底層入口。

RAG 成本通常不是單次查詢,而是資料導入、重建索引和長期維護。Google 把 Gemini Embedding 放進 Gemini API,代表開發者可以用既有 embed_content 端點導入,也讓企業在 OpenAI、Cohere、Mistral、Google 之間重新比較文件處理成本。

Gemini Embedding 把 RAG 和企業搜尋成本往下壓

Embedding 模型不會像聊天模型一樣有戲劇性展示,卻是企業搜尋、推薦、客服知識庫與 RAG 系統的底層零件。Google 把 Gemini Embedding 正式推出並標出價格後,企業可以更精確估算大量文件索引與查詢成本。

Gemini Embedding 正式推出,企業搜尋與 RAG 成本開始有新底價 AI, 產業, 能源

這會讓 AI 專案從展示階段進入營運階段。當文件量變大,embedding 的單價、維度、延遲與品質會直接影響每月帳單,也會影響搜尋結果是否足以支撐客服或內部知識系統。

Embedding 價格戰會先影響企業搜尋和 RAG

Gemini Embedding 正式推出的意義,不在於它是不是最吸睛的 frontier 模型,而在於這類基礎模型會直接進入企業搜尋、客服檢索、內部知識庫和 RAG 管線。價格一旦往下壓,很多原本算不過來的應用就會重新被評估。

Google 把單價壓到每百萬 input tokens 0.15 美元,同時提醒舊模型有生命周期安排,等於把兩件事一起攤開:成本正在下降,但遷移管理也會變得更重要。

Gemini Embedding 的商業價值要回到檢索品質與維運成本

Embedding 模型看起來不像聊天模型那麼有舞台效果,但它決定了文件召回品質、向量資料庫大小、重建索引成本和多語言搜尋效果。企業如果只看單價,不看維度、準確率和遷移難度,很容易在後面補更大的系統成本。

Gemini Embedding 正式推出,企業搜尋與 RAG 成本開始有新底價 AI, 產業, 能源

這件事也顯示,AI 基礎設施的「地板價」正在變低。這會讓更多公司願意把文件、客服和知識管理接進生成式 AI,但真正能留住客戶的,還是檢索品質而不是價格表本身。

延伸閱讀
如何讓 AI 變得實用?以 AI 塔羅牌 Tarotap 的「自訂牌陣」為例|AI 應用案例
文章・頭條
Gemini 浮水印移除工具:免費、開源、本地端處理
文章・軟體
NVIDIA 罕見官網發文抨擊拜登政府:披著「反華」外衣,試圖傷害美國與全世界
文章・產業
Written by
黃郁棋

《科技人》站長,在科技業打滾十年的老屁股,每天都覺得自己要被新技術取代了,完了完了。

乾爹一定會賺大錢

打賞科技人|祝您有個美好的一天