Gemini Embedding 正式推出,定價每百萬 input tokens 0.15 美元,讓企業搜尋和 RAG 的成本有了新的比較基準。Embedding 不像聊天模型那麼吸睛,卻是文件搜尋、客服知識庫、內部問答和向量資料庫的底層入口。
RAG 成本通常不是單次查詢,而是資料導入、重建索引和長期維護。Google 把 Gemini Embedding 放進 Gemini API,代表開發者可以用既有 embed_content 端點導入,也讓企業在 OpenAI、Cohere、Mistral、Google 之間重新比較文件處理成本。
Gemini Embedding 把 RAG 和企業搜尋成本往下壓
Embedding 模型不會像聊天模型一樣有戲劇性展示,卻是企業搜尋、推薦、客服知識庫與 RAG 系統的底層零件。Google 把 Gemini Embedding 正式推出並標出價格後,企業可以更精確估算大量文件索引與查詢成本。

這會讓 AI 專案從展示階段進入營運階段。當文件量變大,embedding 的單價、維度、延遲與品質會直接影響每月帳單,也會影響搜尋結果是否足以支撐客服或內部知識系統。
Embedding 價格戰會先影響企業搜尋和 RAG
Gemini Embedding 正式推出的意義,不在於它是不是最吸睛的 frontier 模型,而在於這類基礎模型會直接進入企業搜尋、客服檢索、內部知識庫和 RAG 管線。價格一旦往下壓,很多原本算不過來的應用就會重新被評估。
Google 把單價壓到每百萬 input tokens 0.15 美元,同時提醒舊模型有生命周期安排,等於把兩件事一起攤開:成本正在下降,但遷移管理也會變得更重要。
Gemini Embedding 的商業價值要回到檢索品質與維運成本
Embedding 模型看起來不像聊天模型那麼有舞台效果,但它決定了文件召回品質、向量資料庫大小、重建索引成本和多語言搜尋效果。企業如果只看單價,不看維度、準確率和遷移難度,很容易在後面補更大的系統成本。

這件事也顯示,AI 基礎設施的「地板價」正在變低。這會讓更多公司願意把文件、客服和知識管理接進生成式 AI,但真正能留住客戶的,還是檢索品質而不是價格表本身。