Home 其他 產業 被微軟刺激到了!Google CEO:我們很快會將各種 AI 工具整合進產品中
產業AIGoogle頭條

被微軟刺激到了!Google CEO:我們很快會將各種 AI 工具整合進產品中

一支正在使用 Google 地圖的手機,背景是馬路

還記得不久前提到,微軟打算將 ChatGPT 整合進公司的「所有產品」的事嗎?這件事被許多人注意到、成功引起了話題,微軟的未來決策被外界緊密關注。而另外一家 AI 巨頭「Google」自然不會讓微軟專美於前,Google CEO 在推特上宣佈:「我們的 AI 工具,也會整合到現有以及即將到來的產品當中,敬請期待。」與微軟互別苗頭的跡象相當明顯。

Google 也決定在 AI 領域與微軟公開掰掰手腕

微軟因為在 2019 年投資了 OpenAI,而 OpenAI 開發出了 ChatGPT,瞬間搶奪全球目光。微軟決定加碼投資到 100 億美元,並將 OpenAI 的 AI 工具整合到旗下所有產品當中,讓整個雲端服務市場大地震。

談到雲端服務市場,自然繞不開雲端服務三本柱:微軟 Azure、亞馬遜 AWS,以及 Google GCP。微軟的聲勢大振,自然就直接威脅到另外兩大巨頭的地位。

Google的CEO正在解釋他們的AI發展方向。

果不其然,Google CEO Sundar Pichai 坐不住了,在 1 月 18 日公佈了 Google AI 研究白皮書

「關於 Google AI 的各項重磅進展,包括語言模型、電腦視覺、多模態模型、生成性 ML 等,我們正在將其全部納入當前和即將推出的產品與API中,敬請期待!」

這個做法,完全對標微軟,很顯然 Google 從上到下都感受到了壓力。

Google AI 火力展示當前研究進度,平面貓咪照片自動變 3D 動畫

不過,有別於市井小民都能玩的 ChatGPT,這份 Google AI 研究白皮書相當的專業、有深度,說白話一點就是複雜,估計一般人很難輕易閱讀。它更像是一種火力展示,告訴全世界「別忘了,最厲害的 AI 研究在我們這邊哦!」

對於技術有興趣的用戶,可以自行連過去觀看。如果只想知道淺顯易懂的東西,Google 也有提供一些範例,例如他們可以讓 2D 的貓咪照片,透過 AI 運算讓貓咪照片變成 3D 動畫。

Google正在演示如何將平面的貓咪照片變成3d動畫。

既然能夠讓照片變 3D 動畫,未來讓牠「跑起來」應該也是可能的,這對於一些懷念愛貓的鏟屎官來說,應該是有一定程度吸引力的。

類似這樣「從照片變成動畫」的案例,還有下面這張範例。它只需要幾張靜止的圖片,就能透過 AI 運算,自動還原出原始模樣,進而讓它變成一個動態的連續動畫。

Google正在演示如何將幾張靜態的圖片變成動態的連續動畫。

另外,Google 也有分享一些別的內容(真的很多,我只挑最傻白甜的內容分享),例如更有效率的神經網路圖像識別系統 Pix2Seq,能夠以觀察到的像素輸入作為條件,透過模型訓練來 「讀出」 圖像中物體的位置和其他屬性。

與現有的高度專業化和最佳化的檢測算法相比,Pix2Seq 在大規模的物體檢測數據集上取得了有競爭力的結果,通過預訓練模型,其性能可以進一步提高。簡單說,就是辨識性能更快了。

Google透過動畫跟大家說明它的圖像辨識人工智慧系統。

此外,Google 也有分享「多模態模型」的內容。過去的大多數機器學習任務,都集中在處理「單一模式」的數據模型上(例如,語言模型、圖像分類模型,或語音識別模型等)。Google 分享了另外一種「多模態模型」的可能性,既作為模型的輸入,也作為模型的輸出。

白話來說,Google 可以讓不同類型的內容放在一起同時訓練,不需要「文字歸文字、圖像歸圖像」這樣分開訓練,如果機器學習的數據主體是一致的、有相關性的,現在可以橫跨不同媒體同時訓練,並且結果輸出一樣可以橫跨多種媒體。

Google正在解釋它的多模態模型

雖然是火力展示,但 Google 做的這些,似乎還是不容易在一般人的圈子中成功造成話題,因爲它「不夠平民、使用門檻太高」。期待 Google 未來可以將這些進階的技術,加工後變成一般人都可以使用,進而變得實用的工具,這樣子才有機會與微軟、ChatGPT 一較高下呀。

Written by
黃郁棋

在科技業打滾十年的老屁股,每天都覺得自己要被新技術取代了,完了完了。

公開留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *