This Post is under 軟體開發
續前文使用 PHP 呼叫 Google Gemini API 生成圖像,本文將繼續展示用Google Gemini API 「編輯」圖像,也就是給一張圖片,要Gemini來修改圖像或轉換圖像的風格,也就是最近很紅的讓AI以吉卜力風格生成圖像在做的事情。不過經過嘗試之後,目前Gemini API 使用 Gemini 2.0 Flash Experimental 在轉換圖片風格不盡理想,圖片內容會被大幅修改,品質也沒有很精緻;而不像ChatGPT風格轉換後圖片內容與品質都還維持一定水準。至於 Imagen 3 必須付費才能使用,不知效果如何。
本次主要參考文件:使用 Gemini 編輯圖片。關鍵點在將要修改的圖像傳入給Gemini的參數。做法是先將圖片檔內容讀進來,以base64編碼,放到輸入參數的 inlineData。所以只要稍微修改前文使用 PHP 呼叫 Google Gemini API 生成圖像的程式碼(粗體即為此次新增程式碼),將要轉換的圖檔網址傳入(即imgUrl參數),如下:
繼續閱讀 »




