OpenAI DevDay 2024: 一場屬於開發者的技術革新
OpenAI DevDay 2024: 一場屬於開發者的技術革新
就在今天,OpenAI 展示了四個重要創新:視覺微調(Vision Fine-Tuning)、實時 API(Realtime API)、模型蒸餾(Model Distillation)、和提示快取(Prompt Caching)。這些技術揭示出 OpenAI 正以開發者為中心,將更多的創新和控制權交到開發者手中。
1. 實時 API:打通對話式 AI 的壁壘
實時 API 讓開發者能夠創建更流暢的多模態應用,特別是在語音互動中。從語音輸入到語音輸出,整個過程實現了低延遲,並允許用戶在自然對話中打斷系統回應,模擬人類對話的真實場景。有試用過chatgpt新一代語音對話過的人就會知道,能在自己打造的產品中用上這技術是多令人感到興奮。
2. 提示快取:開發者的經費福音
提示快取功能無疑是本次會議中的亮點之一。它能減少開發者的成本和延遲,尤其適合那些經常重複使用上下文的應用。這項技術能自動為已處理過的輸入代幣提供 50% 的折扣,這對於反覆運用資料的系統來說,節省潛力巨大。
透過這項功能,OpenAI 實現了兩年內將 GPT-3 相關成本降低 1000 倍的突破,這讓許多原本受限於成本的小型公司,也能夠利用這些技術開發更多應用。
3. 視覺微調:AI 視覺的全新篇章
對於視覺 AI,OpenAI 推出了針對 GPT-4o 的視覺微調技術,開發者可以利用圖像和文本來自定義模型的視覺理解能力。這不僅是技術上的進步,還可能帶動無人駕駛、醫療影像處理及視覺搜尋等領域的深遠影響。
4. 模型蒸餾:讓 AI 更加普及
最後,模型蒸餾技術或許是最具顛覆性的創新。開發者可以使用高階模型如 GPT-4o 的輸出,來訓練更小、更高效的模型,這將幫助那些資源有限的公司大幅降低計算成本。
這一次的轉變,可能會讓 AI 應用真正遍地開花,進一步推動各行各業的發展。
💬 延伸閱讀: 2025 年度回顧與未來展望
AI 的歷史轉折:從被質疑到諾貝爾獎
過去「AI」在學術圈帶有負面標籤,Geoffrey Hinton 也曾因做神經網路被強烈質疑。如今他獲得圖靈獎與諾貝爾獎,AI 正在改變世界。 過去曾有段時間,「AI」這個詞在學術圈(特別是幾次 AI 寒冬之後)帶有負面標籤,資訊工程領域的一些專家學者如果聽到有人講 AI,可能會覺得這個人太會吹...
Perplexity 的困境:AI 搜尋的邊界在哪裡?
Perplexity面對的是一個「位置」的考驗,一邊要扛起「AI 搜尋新一代」的期待,一邊又被各種內容方用法律與商業談判來拉扯。 [關於Perplexity的困境] 在Perplexity剛出世的時候我就覺得我們團隊也做得出一樣的產品,甚至能一樣好 事實上,只要是一般夠有 sense 的開發團隊...
AI 的歷史轉折:從被質疑到諾貝爾獎
過去「AI」在學術圈帶有負面標籤,Geoffrey Hinton 也曾因做神經網路被強烈質疑。如今他獲得圖靈獎與諾貝爾獎,AI 正在改變世界。 過去曾有段時間,「AI」這個詞在學術圈(特別是幾次 AI 寒冬之後)帶有負面標籤,資訊工程領域的一些專家學者如果聽到有人講 AI,可能會覺得這個人太會吹...
Perplexity 的困境:AI 搜尋的邊界在哪裡?
Perplexity面對的是一個「位置」的考驗,一邊要扛起「AI 搜尋新一代」的期待,一邊又被各種內容方用法律與商業談判來拉扯。 [關於Perplexity的困境] 在Perplexity剛出世的時候我就覺得我們團隊也做得出一樣的產品,甚至能一樣好 事實上,只要是一般夠有 sense 的開發團隊...