OpenAI 推出新一代旗艦大語言模型 ChatGPT-5!寫作、編碼、醫療、推理全面升級 | 鏈新聞 ABMedia

by 健康編輯
0 comment







美國 AI 巨頭 OpenAI 今日正式推出新一代旗艦人工智慧模型 GPT-5,並宣稱該系統在智慧層級上遠超以往所有版本。GPT-5 擁有頂尖的數學、程式編碼、文學創作、視覺理解與健康諮詢能力,將逐步取代 GPT-4o 成為 ChatGPT 的預設模型,並已開放給所有用戶使用。

更聰明的統一系統:視情境動態選擇推理模式

GPT-5 整合了能夠解答大多數問題的智能高效模型,以及能夠解決更複雜問題的更深層次的推理模型。系統會根據對話內容的難度與用戶需求,自動在快速回應模式與「深度推理」(GPT-5 thinking) 模式間切換,確保在速度與深度間取得最佳平衡。若使用者在提示中寫下「think hard about this」等指令,也可直接啟用推理功能。

即便在達到使用上限後,用戶仍可使用 GPT-5 mini 服務,未來 OpenAI 也計劃整合所有模型為單一結構。

GPT-5 在寫作、程式與健康領域全方位升級

GPT-5 不僅在基準測試中超越了先前的模型,回答問題的速度也更快,重點是 GPT-5 顯著減少了 AI 幻覺、提高指令執行能力和減少諂媚,同時提升了 GPT-5 在 ChatGPT 最常見的三個用途:寫作、程式設計和健康中的表現。

編碼能力史上最強,支援創建完整網頁與遊戲

GPT-5 是迄今最強的程式模型,特別擅長前端設計與大型代碼倉庫除錯,甚至能僅憑一段提示就快速生成動畫遊戲或互動式網頁,對排版、美感與空白留白的理解也大幅進步。

寫作表現更具文學性,從電子郵件到詩歌都游刃有餘

GPT-5 可協助使用者將粗略構想轉化為具節奏與深度的成品,能自然產出自由詩與無押韻詩體,支援報告、備忘錄與演講稿撰寫,能夠更可靠地處理結構模糊的寫作,

健康領域躍進,能提出精確問題並避免錯誤建議

GPT-5 在醫療問答評測 HealthBench 上取得新高分,更能根據使用者背景、知識水平與地理位置調整建議,成為「用戶與醫生間的溝通橋梁」,而非替代專業醫師。

減少幻覺、提升理解:GPT5 在多項測驗上創下高分

在多項嚴謹的標準評測中,GPT-5 全面領先過去模型,包括:

  • 數學競賽 AIME:94.6% 正確率。
  • 真實世界編碼 SWE-Bench:74.9% 準確率,遠超 GPT-4o。
  • GPQA 博士級科學問答:88.4%。
  • MMMU (大規模多學科多模態理解與推理):84.2% 準確率。
  • HealthBench Hard 高難度醫療問答:46.2%,遠勝 GPT-4o 的 31.6%

同時,GPT-5 在「誠實性」上也有重大突破。以往模型面對無解問題時常虛構答案,GPT-5 則更誠實地承認限制,AI 幻覺率從 GPT-4o 的 4.8% 降至 2.1%。

如何因應 AI 用於作惡?GPT5 增強安全補全系統

OpenAI 同步更新 GPT-5 的安全訓練機制,用戶常會對 AI 詢問一些「可能有害」的資訊 (例如說要如何策劃攻擊)。當面對這種雙重用途資訊 (如病毒學或化學知識)時,模型會選擇「提供部分安全資訊並拒絕解釋細節」的中庸方案,減少過度拒答,同時降低濫用風險。

此外,GPT-5 相較 GPT-4o 不再「過度附和」用戶,更能進行有思辨性的對話。OpenAI 表示與 GPT-4o 相比,GPT-5 不那麼親切, 不必要的表情符號也更少 。與其說是與 AI 對話,更像是與一位擁有博士級智力水平的樂於助人的朋友聊天 。新版本也引入 4 種預設個性風格 (悲觀者、機器人、聆聽者、書呆子),讓用戶可自訂 AI 的語氣與互動方式。

GPT-5 Pro 為深度推理而生,千位專家給出評價

同步推出的 GPT-5 Pro 是升級版本,專為最複雜、最需要深度推理的任務設計。它在健康、數學與工程等領域表現尤為出色,並在千份實務評測中獲得 67.8% 專家偏好評分,錯誤率更少 22%。

GPT-5 已全面上線,三個等級供用戶玩轉 AI

GPT-5 現已全面上線:

  • 免費用戶:預設使用 GPT-5,使用量有限,達上限後轉為 GPT-5 mini。
  • Plus 用戶:每日使用量提升,可作為預設 AI 助手。
  • Pro 用戶:可使用 GPT-5 Pro,執行最複雜的任務。
  • Team/Enterprise/Edu 用戶:享有高上限與開發者支援,預計於一週內上限。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。




Source link

Related Posts

Leave a Comment