▌新品資訊
▌新聞稿
- 全新 APEX-Agents 基準測試:頂尖 AI 處理白領任務成功率竟不足 25%
Mercor 發布 APEX-Agents 基準測試,顯示 Gemini 3 Flash 與 GPT-5.2 等頂尖 AI 模型在處理法律、投行專業任務時準確率不足 25%。本文解析 AI 在跨領域推理上的短板,以及為何目前的 AI 代理仍無法真正取代知識型白領工作。
- 讀心術上線!Google AI Mode 開放存取 Gmail 與相片:這才是真正懂你的私人助理?
Google 宣布為搜尋中的 AI Mode 導入「個人化智慧」功能,允許 AI 讀取 Gmail 與相片以提供高度客製化的規劃與購物建議。本文深入分析這項基於 Gemini 3 的技術如何改變用戶互動體驗、Google 的隱私防線,以及這對 AI […]
- 物理超渡 Nvidia?Neurophos OPU 融資 1.1 億美元:用「超材料」光學晶片挑戰算力極限
光學晶片初創公司 Neurophos 獲得比爾蓋茲與微軟 1.1 億美元注資,研發基於超材料的光學處理單元 (OPU)。本文深度分析該技術如何解決 AI 推理的功耗難題,以及其宣稱比 Nvidia B200 快 50 倍的數據背後的科學原理。
- 懶人救星!Spotify AI 點歌功能「Prompted Playlists」北美上線:只要會說話,人人都是明星 DJ
Spotify 於北美推出全新的「Prompted Playlists」AI 功能,支援 Premium 用戶透過自然語言描述生成個人化歌單。本文深度解析該功能如何利用即時音樂趨勢與聽歌史,打破傳統分類框架,並探討「指令創作者」這一新興角色的可能性
- 頂級諷刺!NeurIPS 驚現「虛假引用」:當 AI 專家也被自己的 AI 模型忽悠
頂級 AI 會議 NeurIPS 驚爆論文造假爭議,GPTZero 偵測發現 51 篇論文含有 AI 編造的幻覺引用。本文解析為何頂尖專家也難逃 AI 陷阱、學術審稿制度的崩潰現狀,以及虛假引用如何威脅學術界的信用價值。







































