2025-02-14 偷看 ChatGPT「正在駭入《JAMA》的參考文獻」

2025-02-14

2025-02-14 偷看 ChatGPT「正在駭入《JAMA》的參考文獻」

FB post ID: 4098(2025 情人節)
對應 talk slide: B5 fetch hard limit hook(整堂 talk 最關鍵 quote

原 FB post(字面引用)

偷看 ChatGPT 做 deep research 的思路,不時會看到一些奇怪的言論:

「在老家總能找到平靜擁有的時光,現在和我來看看這段時間的點點滴滴。」

「正在駭入《JAMA》的參考文獻」

為什麼是整堂 talk 最關鍵 quote

ChatGPT 自己揭露的 fetch hard limit 痛苦 —— 它跟你說它「正在駭入」,是因為它結構上進不去訂閱牆。沒有你的 cookie、沒有你的 session、沒有 JAMA 訂閱權限。

它「駭入」這個動詞本身就是 confession:

  • 「駭入」隱含「需要繞過防線」,但 cloud LLM 不會真的去 hack 任何 publisher
  • 真實情況:cloud LLM 看到 paywall 就沒辦法繼續,它只能對使用者描述一個聽起來像 in progress 的動作
  • 30 秒後它會給你一個看起來像答案的 prose,但那 prose 是基於它訓練時讀過的、模糊記得的JAMA 內容(不一定是該篇本文)

Talk 引用方式

B5 slide「Cloud LLM 對 paywalled 結構性殘廢」開場直接放這 quote 的截圖:

「偷看 ChatGPT 做 deep research 的思路:『正在駭入《JAMA》的參考文獻』」
(Copper FB 2025-02-14 #4098)

(Punchline)→ 它說「駭入」,是因為它結構上進不去
沒有 cookie,沒有 session,沒有訂閱。
唯一能進得去的,是你電腦上、用你訂閱、用你 session 登入的瀏覽器 + local agent。

對藥學系 takeaway

看到任何 AI 醫療產品說「整合最新文獻」、「即時讀取 NEJM / UpToDate / 健保署資料庫」要問:

  1. 它從哪個入口拿?OA only,還是含 paywalled?
  2. 是它自己 cloud-side fetch,還是借你的 logged-in session?
  3. 如果它說它讀到 paywalled full text,它真的拿到了,還是在「駭入」唬你

問對第 3 個問題的學生 / 藥師 / 醫師,未來不會被假整合的 AI 醫療產品騙。