Skip to main content

Cursor Composer 1 檢查任務生成檔案

·2 mins·
Table of Contents

1. 比較Gemini, GPT, Claude 跟之前的檔案
#

格式檢查結果總結
#

格式一致性檢查
#

欄位順序與結構

  • 欄位順序一致:id, year, subject, question_type, question_text, options, answer, explanation, source, tags, answer_mode
  • 欄位類型一致:所有欄位的資料類型與參考年份相同

JSON 格式

  • 縮排:114 年使用 4 個空格,與 107、111 年一致(108、109、110 年使用 2 個空格,但不影響功能)
  • 尾隨逗號:格式一致

資料內容

  • 題目數量:80 題(與參考年份相同)
  • answer_mode 分布:single 79 題,any 1 題(與參考年份相同)
  • answer 格式:所有題目的 answer 都是陣列格式,且與 answer_mode 一致
  • 必填欄位:所有必填欄位都存在

結論
#

114 年的 law_114_dataset_gemini.json 已按照與 107–112 年相同的格式處理。資料結構、欄位順序、資料類型、內容完整性均符合標準格式。

唯一的小差異是縮排空格數(108、109、110 年為 2 個空格,107、111、114 年為 4 個空格),這不影響功能,僅為格式風格差異。

2. 比較Gemini GPT Claude
#

三個版本比較結果總結
#

基本資訊
#

  • 題目數量:三個版本都是 80 題
  • 題目 ID:完全相同,無遺漏或重複
  • 欄位結構:欄位順序與類型一致

主要差異
#

1. 答案差異(16 題)
#

有 16 題答案不一致,claude 與 gemini/gpt 不同:

  • Q12, Q13, Q14, Q15, Q16, Q18, Q19, Q33, Q34, Q36, Q37, Q38, Q39, Q76, Q77, Q78
  • 模式:claude 的答案與 gemini/gpt 不同,gemini 與 gpt 一致

2. Tags 欄位差異(80 題)
#

  • Claude:所有 80 題都有 tags(如 ["建築法"], ["建築基地法定空地分割辦法"]
  • Gemini:所有 80 題的 tags 都是空陣列 []
  • GPT:所有 80 題的 tags 都是空陣列 []

3. Explanation 欄位差異(1 題)
#

  • Q27 的 explanation 文字略有不同:
    • Claude: "第27題答B或D或BD者均給分"
    • Gemini: "依據標準答案備註:第27題答B或D或BD者均給分。"
    • GPT: "第27題答B或D或BD者均給分。"

4. 題目文字差異(8 題)
#

8 題的 question_text 有細微差異,主要是:

  • 括號樣式:(市) vs (市)
  • 空格:某些位置的空格差異
  • 換行:部分版本有換行

5. 選項內容差異(39 題)
#

39 題的 options 有差異,主要是:

  • 括號樣式:全形 () vs 半形 ()
  • 數字間空格:3 萬元 vs 3萬元
  • 換行:部分版本有換行

6. JSON 格式差異
#

  • Claude:4 空格縮排
  • Gemini:4 空格縮排
  • GPT:2 空格縮排

建議
#

  1. 答案不一致:需確認正確答案,特別是這 16 題。
  2. Tags:claude 版本有標籤,gemini/gpt 沒有;若需要標籤,可統一採用 claude 版本。
  3. 格式統一:建議統一 JSON 縮排(建議 4 空格,與參考年份一致)。
  4. 文字格式:括號與空格差異不影響功能,但建議統一以保持一致性。

需要我進一步分析特定題目或協助統一格式嗎?

3. 比較Cowork, Gemini
#

claude_coworkgemini 版本比較結果
#

基本資訊
#

  • 題目數量:兩個版本都是 80 題
  • 題目 ID:完全相同,無遺漏或重複
  • 欄位結構:欄位順序與類型一致
  • JSON 格式:縮排一致(都是 4 空格)

主要差異
#

1. 答案差異(1 題)
#

  • Q27:
    • claude_cowork: answer=['B'], answer_mode='single'
    • gemini: answer=['B', 'D'], answer_mode='any'
    • 說明:兩版本的 explanation 都提到「答B或D或BD者均給分」,但 claude_cowork 設為 single 且只標 ['B']gemini 設為 any 且標 ['B', 'D']。建議採用 gemini 的設定。

2. Explanation 欄位差異(1 題)
#

  • Q27:
    • claude_cowork: "第27題答B或D或BD者均給分"
    • gemini: "依據標準答案備註:第27題答B或D或BD者均給分。"
    • 差異:gemini 版本有前綴「依據標準答案備註:」與句號。

3. Tags 欄位
#

  • 兩個版本一致:所有題目的 tags 都是空陣列 []

4. 題目文字差異(76 題)
#

  • 76 題的 question_text 有差異,主要是標點符號:
    • claude_cowork 使用半形逗號 ,
    • gemini 使用全形逗號
    • 範例:
      • claude_cowork: "依建築法規定,下列敘述何者錯誤?"
      • gemini: "依建築法規定,下列敘述何者錯誤?"

5. 選項內容差異(37 題)
#

  • 37 題的 options 有差異,同樣是標點符號:
    • claude_cowork 使用半形逗號 ,
    • gemini 使用全形逗號
    • 範例:
      • claude_cowork: "建築基地,為供建築物本身所占之地面..."
      • gemini: "建築基地,為供建築物本身所占之地面..."

總結
#

  • 格式一致性:兩個版本格式一致,僅標點符號不同。
  • 內容正確性:Q27 的答案與 answer_mode 不一致,建議採用 gemini 的設定(answer_mode='any', answer=['B', 'D'])。
  • 標點符號:claude_cowork 使用半形逗號,gemini 使用全形逗號。建議統一為全形逗號,與中文排版習慣一致。

建議
#

  1. 修正 Q27:將 claude_cowork 的 Q27 改為 answer_mode='any', answer=['B', 'D']
  2. 統一標點:建議將 claude_cowork 的標點統一為全形逗號,與 gemini 一致。
David Chang
Author
David Chang