1. 比較Gemini, GPT, Claude 跟之前的檔案#
格式檢查結果總結#
格式一致性檢查#
欄位順序與結構
- 欄位順序一致:
id,year,subject,question_type,question_text,options,answer,explanation,source,tags,answer_mode - 欄位類型一致:所有欄位的資料類型與參考年份相同
JSON 格式
- 縮排:114 年使用 4 個空格,與 107、111 年一致(108、109、110 年使用 2 個空格,但不影響功能)
- 尾隨逗號:格式一致
資料內容
- 題目數量:80 題(與參考年份相同)
answer_mode分布:single79 題,any1 題(與參考年份相同)answer格式:所有題目的answer都是陣列格式,且與answer_mode一致- 必填欄位:所有必填欄位都存在
結論#
114 年的 law_114_dataset_gemini.json 已按照與 107–112 年相同的格式處理。資料結構、欄位順序、資料類型、內容完整性均符合標準格式。
唯一的小差異是縮排空格數(108、109、110 年為 2 個空格,107、111、114 年為 4 個空格),這不影響功能,僅為格式風格差異。
2. 比較Gemini GPT Claude#
三個版本比較結果總結#
基本資訊#
- 題目數量:三個版本都是 80 題
- 題目 ID:完全相同,無遺漏或重複
- 欄位結構:欄位順序與類型一致
主要差異#
1. 答案差異(16 題)#
有 16 題答案不一致,claude 與 gemini/gpt 不同:
- Q12, Q13, Q14, Q15, Q16, Q18, Q19, Q33, Q34, Q36, Q37, Q38, Q39, Q76, Q77, Q78
- 模式:claude 的答案與 gemini/gpt 不同,gemini 與 gpt 一致
2. Tags 欄位差異(80 題)#
- Claude:所有 80 題都有 tags(如
["建築法"],["建築基地法定空地分割辦法"]) - Gemini:所有 80 題的 tags 都是空陣列
[] - GPT:所有 80 題的 tags 都是空陣列
[]
3. Explanation 欄位差異(1 題)#
- Q27 的 explanation 文字略有不同:
- Claude:
"第27題答B或D或BD者均給分" - Gemini:
"依據標準答案備註:第27題答B或D或BD者均給分。" - GPT:
"第27題答B或D或BD者均給分。"
- Claude:
4. 題目文字差異(8 題)#
8 題的 question_text 有細微差異,主要是:
- 括號樣式:
(市)vs(市) - 空格:某些位置的空格差異
- 換行:部分版本有換行
5. 選項內容差異(39 題)#
39 題的 options 有差異,主要是:
- 括號樣式:全形
()vs 半形() - 數字間空格:
3 萬元vs3萬元 - 換行:部分版本有換行
6. JSON 格式差異#
- Claude:4 空格縮排
- Gemini:4 空格縮排
- GPT:2 空格縮排
建議#
- 答案不一致:需確認正確答案,特別是這 16 題。
- Tags:claude 版本有標籤,gemini/gpt 沒有;若需要標籤,可統一採用 claude 版本。
- 格式統一:建議統一 JSON 縮排(建議 4 空格,與參考年份一致)。
- 文字格式:括號與空格差異不影響功能,但建議統一以保持一致性。
需要我進一步分析特定題目或協助統一格式嗎?
3. 比較Cowork, Gemini#
claude_cowork 與 gemini 版本比較結果#
基本資訊#
- 題目數量:兩個版本都是 80 題
- 題目 ID:完全相同,無遺漏或重複
- 欄位結構:欄位順序與類型一致
- JSON 格式:縮排一致(都是 4 空格)
主要差異#
1. 答案差異(1 題)#
- Q27:
claude_cowork:answer=['B'],answer_mode='single'gemini:answer=['B', 'D'],answer_mode='any'- 說明:兩版本的 explanation 都提到「答B或D或BD者均給分」,但
claude_cowork設為single且只標['B'],gemini設為any且標['B', 'D']。建議採用gemini的設定。
2. Explanation 欄位差異(1 題)#
- Q27:
claude_cowork:"第27題答B或D或BD者均給分"gemini:"依據標準答案備註:第27題答B或D或BD者均給分。"- 差異:
gemini版本有前綴「依據標準答案備註:」與句號。
3. Tags 欄位#
- 兩個版本一致:所有題目的 tags 都是空陣列
[]
4. 題目文字差異(76 題)#
- 76 題的
question_text有差異,主要是標點符號:claude_cowork使用半形逗號,gemini使用全形逗號,- 範例:
claude_cowork:"依建築法規定,下列敘述何者錯誤?"gemini:"依建築法規定,下列敘述何者錯誤?"
5. 選項內容差異(37 題)#
- 37 題的
options有差異,同樣是標點符號:claude_cowork使用半形逗號,gemini使用全形逗號,- 範例:
claude_cowork:"建築基地,為供建築物本身所占之地面..."gemini:"建築基地,為供建築物本身所占之地面..."
總結#
- 格式一致性:兩個版本格式一致,僅標點符號不同。
- 內容正確性:Q27 的答案與
answer_mode不一致,建議採用gemini的設定(answer_mode='any',answer=['B', 'D'])。 - 標點符號:
claude_cowork使用半形逗號,gemini使用全形逗號。建議統一為全形逗號,與中文排版習慣一致。
建議#
- 修正 Q27:將
claude_cowork的 Q27 改為answer_mode='any',answer=['B', 'D']。 - 統一標點:建議將
claude_cowork的標點統一為全形逗號,與gemini一致。
