差異試題功能(Differential Item Function,DIF)是指相同能力卻因為來自不同團體而在某道試題的表現有所不同。過去DIF的研究多聚焦在比較兩個團體作答二分試題或多分試題;然而,在實際測驗情境中,若欲比較超過兩個團體作答多分試題的DIF檢驗,過去相關研究很少,且研究僅操弄低約22%DIF試題、未考量DIF試題可能有利於不同團體等,將不利於做多團體多分題DIF檢驗的整體推論。因此本研究進行模擬研究,增加資料模式、DIF比率、DIF型態、樣本數情境、團體能力分佈平均差異操弄,以瞭解QGMH(1)、QGMH(2)與QGMH(3)這三種DIF分析方法對於多團體多分題之DIF檢驗效果。研究結果發現:當團體能力分佈平均相同時,DIF試題含量增加到44%時,三種DIF分析方法在題內固定的DIF型態下,都會有型一錯誤率膨脹的情形;在題內平衡的DIF型態下,三種DIF檢驗方法的型一錯誤率表現皆能維持在0.05附近;第一階增加與第三階增加的型一錯誤率整體表現有類似的傾向,其中第三階增加比第一階增加的型一錯誤率表現略高且兩者皆低於題內固定的情境。當團體能力分佈平均不同時,整體DIF檢驗的型一錯誤率皆較團體能力分佈平均相同時低,其型一錯誤率膨脹的情形大幅減少,甚至有部分情境會發生型一錯誤率過於嚴謹的現象。整體來說,1PLM的檢驗效果較3PLM好,且當DIF試題含量提高至22%時,三種DIF檢驗的型一錯誤率開始膨脹,QGMH(1)的統計檢定力高於其他兩者;QGMH(3)進行DIF檢驗效果的型一錯誤率表現最佳但其統計檢定力偏低。