心理計量學(Psychometric)
發展試題
選擇試題
依反應如何計算原始分數
如何估計真正的潛能
潛在能力如何解釋
如何確定估計的能力沒有偏差
運動計量學(Sportsmetric)
運用統計和測驗理論探討體育和運動科學的現象,進而估計潛能,驗證各種體育和運動的理論和模式。
運動計量學
認知測驗?
情意測驗?
體能測驗:重複測量單一項目
「二項試作模式」(Binomial trials model)
波松模式(Poisson counts model)
達到標準(trials-to-criterion)或負二項模式(inverse binomial model)
運動成績表現:羽球效標參照組和測驗
運動能力測驗:原住民學生基本體能測驗
發展趨勢
運動計量測驗與心理計量測驗共同的發展
趨勢為:
測驗電腦化
依循理論架構
CTT
GT
IRT
測驗的基本概念
測驗與統計
測驗的類型
最大能力與典型表現
常模參照與標準參照
測驗的理論
古典測驗理論 :O = T + E
概化理論 :估計誤差來源
試題反應理論
測驗的品質
信度(Reliability) :重測、複本、內部一致性
效度(Validity) :內容、效標、建構
客觀性(Objectivity)
鑑別性(Discrimination or discriminative function)
比較性(Comparative)
實施步驟
釐清架構 1
發展量表一定要有理論依據嗎?
沒有理論可以「獨創」嗎?
架構釐清的重要性
建立題庫 2
題庫的量
初步研究階段題目的數量
基於重複或是多餘的基礎上增加量表的內部一致性
題庫的質
英文:9個單字13個音節的句子、與19個單字22個音節的句子
中文:字頻表2733或3500以內;語句、文法與修辭
該不該有反向題?
設定量尺 3
何時決定量尺?
三種反應類別
「同意方式」(反應同意程度)
「評價方式」(價值評分,反應好壞)
「頻率方式」(數字分類或是口頭分類)
量尺的刻度何者為佳?
專家檢視 4
三種協助
確認研究者對問項的假設
問項的適當性進行評估
是否有研究者忽略的研究方法
專家檢視是萬靈丹?
加入效度評估問項 5
「效度評估問項」 ?
兩種類型的問項
國內測驗工具的使用狀況?
初步研究 6
初步研究的必要性?
初步研究的樣本數量?
第一階段樣本數量
第二階段樣本數量
初步研究的次數?
試題分析 7
試題分析關注的焦點?
問項間的相關程度應該高或低?
Cronbach的Alpha(α)值 與McDonald的Omega(ω)值
α係數的主要目的是計算測驗的信度?
α值其範圍應該定在多少?
試題統計部分的正確機率(難度)與鑑別指標(極端組法與點二系列法)
決斷量表長度 8
量表長度的取捨依據?主觀與客觀
mGT的運用
信度、效度、常模與標準 9
信度
效度:AERA、APA & NCME (1985)
效標關聯效度
區別和聚斂效度
因素效度:探索性與驗證性因素分析
常模與標準
結語
對於社會和行為科學的研究來說,測量是相當重要的,因此,研究者應小心謹慎的設計、評估與運用,使變項間的關係更為清楚,別讓粗糙的量表編製模糊了研究的焦點,或限制了推論的可能性。
沒有留言:
張貼留言