運動計量學: 測驗架構和評價測量模式

心理計量學(Psychometric)

發展試題

選擇試題

依反應如何計算原始分數

如何估計真正的潛能

潛在能力如何解釋

如何確定估計的能力沒有偏差

運動計量學（Sportsmetric）

運用統計和測驗理論探討體育和運動科學的現象，進而估計潛能，驗證各種體育和運動的理論和模式。

運動計量學

認知測驗？

情意測驗？

體能測驗：重複測量單一項目

「二項試作模式」(Binomial trials model)

波松模式(Poisson counts model)

達到標準(trials-to-criterion)或負二項模式(inverse binomial model)

運動成績表現：羽球效標參照組和測驗

運動能力測驗：原住民學生基本體能測驗

發展趨勢

運動計量測驗與心理計量測驗共同的發展

趨勢為：

測驗電腦化

依循理論架構

CTT

IRT

測驗的基本概念

測驗與統計

測驗的類型

最大能力與典型表現

常模參照與標準參照

測驗的理論

古典測驗理論：O = T + E

概化理論：估計誤差來源

試題反應理論

測驗的品質

信度(Reliability) ：重測、複本、內部一致性

效度(Validity) ：內容、效標、建構

客觀性(Objectivity)

鑑別性(Discrimination or discriminative function)

比較性(Comparative)

實施步驟

釐清架構 1

發展量表一定要有理論依據嗎？

沒有理論可以「獨創」嗎？

架構釐清的重要性

建立題庫 2

題庫的量

初步研究階段題目的數量

基於重複或是多餘的基礎上增加量表的內部一致性

題庫的質

英文：9個單字13個音節的句子、與19個單字22個音節的句子

中文：字頻表2733或3500以內；語句、文法與修辭

該不該有反向題？

設定量尺 3

何時決定量尺？

三種反應類別

「同意方式」（反應同意程度）

「評價方式」（價值評分，反應好壞）

「頻率方式」（數字分類或是口頭分類）

量尺的刻度何者為佳？

專家檢視 4

三種協助

確認研究者對問項的假設

問項的適當性進行評估

是否有研究者忽略的研究方法

專家檢視是萬靈丹？

加入效度評估問項 5

「效度評估問項」？

兩種類型的問項

國內測驗工具的使用狀況？

初步研究 6

初步研究的必要性？

初步研究的樣本數量？

第一階段樣本數量

第二階段樣本數量

初步研究的次數？

試題分析 7

試題分析關注的焦點？

問項間的相關程度應該高或低？

Cronbach的Alpha(α)值與McDonald的Omega(ω)值

α係數的主要目的是計算測驗的信度？

α值其範圍應該定在多少？

試題統計部分的正確機率（難度）與鑑別指標（極端組法與點二系列法）

決斷量表長度 8

量表長度的取捨依據？主觀與客觀

mGT的運用

信度、效度、常模與標準 9

信度

效度：AERA、APA & NCME （1985）

效標關聯效度

區別和聚斂效度

因素效度：探索性與驗證性因素分析

常模與標準

結語

對於社會和行為科學的研究來說，測量是相當重要的，因此，研究者應小心謹慎的設計、評估與運用，使變項間的關係更為清楚，別讓粗糙的量表編製模糊了研究的焦點，或限制了推論的可能性。

運動計量學

2009年6月12日星期五

測驗架構和評價測量模式

沒有留言:

我的網誌清單

網誌存檔

關於我自己

運動計量學

2009年6月12日 星期五

測驗架構和評價測量模式

沒有留言:

我的網誌清單

網誌存檔

關於我自己

2009年6月12日星期五