2008年10月31日 星期五
以Rasch評分量尺模式分析外籍運動教練訓練行為量表
目的:利用Rasch評分量尺模式來發展外籍運動教練訓練行為量表。研究對象:國立體院60名選手評量教練。方法:使用Winsteps和Facets軟體分析資料,探討模式的適合度、試題難度和受評外籍運動教練的表現。結果顯示:以Rasch評分量尺模式來編製外籍教練訓練行為量表,才能接近有效測量的理想。結論為利用單向度Rasch評分量尺模式來編製外籍教練訓練行為量表最合適,但是量表架構上有進一步研究的必要。
Rasch測量分析體育態度量表
目的:分析國中學生體育態度量表。研究對象:台灣地區國中生508位(男生255名,女生253名)。方法:根據受試者對試題的反應以Rasch測量模式進行量表的試題分析。結果:量表的試題反應大致吻合模式,所獲得的量尺具有客觀而等距的特性,對於少數試題吻合度較差的試題將作為日後簡式量表試題刪減的參考。結論:利用Rasch測量能夠有效地篩選試題並發展測驗的客觀量尺。
編製高爾夫技術測驗
本研究目的是將高爾夫分為十大項技術,分別編製成十項高爾夫技術測驗。研究方法是以52位國內年輕優秀的高爾夫選手做為受試者,實施高爾夫十項技術測驗;另一方面,收集選手的中華民國96年宏碁業餘高爾夫男子組全國冬季排名賽資料共59位,為期四天的比賽(中華民國96年3月13日至3月16日),紀錄每洞的成績,作為選手技術測驗證明效標關聯的資料。利用Facets程式進行Rasch模式分析資料,獲得測驗項目Rasch的個別信度為0.96、運動員估計得到 Rasch的個別信度為0.91,十項技術測驗項目的適合度都合乎標準,證明本研究具有內容效度(試題校準有效) 和建構效度(測量有效)。以高爾夫比賽估計的潛在能力值為效標,計算運動員施測十項技術測驗Rasch測量值和比賽潛能的相關,結果得到相關0.65,達到顯著水準,計算r 平方為 0.425,即十項技術測驗可以解釋高爾夫潛在能力的42.5%,證明本研究的十項技術測驗具有良好的外在效度;並建立十項技術測驗的常模,可以提供測驗原始分數的解釋。最後結論為:本研究的十項技術測驗利用Rasch測量的探討具有優異的信度和效度,且完成技術測驗的常模。
2008年10月30日 星期四
利用Rasch測量分析2007年世界跆拳道錦標賽與世界大學運動會跆拳道女子重量級比賽
目的:探討2007年世界跆拳道錦標賽與世界大學運動會跆拳道女子重量級比賽技術。方法:利用測驗連結方式,將兩個國際性重要比賽的選手潛能校準在同一個量尺上,依據Rasch多層面模式,研究採選手、評分者與戰術型態等三個層面進行估計與分析。運用Rasch分析程式Facets加以量化估計。研究預期探討比賽選手之間的能力之及評分者的一致性與嚴謹度,以及主動攻擊與被動攻擊及犯規於得分及失分上的評估,以作為日後教練及運動員在訓練及技術應用上之重要依據。
2008年10月29日 星期三
利用Rasch測量分析空手道比賽技術
2008年10月28日 星期二
舞獅運動裁判判決分析
2008年10月27日 星期一
反曲弓射箭競賽項目技術表現分析
目的:分析射箭選手在反曲弓競賽項目中的技術表現。對象:我國2006年亞運反曲弓射箭決選的男子、女子各八位選手,分析資料包括資格賽和對抗賽的全部過程。方法:應用Facets測驗軟體分析競賽資料,根據射箭競賽的特性,將技術分成四個重點(層面):選手、距離、回合和放箭順序等分析。利用適合度考驗、難度、估計誤差和非期望反應建立各層面技術的量尺,然後根據非期望反應和標準殘差,再探討選手個人的技術表現。結果:提供教練訓練和比賽客觀的數據,排除主觀判斷的缺點且提升選手的成績表現。結論:是利用客觀測量的非期望反應,可以探查反曲弓射箭競賽的運動員技術。
標槍投擲技術評估
目的:評估標槍投擲技術的動作表現。研究對象:國立體育學院陸上系投擲組學生12名(男子選手8名、女子選手4名)。方法:根據標槍投擲的過程,將技術分成助跑、交叉歩、擲出和完成動作四個部分(試題),透過有經驗的評分者給分,應用Facets分析選手、評分者和試題三個層面的資料。結果:1、運動員層面:Rasch的個別信度 0.96 ,同質性考驗顯示具有鑑別度,隨機考驗顯示樣本符合常態分配(有代表性)。2、技術動作層面:Rasch的個別信度 0.92 ,同質性考驗顯示具有鑑別度,隨機考驗顯示樣本符合常態分配(有代表性)。3、評分員層面:Rasch的個別信度 0.79 ,同質性考驗顯示評分員不一致,隨機考驗顯示樣本符合常態分配(有代表性)。結論:本研究的標槍投擲技術觀察表能夠評估選手標槍投擲的技術;但評分員的評分不一致,有待進一步改善。
2008年10月26日 星期日
運動技術分析系列研究
Rasch分析2006年桌球世界團體賽制
目的:利用Rasch模式分析2006年桌球世界團體賽制的成績表現。研究對象:2006年桌球世界團體賽分級比賽,每一級24隊,預賽分四組循環賽,各組前三名進行一至十二名排名決賽、後三名參加13至24名排名決賽。方法:應用多層面Facets估計各隊的潛在能力。結果:估計各隊的潛能和排名順序並不一致。結論:桌球世界團體賽制雖有利於明確的排名,但在對抗性的比賽中並非很公平。
目的:利用Rasch模式分析2006年桌球世界團體賽制的成績表現。研究對象:2006年桌球世界團體賽分級比賽,每一級24隊,預賽分四組循環賽,各組前三名進行一至十二名排名決賽、後三名參加13至24名排名決賽。方法:應用多層面Facets估計各隊的潛在能力。結果:估計各隊的潛能和排名順序並不一致。結論:桌球世界團體賽制雖有利於明確的排名,但在對抗性的比賽中並非很公平。
2008年10月25日 星期六
ABOUT PROMS
PROMS (Pacific Rim Objective Measurement Symposium) is an annual non-governmental professional meeting established at the instigation of Professor Trevor Bond in 2004 to promote objective measurement and contribute to the research and development of Rasch measurement in the Pacific Rim. PROMS is an annual symposium aiming to provide a forum for the sharing of new knowledge with the international community. Rasch measurement workshops are usually attached to PROMS meetings.
The first PROMS meeting, PROMS KL 2005, was successfully held at Kuala Lumpur Malaysia in 21-23 June 2005. It was hosted by the Research Centre of the International Islamic University of Malaysia. The theme of PROMS 2005 was “Quality Measurement for Quality Decisions”. The symposium had attracted over 120 international researchers, practitioners, educators, and policymakers from 10 countries, including Australia, Sweden, Hong Kong, Korea, Malaysia, Palestine, Philippines, South Africa, Taiwan, and U.S.A. Prof. Mike Linacre ran introduction to Winsteps / Facets software workshop at PROMS KL 2005.
The second PROMS meeting, PROMS HK 2006, was also held successfully in Hong Kong from 27-29 June 2006 and hosted by the Department of Educational Psychology, Counseling, and Learning Needs, The Hong Kong Institute of Education. The theme of PROMS HK 2006 was “Rasch Measurement: A Tool for Scientific Progress for the Asia Pacific”. Prof. Mike Linacre also hosted a Winsteps / Facets software workshop at PROMS HK 2006.
PROMS TW 2007 is to be held in TaoYuan, Taiwan, from 17-19 July 2007 and will be joint hosted by the Graduate Institute of Sports Training Science, National College of Physical Education & Sports, and the Department of Psychology, National Chung Cheng University. The theme of PROMS 2007 in Taiwan is “Objective Measurement in Diverse Disciplines”. Winsteps, ConQuest, BILOG-MG, & RUMM software workshops will be organized on 16 July 2007. Dr. Mike Linacre, Dr. Margaret Wu, Dr. Eiji Muraki, & Dr. David Andrich will host these workshops personally.
The first PROMS meeting, PROMS KL 2005, was successfully held at Kuala Lumpur Malaysia in 21-23 June 2005. It was hosted by the Research Centre of the International Islamic University of Malaysia. The theme of PROMS 2005 was “Quality Measurement for Quality Decisions”. The symposium had attracted over 120 international researchers, practitioners, educators, and policymakers from 10 countries, including Australia, Sweden, Hong Kong, Korea, Malaysia, Palestine, Philippines, South Africa, Taiwan, and U.S.A. Prof. Mike Linacre ran introduction to Winsteps / Facets software workshop at PROMS KL 2005.
The second PROMS meeting, PROMS HK 2006, was also held successfully in Hong Kong from 27-29 June 2006 and hosted by the Department of Educational Psychology, Counseling, and Learning Needs, The Hong Kong Institute of Education. The theme of PROMS HK 2006 was “Rasch Measurement: A Tool for Scientific Progress for the Asia Pacific”. Prof. Mike Linacre also hosted a Winsteps / Facets software workshop at PROMS HK 2006.
PROMS TW 2007 is to be held in TaoYuan, Taiwan, from 17-19 July 2007 and will be joint hosted by the Graduate Institute of Sports Training Science, National College of Physical Education & Sports, and the Department of Psychology, National Chung Cheng University. The theme of PROMS 2007 in Taiwan is “Objective Measurement in Diverse Disciplines”. Winsteps, ConQuest, BILOG-MG, & RUMM software workshops will be organized on 16 July 2007. Dr. Mike Linacre, Dr. Margaret Wu, Dr. Eiji Muraki, & Dr. David Andrich will host these workshops personally.
PROMS 2007 TW
國內空前最盛大的國際性 Rasch測量學術會議。
第三屆泛太平洋地區客觀測量研討會(Pacific Rim Objective Measurement Symposium, PROMS 2007, 16-19 July 2007, National College of Physical Education and Sports, Taoyuan, Taiwan, Republic of China.) 。
目的是為了在泛太平洋地區推廣與試題反應理論之Rasch model有關的學術研究,以及應用Rasch model和IRT來發展更適當的測驗工具。
前一天先舉辦Winsteps、BILOG-MG、RUMM 和ConQuest 等四場工作坊 。
第三屆泛太平洋地區客觀測量研討會(Pacific Rim Objective Measurement Symposium, PROMS 2007, 16-19 July 2007, National College of Physical Education and Sports, Taoyuan, Taiwan, Republic of China.) 。
目的是為了在泛太平洋地區推廣與試題反應理論之Rasch model有關的學術研究,以及應用Rasch model和IRT來發展更適當的測驗工具。
前一天先舉辦Winsteps、BILOG-MG、RUMM 和ConQuest 等四場工作坊 。
2008年10月24日 星期五
Rasch模式估計軟體 -2
RUMM2020
•RUMM2020 is a Rasch unidimensional measurement models.
• For analysing assessment and attitude questionaire data.
•An essential tool for teaching measurement, test designing and conducting Rasch analysis research using the Rasch measurement model.
ConQuest
•ACER ConQuest Version 2.0 is a computer program for fitting item response (Rasch) and latent regression models.
•ACER ConQuest also offers the wider measurement and research community the most up-to-date psychometric methods of multifaceted item response models, multidimensional item response models, latent regression models and drawing plausible values.
Facets
Facets is designed to handle really tough applications of unidimensional Rasch measurement. It constructs measures from complex data involving heterogeneous combinations of examinees, items, tasks, judges along with further measurement and structural facets.
•RUMM2020 is a Rasch unidimensional measurement models.
• For analysing assessment and attitude questionaire data.
•An essential tool for teaching measurement, test designing and conducting Rasch analysis research using the Rasch measurement model.
ConQuest
•ACER ConQuest Version 2.0 is a computer program for fitting item response (Rasch) and latent regression models.
•ACER ConQuest also offers the wider measurement and research community the most up-to-date psychometric methods of multifaceted item response models, multidimensional item response models, latent regression models and drawing plausible values.
Facets
Facets is designed to handle really tough applications of unidimensional Rasch measurement. It constructs measures from complex data involving heterogeneous combinations of examinees, items, tasks, judges along with further measurement and structural facets.
2008年10月23日 星期四
Rasch模式的估計軟體
1.Winsteps:二層面單向度Rasch測量,http://www.winsteps.com/winsteps.htm
2. RUMM2020:單向度Rasch測量,http://www.rummlab.com.au/
3. ConQuest:多種Rasch模式,http://shop.acer.edu.au/acer-shop/group/CON2;jsessionid=37929F6E41637DC1CC761EAD9D2673B9
4.Facets:多層面單向度Rasch測量,http://www.winsteps.com/facets.htm
Winsteps
•Winsteps constructs Rasch measures from simple rectangular data sets, usually of persons and items. After initial familiarization, it is straightforward to use in combination with other software.
•Item types that can be combined in one analysis include dichotomous, multiple-choice, and multiple rating-scale and partial credit items.
2. RUMM2020:單向度Rasch測量,http://www.rummlab.com.au/
3. ConQuest:多種Rasch模式,http://shop.acer.edu.au/acer-shop/group/CON2;jsessionid=37929F6E41637DC1CC761EAD9D2673B9
4.Facets:多層面單向度Rasch測量,http://www.winsteps.com/facets.htm
Winsteps
•Winsteps constructs Rasch measures from simple rectangular data sets, usually of persons and items. After initial familiarization, it is straightforward to use in combination with other software.
•Item types that can be combined in one analysis include dichotomous, multiple-choice, and multiple rating-scale and partial credit items.
2008年10月22日 星期三
Rasch模式發展趨勢
近年來的趨勢Rasch測量模式蓬勃發展,主要是Rasch模式具有線性的可加性。
Rost(2001)評論:「歸納Rasch模式卓越的特質,包括:可分割、充足性、明確具體和潛能可加性。」
影響所及不但相關Rasch模式紛紛出籠,各種專門的工作坊、研討會、定期討論會繁多;就區域而言,北美、歐洲、澳洲和亞洲都有Rasch測量的專門研究、教學、網站,較落後者甚至聘請專家學者,長期任教或協助研究。
國內的Rasch測量
就應用的領域而言,由原有的心理計量,廣泛的應用於心理和教育,近年來醫療、健康、體育運動、社會……等等,以急起直追,引進Rasch用於測量方面。
國內的努力:
1.2004年教育與心理測驗學術研討會,工作坊主題:Rasch測量的應用,國立政治大學。
2.Rasch分析在醫療產業上的應用研討會,日期: 95年2月25日,地點: 奇美醫學中心。
3.PROMS (Pacific Rim Objective Measurement Symposium) Taiwan 2007, 16-19 July 2007, National College of Physical Education and Sports, Taoyuan, Taiwan, Republic of China.
體育運動的應用研究
•編製體育運動測驗
•信度效度實際驗證
•建立測驗常模
•比賽排名的量化
•運動主觀評分之探討
•運動競技的分析
Rost(2001)評論:「歸納Rasch模式卓越的特質,包括:可分割、充足性、明確具體和潛能可加性。」
影響所及不但相關Rasch模式紛紛出籠,各種專門的工作坊、研討會、定期討論會繁多;就區域而言,北美、歐洲、澳洲和亞洲都有Rasch測量的專門研究、教學、網站,較落後者甚至聘請專家學者,長期任教或協助研究。
國內的Rasch測量
就應用的領域而言,由原有的心理計量,廣泛的應用於心理和教育,近年來醫療、健康、體育運動、社會……等等,以急起直追,引進Rasch用於測量方面。
國內的努力:
1.2004年教育與心理測驗學術研討會,工作坊主題:Rasch測量的應用,國立政治大學。
2.Rasch分析在醫療產業上的應用研討會,日期: 95年2月25日,地點: 奇美醫學中心。
3.PROMS (Pacific Rim Objective Measurement Symposium) Taiwan 2007, 16-19 July 2007, National College of Physical Education and Sports, Taoyuan, Taiwan, Republic of China.
體育運動的應用研究
•編製體育運動測驗
•信度效度實際驗證
•建立測驗常模
•比賽排名的量化
•運動主觀評分之探討
•運動競技的分析
2008年10月20日 星期一
Rasch模式與試題反應理論的區別
參考Rasch測量會刊RMT (2005)的Rasch二分模式與試題反應理論單參數Logistic 模式乙文,加上筆者多年研究Rasch測量,將兩者對照分析,匯報成表,以便後續的比較說明。
1. Rasch模式
源自度量受試者能力,1960年丹麥學者Rasch研究智力和成就測驗的機率模式,其目的在於測量。
2.試題反應理論單參數Logistic 模式
最早應該是源自Birnbaum (1968)的一些潛在特質模式研究,它載於Lord和Novick(編著) 的智力測驗分數的統計理論。 Lord, F. M. 是教育測驗服務社(ETS)的成員,他發現大量測驗資料時,都是常態分配,發展成能力和答對機率為常態肩形曲線,企圖以此模式克服古典測驗理論的一些問題。
事實上Birnbaum是修改1952 年Lord 提出二參數常態肩形模式,因為常態肩形模式估計繁瑣困難,修改為Logistic 模式加上1.7常數的調整,兩者就非常近似,乃影響後來研究方向。
1. Rasch模式
源自度量受試者能力,1960年丹麥學者Rasch研究智力和成就測驗的機率模式,其目的在於測量。
2.試題反應理論單參數Logistic 模式
最早應該是源自Birnbaum (1968)的一些潛在特質模式研究,它載於Lord和Novick(編著) 的智力測驗分數的統計理論。 Lord, F. M. 是教育測驗服務社(ETS)的成員,他發現大量測驗資料時,都是常態分配,發展成能力和答對機率為常態肩形曲線,企圖以此模式克服古典測驗理論的一些問題。
事實上Birnbaum是修改1952 年Lord 提出二參數常態肩形模式,因為常態肩形模式估計繁瑣困難,修改為Logistic 模式加上1.7常數的調整,兩者就非常近似,乃影響後來研究方向。
Rasch模式的家族
Rost(2001)綜評:「 Rasch模式家族的成長,分析發展的四個方向為:多向度、多重計分、多層面和多群組。」
•1960年二分計分模式和波松計量模式
•1972年二項試做模式
•1977年Andersen、1978年Andrich增加第四種評分量尺模式
•1981年Masters 和Wright 部分計分模式
•1983年Stegelmann 增加第六種多向度Rasch模式
•1989年Linacre 增加第七種多層面Rasch模式
•1989年Yamamoto 增加第八種不同計分混合Rasch模式(hybrid Rasch model)
•1990年Rost 增加第九種多群組混合Rasch模式(mixed Rasch model)
•尚有混合多向度Rasch模式、混合線性Rasch模式和混合多向度線性Rasch模式等三類,目前還未能發展出來
•1960年二分計分模式和波松計量模式
•1972年二項試做模式
•1977年Andersen、1978年Andrich增加第四種評分量尺模式
•1981年Masters 和Wright 部分計分模式
•1983年Stegelmann 增加第六種多向度Rasch模式
•1989年Linacre 增加第七種多層面Rasch模式
•1989年Yamamoto 增加第八種不同計分混合Rasch模式(hybrid Rasch model)
•1990年Rost 增加第九種多群組混合Rasch模式(mixed Rasch model)
•尚有混合多向度Rasch模式、混合線性Rasch模式和混合多向度線性Rasch模式等三類,目前還未能發展出來
2008年10月18日 星期六
Rasch 二分計分模式
數學測驗第一題,共有550位考生,利用 Rasch 二分計分模式估計得到:試題難度-0.401,適合度殘差1.146、卡方機率0.438,未達 p < .05 顯著水準,表示試題適合 Rasch 二分計分模式。参考下圖

Rasch 二分計分模式計有答對和答錯兩個類別,其類別函數如下
Rasch 二分計分模式計有答對和答錯兩個類別,其類別函數如下
Rasch 二分計分模式將兩題二分計分的試題特徵曲線合併圖, 第一題 -0.40 較第二題的 -1.17 困難。參考下圖
2008年10月17日 星期五
2008年10月16日 星期四
2008年10月15日 星期三
線性
李克特的評分量尺企圖利用穩定和明確定義的連續量尺評價特質,實際上至多只是具有順序類別的量尺,且不一定是線性的。
因為人類行為類型並不會被我們人為的量尺所限制,點型測驗無所謂是非對錯,它缺乏表達資料的大小順序,沒有相等的間隔和沒有真實數值的特質。
就統計處理而言,等距水準以上的資料,才具有可加性,進行處理統計才有意義。
測量的前輩塞斯通(Thurstone)開啟了探索估計資料之道,古德曼(Guttman)熟悉順序資料的限制,建議如果實際觀察和期望吻合,那麼資料的順序量尺將足夠接近到允許統計分析。
試題二分計分的機率(Probability)包括答對機率p值,相對的答錯機率q值;該題的答對機率與答錯機率的比值,稱為勝率(Odds)
機率值是說明的答對出現可能性(p),機率的範圍從『0』至『1』;當採用勝率時,不但兼顧不出現的可能性(1-p),而且突破上限效應(ceiling effect),勝率的範圍從『0』至『+∞』(正無限大),即擴大了上端的效果。
非線性的模式在解釋和使用上較為複雜,如果用logit模式來敘述關係較簡單,具有相當的價值。轉換logit值有兩個步驟:首先將機率(Probability)換算為勝率(Odds),其次取勝率的自然對數值
logit值有兩大優點:一是沒有上限和下限效應的限制,其範圍從『-∞』到『+∞』(從負無限大到正無限大)。
其次是非線性的線性化(linearizing the nonlinear)。原來的勝率是非線性的,經轉換為logit值後變成等距的改變,即logit值和變項呈線性關係。
非線性的線性化(linearizing the nonlinear)。原來的勝率是非線性的,經轉換為logit值後變成等距的改變,即logit值和變項呈線性關係。
以機率值0.50為中心,吾人可以發現機率增加為0.60時,勝率增加了0.50;而機率減少為0.40時,勝率減少了0.33,兩者是不相等的(0.50≠0.33)。
但是logit值在機率值0.50為中心,機率增加為0.60時,logit值增加了0.41;而機率減少為0.40時,logit值也減少了0.41,兩者的改變是相等的(0.41=0.41)。也就是說,以機率值0.50為中心,吾人可以發現機率增加0.10和減少0.10時,勝率的改變值是非線性的(不相等的),而logit的改變值是線性的(相等的)。
因為人類行為類型並不會被我們人為的量尺所限制,點型測驗無所謂是非對錯,它缺乏表達資料的大小順序,沒有相等的間隔和沒有真實數值的特質。
就統計處理而言,等距水準以上的資料,才具有可加性,進行處理統計才有意義。
測量的前輩塞斯通(Thurstone)開啟了探索估計資料之道,古德曼(Guttman)熟悉順序資料的限制,建議如果實際觀察和期望吻合,那麼資料的順序量尺將足夠接近到允許統計分析。
試題二分計分的機率(Probability)包括答對機率p值,相對的答錯機率q值;該題的答對機率與答錯機率的比值,稱為勝率(Odds)
機率值是說明的答對出現可能性(p),機率的範圍從『0』至『1』;當採用勝率時,不但兼顧不出現的可能性(1-p),而且突破上限效應(ceiling effect),勝率的範圍從『0』至『+∞』(正無限大),即擴大了上端的效果。
非線性的模式在解釋和使用上較為複雜,如果用logit模式來敘述關係較簡單,具有相當的價值。轉換logit值有兩個步驟:首先將機率(Probability)換算為勝率(Odds),其次取勝率的自然對數值
logit值有兩大優點:一是沒有上限和下限效應的限制,其範圍從『-∞』到『+∞』(從負無限大到正無限大)。
其次是非線性的線性化(linearizing the nonlinear)。原來的勝率是非線性的,經轉換為logit值後變成等距的改變,即logit值和變項呈線性關係。
非線性的線性化(linearizing the nonlinear)。原來的勝率是非線性的,經轉換為logit值後變成等距的改變,即logit值和變項呈線性關係。
以機率值0.50為中心,吾人可以發現機率增加為0.60時,勝率增加了0.50;而機率減少為0.40時,勝率減少了0.33,兩者是不相等的(0.50≠0.33)。
但是logit值在機率值0.50為中心,機率增加為0.60時,logit值增加了0.41;而機率減少為0.40時,logit值也減少了0.41,兩者的改變是相等的(0.41=0.41)。也就是說,以機率值0.50為中心,吾人可以發現機率增加0.10和減少0.10時,勝率的改變值是非線性的(不相等的),而logit的改變值是線性的(相等的)。
2008年10月14日 星期二
度量
(1)量化問卷調查無法和測驗跳遠成績一樣,使用皮尺丈量、單位是公尺;也就是說,度量參與競技運動動機缺乏一把標準的量尺。
(2)就測驗測量而言,這是估計或校準動機強度的步驟。它包括兩個重要的校準重點,一是試題的難度,其次是試題內反應的強度(scoring,計分);須要建立一套單位的量尺,以便「公平合理」的量測。
(3)上述設定參加國際賽的標準為例,第一題A標7.20公尺、第二題B標7.00公尺,編號1711選手跳遠成績7.28公尺(B1 ),高於A標和B標,等於答對兩題,總計得到兩分;依序可知1747、1191和1253三人,總計得到一分,1319、1796、1317和1013四人,總計得到零分。(參考下圖)
(4)觀察分數產生來自選手的能力和試題難度的對照,當選手能力 高於 試題難度 時得一分,如1747選手跳遠成績7.07公尺高於B標7.00公尺,得一分;當 選手能力 低於 試題難度 時得零分,如1747選手跳遠成績7.07公尺低於A標7.20公尺,得零分。
(5)由此可知,問卷調查所得的受試者反應僅是順序量尺的性質,如動機的強度缺乏「原點」,所以,不能和跳遠丈量的成績相比。
(6)如何更精確的度量呢?現在的Rasch分析已經大大提升測量的水準,容後再逐步介紹。
2008年10月13日 星期一
原點
民國95年全國中等學校運動會高男組田徑跳遠項目,比賽成績如下:
編號 1711 1747 1191 1253 1319 1796 1317 1013
成績(M) 7.28 7.07 7.04 7.02 6.99 6.93 6.92 6.92
名次 1 2 3 4 5 6 7 8
當選手要量測成績時,第一要從起跳板的前緣(基準線)量起,然後用皮尺丈量(度量)最靠近基準線上的一點(基準原點)之垂直距離(線性),在此程序之下,因為公平合理,所以能信服眾人。
現設定參加國際賽的標準:A標7.20公尺、B標7.00公尺。結果達到A標者一人,給予評價「優」(設定代碼3)。到B標者三人,給予評價「良」(設定代碼2);其餘的給予評價「可」(設定代碼1)。
現在換一個場景,吾人欲了解這些選手的參與競技運動的動機,透過適當的量表來量測;假設以「請問你參與競技運動動機的強度」為題,讓選手反應,選項有「強烈」、「中等」、「微弱」等,這時吾人缺乏測量的「原點」。
在順序量尺的兩端,它將包含很大的範圍,也就是說,「強烈」包含至無限大強度的動機,以及「微弱」包含至無限小強度的動機。因此,問卷調查量化時遭遇的第一個問題是「原點」在那裡?
吾人僅能就單一試題比較說明其參與競技運動動機的強度,如果問卷調查有許多試題,不適合加總運算。
理由是「強烈」、「中等」、「微弱」所包含的範圍(距離不相同),最重要的是缺乏基準原點,彼此之間的立足點是否相同,不得而知。
跳遠競技:從起跳板的前緣(基準線)量起,然後用皮尺丈量(度量)最靠近基準線上的一點(基準原點)之垂直距離(線性),在此程序之下,因為公平合理,所以能信服眾人。
參與競技運動動機問卷調查:反應的是「很強烈」 、 「強烈」、「中等」、「微弱」 、「很微弱」所包含的範圍(距離不相同),兩極端類別延伸至無限大。
最重要的是缺乏基準原點,彼此之間的立足點是否相同,不得而知。
編號 1711 1747 1191 1253 1319 1796 1317 1013
成績(M) 7.28 7.07 7.04 7.02 6.99 6.93 6.92 6.92
名次 1 2 3 4 5 6 7 8
當選手要量測成績時,第一要從起跳板的前緣(基準線)量起,然後用皮尺丈量(度量)最靠近基準線上的一點(基準原點)之垂直距離(線性),在此程序之下,因為公平合理,所以能信服眾人。
現設定參加國際賽的標準:A標7.20公尺、B標7.00公尺。結果達到A標者一人,給予評價「優」(設定代碼3)。到B標者三人,給予評價「良」(設定代碼2);其餘的給予評價「可」(設定代碼1)。
現在換一個場景,吾人欲了解這些選手的參與競技運動的動機,透過適當的量表來量測;假設以「請問你參與競技運動動機的強度」為題,讓選手反應,選項有「強烈」、「中等」、「微弱」等,這時吾人缺乏測量的「原點」。
在順序量尺的兩端,它將包含很大的範圍,也就是說,「強烈」包含至無限大強度的動機,以及「微弱」包含至無限小強度的動機。因此,問卷調查量化時遭遇的第一個問題是「原點」在那裡?
吾人僅能就單一試題比較說明其參與競技運動動機的強度,如果問卷調查有許多試題,不適合加總運算。
理由是「強烈」、「中等」、「微弱」所包含的範圍(距離不相同),最重要的是缺乏基準原點,彼此之間的立足點是否相同,不得而知。
跳遠競技:從起跳板的前緣(基準線)量起,然後用皮尺丈量(度量)最靠近基準線上的一點(基準原點)之垂直距離(線性),在此程序之下,因為公平合理,所以能信服眾人。
參與競技運動動機問卷調查:反應的是「很強烈」 、 「強烈」、「中等」、「微弱」 、「很微弱」所包含的範圍(距離不相同),兩極端類別延伸至無限大。
最重要的是缺乏基準原點,彼此之間的立足點是否相同,不得而知。
2008年10月11日 星期六
2008年10月10日 星期五
Rasch解決問題的步驟
1.依年齡逐漸增閱讀難度。
2.全部閱讀的期望表現。
3.實際的設計(Rasch, 1960, p5)。
4.將量化的閱讀能力和試題難度,分別去定義每個人和內容。
1>將量化的閱讀能力和試題難度,分別去定義每個人和內容。
2>假設平均閱讀錯誤。
3>
4>Bp: 個人p的閱讀能力。
5>Dt:內容(試題) t 的難度。
5>Dt:內容(試題) t 的難度。
5.比較兩篇內容的的難度,不必依賴個人的閱讀能力。
1>比較兩篇內容的的難度。
2>
2>
3>試題獨立:建立共同量尺。利用共同的標準,則量尺獨立。
4>比較兩篇內容的難度,不必再依賴個人的閱讀能力。
5>可概化至相關的內容難度,能夠獲得個人閱讀的能力。
4>比較兩篇內容的難度,不必再依賴個人的閱讀能力。
5>可概化至相關的內容難度,能夠獲得個人閱讀的能力。
Rasch解決閱讀問題的方法
1.因為要測量不同時期、不同水準的閱讀能力,如何採用相同的量尺?
2.Rasch開始時,使用波松(Poission)模式解決閱讀錯誤的問題
3.由波松演變成二分計分試題的簡單邏輯模式,進而導出等級反應模式。
2.Rasch開始時,使用波松(Poission)模式解決閱讀錯誤的問題
3.由波松演變成二分計分試題的簡單邏輯模式,進而導出等級反應模式。
2008年10月8日 星期三
Georg Rasch介紹
Rasch(1901-1980)丹麥數學家
1.純數學博士學位:在戰爭期間擔任統計專職顧問, 戰後1934年跟隨費雪爾研究一年。
2.擔任哥本哈根大學的應用社會科學統計教授。
3.他是丹麥教育研究機構的顧問,同時也和芝加哥大學有密切的連繫。
Rasch探討學生閱讀過程
1.主要的需求:不同時期,應該採用不同的閱讀內容。
2.每個時期閱讀的內容對學生不能夠太難也不能太容易。(適當的難度)
3.當學生能力提高,測驗也要隨著改變,不能再使用相同的測驗。
4.所以,逐步增加測驗的難度,以適合不同階段學生的閱讀能力。
5.找出測量學生閱讀進步的共通量尺,可估計準確的閱讀能力工具。
1.純數學博士學位:在戰爭期間擔任統計專職顧問, 戰後1934年跟隨費雪爾研究一年。
2.擔任哥本哈根大學的應用社會科學統計教授。
3.他是丹麥教育研究機構的顧問,同時也和芝加哥大學有密切的連繫。
Rasch探討學生閱讀過程
1.主要的需求:不同時期,應該採用不同的閱讀內容。
2.每個時期閱讀的內容對學生不能夠太難也不能太容易。(適當的難度)
3.當學生能力提高,測驗也要隨著改變,不能再使用相同的測驗。
4.所以,逐步增加測驗的難度,以適合不同階段學生的閱讀能力。
5.找出測量學生閱讀進步的共通量尺,可估計準確的閱讀能力工具。
測量的發展
1.現今處理有許多罕見的門徑,但都未能普及、獲得眾人的信服和接受。
2.在相同的標準下,1920年代塞斯通、1940年代古德曼、1960年代的Rasch(羅西),他們一脈相傳,具有一致的標準和哲學。
固定標準的本質
1.工具參數應該明確的界判斷力,對於個人的測量是要有區別性的,且具有獨立性的。
2.另一方面,不同的試題分組(測驗),應該使用相同試題類組,才能進行一樣的測量。
3.模式是用以幫助確認資料是否具有這些特質?它允許測量中出現異常的資料。
4.筆者將採用Rasch模式的處理資料門徑,將不涉及更多的參數(如2-PLM、3-PLM)。
5.筆者認為Rasch模式更適合展現不一致的資料。
2.在相同的標準下,1920年代塞斯通、1940年代古德曼、1960年代的Rasch(羅西),他們一脈相傳,具有一致的標準和哲學。
固定標準的本質
1.工具參數應該明確的界判斷力,對於個人的測量是要有區別性的,且具有獨立性的。
2.另一方面,不同的試題分組(測驗),應該使用相同試題類組,才能進行一樣的測量。
3.模式是用以幫助確認資料是否具有這些特質?它允許測量中出現異常的資料。
4.筆者將採用Rasch模式的處理資料門徑,將不涉及更多的參數(如2-PLM、3-PLM)。
5.筆者認為Rasch模式更適合展現不一致的資料。
2008年10月7日 星期二
計量處理的兩種門徑
現代測量理論的兩條路
1.測量領域爭議的兩種處理門徑,在這裡吾人無意介入這項爭議;但是為了避免這項爭議,所以還是附帶提出說明。
2.這兩種處理門徑具有共同目標:
A.更能了解構念或變項的測量,且修正工具是為了改善構念的操作。
B.估計個人在構念或變項之測量格式上的位置。
第一種處理的門徑
1.編製測驗工具先要有內容效度,編製資料特質的似真模式。
2.模式參數用於解釋試題和個人,不必事先限制模式。
3.主要標準:模式去適合資料
4.1-PLM發展至2-PLM、3-PLM、4-PLM 。
5.IRT發展至NIRT 。
第二種處理的門徑
1.編製測驗工具也是先要有內容效度,然後盡量界定模式,可以具有資料的特質,同意確信測量的標準。
2.模式參數用於幫忙說明試題和個人。
3.在模式與參數上具有事先的特別限制。
4.模式與資料無關,資料在內容上應該有效,也證明固定的可能模式。
5.Georg Rasch發展成 Rasch模式。
1.測量領域爭議的兩種處理門徑,在這裡吾人無意介入這項爭議;但是為了避免這項爭議,所以還是附帶提出說明。
2.這兩種處理門徑具有共同目標:
A.更能了解構念或變項的測量,且修正工具是為了改善構念的操作。
B.估計個人在構念或變項之測量格式上的位置。
第一種處理的門徑
1.編製測驗工具先要有內容效度,編製資料特質的似真模式。
2.模式參數用於解釋試題和個人,不必事先限制模式。
3.主要標準:模式去適合資料
4.1-PLM發展至2-PLM、3-PLM、4-PLM 。
5.IRT發展至NIRT 。
第二種處理的門徑
1.編製測驗工具也是先要有內容效度,然後盡量界定模式,可以具有資料的特質,同意確信測量的標準。
2.模式參數用於幫忙說明試題和個人。
3.在模式與參數上具有事先的特別限制。
4.模式與資料無關,資料在內容上應該有效,也證明固定的可能模式。
5.Georg Rasch發展成 Rasch模式。
2008年10月5日 星期日
2008年10月3日 星期五
2008年10月2日 星期四
運動計量學(Sportsmetric)
運動計量學(Sportsmetric) : 體育運動測驗與測量理論結合,發展成為運動計量學。
目前已有的學術領域: 心理計量學(Psychometric)、計量經濟學(Econometrics) 。
「運動」概念從「體育」概念中分離出來,「運動」概念不斷的擴大,進而含括了「體育」概念。
相關網址:
http://sts.ncpes.edu.tw/sts%20%20Teacher%20yauc.htm
目前已有的學術領域: 心理計量學(Psychometric)、計量經濟學(Econometrics) 。
「運動」概念從「體育」概念中分離出來,「運動」概念不斷的擴大,進而含括了「體育」概念。
相關網址:
http://sts.ncpes.edu.tw/sts%20%20Teacher%20yauc.htm
訂閱:
文章 (Atom)