2025年11月24日 星期一

《『社區心理學實務』的「社區服務方案設計」》專輯(VIII):「結果評估」的簡介和範例─「結果評估」的定義和實例、方案淨效應、「結果評估」的簡易指引、「結果評估」的工作表單和實務方法

 

作者:周才忠 (日期:2025/11/25)

       美國社會政策研究中心高級研究員-莉絲白·雪兒有句名言:「在以結果為導向的世界裡,德蕾莎修女能存活下來嗎?」。這句話道出了「結果評估」的困難度和重要性。因此,本文介紹的內容,包括「結果評估」的定義和實例、方案淨效應、「結果評估」的簡易指引、「結果評估」的工作表單和實務方法。整體而言,「評估」能夠幫助你確保始終走在正確的道路上,在預期的時間和方式到達終點線,並可以向其他人展示你的成就。但其中的「結果評估」或「影響評估」是最嚴苛的評估研究任務,亦為呈現方案真正成效的最後兩哩路~~


「結果評估」的定義和實例       

     「結果評估」(Outcome evaluation),意指檢視方案對其參與者或接受者的“直接”、“短期”影響。它涉及「產出」與「結果」資料,「產出」資料為獲得活動過程完成的指標(如舉辦培訓課程場次、受過培訓的人數等)。「結果」資料則是衡量方案活動的“直接”影響,例如某藥物濫用預防方案在多大程度上提高了對藥物的瞭解和濫用藥物的知覺風險。其評估「結果」的證據,可能包括提升對毒品危險的認識,或增加抗拒使用毒品同儕壓力的社會技巧分數(Kloos et al., 2021)。

       任何基於「結果」的「評估」方法,都須涉及組別條件的“比較”來對比結果的重要性。因此,尋求以下問題的答案(Schalock, 2001):

  • 我的方案在服務接受者中產生了什麼「結果」?
  • 我的方案如何滿足日益增長的「責信」(accountability)要求?
  • 我的方案是否達到整體目標(goals)和具體目標(objectives)?
  • 我的方案有「效率」(efficient)嗎?
  • 我的方案有「功效」(effective)嗎?
  • X方案是否比Y方案產生更好的「結果」或「成果」(results)?
  • 如何利用「結果」資訊來改變方案?

「結果」指標

      「結果」,是目標群體的狀態或方案預計會“改變”的社會情況。值得注意的兩件事,首先,「結果」是目標群體或社會情況的觀察特徵,而不是方案的特徵,「結果」的定義沒有直接提到方案行動。雖然提供給方案參與者的服務通常被描述為方案的「產出」,但此處定義的「結果」必須與這些產物或服務可能為參與者帶來的益處有關,而不僅僅是作為他們的收據。其次,正如「結果」定義的那樣,其概念不一定意味著方案目標實際上已經產生“改變”,或者方案導致服務接受者以任何方式“改變”。例如,自『反菸運動』以來,高中生的吸菸量可能沒有發生變化;在參與「減重方案」期間,可能沒有人達到減肥的效果。或者,可能會有“改變”,但與預期方向相反─青少年可能反而增加了吸菸量,方案參與者可能反而增加了體重。此外,無論發生什麼,都可能是方案的影響以外的其他因素造成的。因此,評估人員面臨的挑戰不僅要評定實際獲得的「結果」,還要評定「結果」的任何變化都歸因於方案本身的程度(Rossi et al., 2004)

「意外後果」和「醫源性效應」

『總結性評估』和「結果評估」的關係

「短期結果」和「長期影響」的評估

 方案淨效應 

        所有方案的最終目標不僅僅是運作良好,而是帶來“改變”─以有益的方式影響一些問題或社會狀況。改變的狀態是方案的預期結果或產出。評估一個方案產生這些「結果」是評估者的核心職能。「結果」一詞有三種不同的用法:「結果水平(Outcome level)─是某個時間點的狀態(例如,青少年的吸菸量)。「結果變化(Outcome change)─是不同時間點「結果水平」之間的差異。「方案效果(Program effect)─是指「結果變化」的一部分,可以唯一歸因於方案介入,而不是其他因素的影響(Rossi et al., 2004)

       上圖繪製了「結果」測量隨時間而出現的水平。垂直軸表示與我們希望評估的方案相關的「結果變項」,它是方案目標群體的可測量特徵或狀況,可能受到方案操作的影響。這可能吸菸量、體重、入學前準備度或上述「結果」定義下的任何其他結果。橫軸表示時間,具體來說,從方案傳輸給目標群體“之前”到“之後”的一段“期間”。圖表中的實線顯示了一組接受方案服務的個人之平均「結果水平」。請注意,隨著時間的推移,它們的狀態不是被描繪成一條直線,而是被描繪成一條四處晃動的線。這表明,吸菸、入學前準備度、管理技能和其他此類「結果」維度預計不會保持不變─它們是由於許多自然原因和與該方案完成無關的情況而產生的變化。如果我們測量「結果變項」,可以確定目標群體相對於該變項有多高或有多低。這告訴我們「結果水平」,通常簡稱為「結果」。在目標群體接受方案服務後進行測量時,它告訴我們一些關於該群體的情況。如果所有青少年都在吸菸,我們可能會感到失望,相反,如果沒有人吸菸,我們可能會感到高興。然而,這些「結果水平」本身並不能告訴我們該方案的「有效性」,儘管它們可能會限制可能性。在大多數情況下,單靠「結果水平」無法被自信地解釋為方案成功或失敗的指標。如果我們在目標群體參與該方案前後來測量「結果」,我們可以描述的不僅僅是「結果水平」,我們還可以辨別「結果變化」。例如,孩子們在參加方案前後有表現出更大的入學前準備度,這是一個正向的變化。但僅從這些資訊來看,我們實際上並不知道學前班方案與孩子們的入學準備程度的提高有關。因為學齡前兒童正處於發育期,他們的認知和動作技能透過正常的成熟過程迅速提高。另外,其他因素也可能在起作用。上圖中的虛線顯示了如果方案參與者沒有接受方案服務,就會觀察到「結果變項」的軌跡。實線和虛線的比較表明,即使沒有接觸該方案,「結果」也會得到改善,但幅度不會那麼大。參與該方案所取得的「結果水平」與同一個人如果不參與而將達到的「結果水平」之間的差異是該方案產生的「結果變化」的一部分。這是「結果」的附加值或「淨收益(Net gain)部分,如果沒有該方案,就不會發生。我們把這種增量稱為「方案效果」或者是「方案影響」。這是該方案唯一能誠實地獲得信譽的「結果」。評估方案的「結果」或「影響評估」是最嚴苛的評估研究任務(Rossi et al., 2004)

「結果評估」的簡易指引 

一、一個方案的“直接”效果是什麼?

       方案評估的“基準線”,通常是方案的效果(Effects)。與效果相關的評估有兩種型式:「結果評估」著眼於短期效果,而「影響評估(Impact assessment)則著眼於長期最終效果。「結果評估」涉及衡量方案對服務接受者的直接近側效果。它試圖確定該方案的直接效果,例如該方案增加毒品知識和知覺毒品風險的程度(Linney & Wandersman, 1991)

       基本上,這一步涉及的是檢視方案評估在剛開始所設定的方案目標預期結果,並尋找有關結果實現程度的證據。證據可能包括轉介人數的變化、參加活動的學生人數增加、增加對毒品危險性的宣傳、提高自尊測量的分數等(Linney & Wandersman, 1991)

二、選擇結果效果的測量標準

       結果測量應該與目標密切相關。「結果評估」有幾個潛在的資訊來源(Linney & Wandersman, 1991)

  • 問卷:問卷是測量結果的常用指標。用於測量結果的特定問題必須謹慎選擇。測量時應該考慮的一些問題如下

  1. 效度─「建構效度(Construct validity)是指特定測量工具評估你希望衡量的概念或結果的程度。例如,一種X自尊量表在多大程度上實際評估了自尊。「預測效度(Predictive validity)則是評估特定措施可以預測未來結果的程度。例如,一種X自尊量表是否預測了1年後的毒品使用?
  2. 信度─「信度(Reliability)是指測量工具的穩定性。如果你在體重計上秤了一下自己,然後5分鐘再秤,發現妳的體重增加了8(而且你自己沒有任何的改變),你會說那個體重計不可靠和無用。同樣,如果一項測量措施沒有「信度(不太穩定),它也將毫無用處。

     對於標準化工具來說,「信度係數(Reliability coefficient)是穩定性和一致性的指標。「信度係數」可以從01.0不等,其數值越高,測量就越穩定。一般來說,.6.9之間的「信度係數」被認為是好的。如果一個常用的測量工具可用於你想要衡量的目標,並且它具有可接受的「信度」和「效度」,那麼通常最好使用該測量工具,而不是自己再去制定一個新的測量工具。

  • 檔案資料:「檔案資料(Archival data)是已經收集的資料,例如醫療記錄、學校成績和出勤記錄。
  • 其他人的評定:出於某些目的,從其他來源獲取有關方案參與者的資訊可能是有用的,例如家長對孩子的評定或教師對學生的評定。但可能需要獲得當事人的許可才能進行評定,例如「知情同意(Informed consent)

「結果評估」的工作表單      

「過程評估」的實務方法       

※圖表來源:「Devi Partners」網站

「評估」,尤其以“結果”為導向

能夠幫助你確保始終走在正確的道路上

在預期的時間和方式到達終點線

並可以向其他人展示你的成就



🔍參考文獻:



👉延伸閱讀



沒有留言:

張貼留言