TopScore 考研中心│SAT 的 Curve 到底是什麼?
February 27, 2020

Curve 到底是什麼?用這個當作低分或不考的藉口 Ok 嗎?
當然不 OK !別再被誤導啦~

對於這個問題,TopScore SAT 考研中心決定撰文詳細剖析,帶您瞭解、破除網路上對 SAT 的 curve 迷思。

一、什麼是 SAT 的 Curve?

其實學生們口中的 SAT curve,是指每次 SAT 當次的原始分數配分表(Raw Score Conversion Table),每次的配分均有頗大的落差,例如:在 SAT 錯 1 題扣 10 分的配分原則下,去年 SAT 2019 年 10 月亞太版 Reading Section,錯 6 題配分 370 分,而 2019 年 5 月亞太版 Reading Section,同樣錯 6 題,但配分出來卻只有 330 分;兩次考試錯的原始題數相同,但配分後卻可以差到 40 分。

乍看之下的確不是很公平,而這種配分普遍在網路叫做 curve 是因為考生對於 SAT 配分法的誤解,以為是跟美國學校老師常在考試後依照大家表現而做出的比序給分相同(大家都考得好,分數得 A 的標準就提高,大家考得差,分數得A的標準就降低),該作法是依據統計學標準差常態分佈的鐘型曲線 / curve 算出的,所以美國學生就會通稱這種依照整組考生表現的彈性給分法為 curve。

但是,這是一個很大的誤解。

而這個誤解已衍生出更多不必要的焦慮,大致有四種:

  1. 亞洲學生普遍認為被 College Board 歧視、針對性壓低分數,往後考不出高分。
  2. 有能力前往美國的亞洲學生為了要考傳聞 curve 比較寬鬆的北美版,拼命要報名美國的考試,導致不能去的學生擔心那些組團去考北美版的考生會考得比較好。
  3. 認為某月份的考試可能有許多大神級的高手會把分數 curve 拉高了,所以要避開這些月份。
  4. 想報考某月份,因為傳聞該月份的題目比較容易,但又憂心大家都考得好而把 curve 拉高了。

這四個問題我們會在後面「如何看待關於 curve 的迷思」章節中詳細解答。

首先,大家先要釐清一個觀念,就是: College Board 的 SAT 原始分數配分表依據的原則其實不稱為 curve,而是稱為equating(等化配分)。

這個項目其實在 SAT 自己官網的部落格上就有提到,因顧慮到考古題外洩而無法測量考生真正實力, SAT 每一次的題組都是新的,不會重複(除了 2018 年 8 月的北美版使用了 2017 年 10 月的亞太版,據說因爲是 College Board 第一次執行 8 月的場次,試題無法即時開發妥當,也有一說是原本開發好的考題外洩),而為了防止時區作弊,College Board 還多設計了亞太版及北美版。

雖然每一次考試版本都是依照相同的出題範圍所建構的,但每版本考試的難易度一定還是會有差別,而等化配分的過程就是要讓每次不同版本、不同時間、不同難易度的 SAT 分數能夠表達出相同的能力指標,藉由這個等化配分過程,College Board 才能建構出每一次的原始分數配分表。

也就是說,假如當次版本題目較其他版本容易時,配分就會趨於嚴格,也就是當次要比他次答對較多題才能得到相同的分數,反之,如當次版本題目較其他版本困難時,配分就會趨於寬鬆。

10月亞太題組(102019 A)難度偏困難,所以 curve 被調整寬鬆來等化配分;反之,5月的亞太題組(052019 A)難度偏容易,因此 curve 被調整得較為嚴格(錯一題便扣20分)。
二、SAT 的等化配分過程是如何設計的?

TopScore SAT 考研中心與 Johnny 老師研究了College Board 內部的 SAT 建構工程手冊及三篇SAT 配分設計研究報告後,將 SAT 開發新題目時的等化配分過程簡化爲下列三步驟:

1. 題組內容建構(Modulization):
College Board(ETS)在 SAT 每次按出題範圍設計好題目,並經由實際測試有效度後,再將每部份的題組(閱讀 52 題、語法 44 題)依照5個難易等級按比例分佈,題目建構部分就算完成了。

2. 版本等化配分(Version Equating):
因每次新版本題組與舊版本題組之間一定還是會有些許整體難易度的差別,為了要精確測量出每次題組的難度比,College Board 在經過內部精算題組難易度後,會再多次抽樣選擇北美高中生試考及在正式考試中置入加試題做實際參考,進而初步定位等化配分的量尺分數(Scaled Score)。如果實際測試後的成績偏高,這套題組的難度比就會被認定偏低,而最後的等化配分量尺就會偏嚴格。等化配分過後的題組,會被隨機分發使用在不同的月份與區域(亞太或北美)。

當然,每次考試的考生的實際表現還是會與其被預估的程度還是會有些許落差,這時候就需要第三步驟:

3. PR 等化配分校正(Equipercentile Equating and Recentering):
如果實際分數有異常的偏高,為了要維持等化配分的效度, College Board 會努力保持當次考試的整體分數 PR 值常態分佈(Normal Distribution)的鐘型曲線(Bell Curve)與其他版本的相同,College Board 在考試後會依照當次考生表現計算 PR 配分等化來微幅校正初步的等化配分,而校正過後的配分表就會成為最後發放分數的原始分數轉換表(Raw Score Conversion Table),也就是大家俗稱的「curve」。

等化配分 / Equating,是所有標準化考試通用的必要程序。

10月亞太(102019 AS)的 curve 可以讓同亞太考生比同樣錯6題的10月北美(102019 NA)考生多出30分。只能說,College Board 的 curve 並沒有所謂的區域針對性。
三、如何看待關於 curve 的迷思?

迷思 1:亞洲學生自己被 College Board 針對,所以SAT亞太版的 curve 一直都會很嚴格,在被針對性壓低分數的情況下,分數一定考不高。

迷思 2:北美版的 curve 相對寬鬆,去美國考 SAT 分數會比較高。

這兩個迷思基本上可以一起回答,基本上都是認為「SAT 配分有區域上的差別待遇」,覺得亞太要考到高分比在北美困難。

大部分的網路消息都非常衝動,一看到配分嚴格,直覺上就會認為自己被針對亞洲人的嚴格 curve 迫害了(College Board 官方說法還是始終如一:SAT配分沒有考後再做比序 curve,每個有高分實力的考生在任何區域都能夠考出高分)。

SAT 在當初本來就如同各國大學入學考試一般,是以分數在同儕位置中做出區分的常模參照考試(norm-referenced test),相反的,一般語言認證考試如:托福、雅思、多益,就是標準參照考試(criterion-referenced test),只測量分數個別是否達標。

我們找出了最初 College Board(全名為 College Entrance Examination Board)在 1961 年的圖:

SAT 的功能還是需要提供大學入學評審一個初步的審查評鑑來區分考生實力,所以如果超高分(1500+)異常的多,高分就會失去其鑑別度。

除了抓作弊外,College Board 還是需要適時地用 PR 等化配分校正來調整超高分的數量,以維持公信力。原因是雖然每個版本題組均經過專業嚴謹的開發與測試程序,但因北美的學生和亞洲的學生的做題能力傾向的顯著不同(亞洲考生數學普遍高分、北美考生擅長語法及歷史與文學閱讀),而這個控制超高分的措施(網路上俗稱壓分)在北美及亞太考區兩邊都會使用,並無特別針對亞太考生。

以下是我們整理了五次北美(NA)與亞太(A)考區較有代表性的考次。

以大家最關注的閱讀配分(以下我們還是用俗稱 curve 好了)而言,2019 最寬鬆的(10月)與最嚴格的(5月) curve 均在亞太,而亞太 12 月與北美 3 月相差無幾,反而北美 6 月也相當嚴格。

10 月亞太的 curve 可以讓同亞太考生比同樣錯 6 題的 10 月北美考生多出 30 分。只能說,College Board 的 curve 並沒有所謂的區域針對性。而 curve 有如此差距的原因不外是10月亞太的題組難度偏困難,所以 curve 被調整寬鬆來等化配分。反之,5 月亞太的題組難度偏容易,所以 curve 被調整嚴格。

所以,不要再輕信「亞太的SAT curve比較難拿分」、「這次亞太的閱讀被壓分了」、「北美的閱讀比亞太容易」、「亞太的數學出的比較難」等謠言。更沒有必要因為想要考高分就非要組團去美國考北美版,因為最後成績出來其實並無顯著差異。能在亞洲考出高分的考生也非常多!

總之,SAT 是個能力指標非常精準的考試,實力有多少,成績就有多少。希望同學們不要圖僥倖,專心累積實力上才是考高分的王道。與其花時間擔心傳聞,把時間配置在研讀閱讀題組還是 CP 值最高的。

迷思 3:某月份的考試可能有許多大神級的高手會把分數 curve 拉高了,要避開這些月份。

迷思 4:想報考某月份,因為傳聞該月份的題目比較容易,但又憂心大家都考得好而把 curve 拉高了。

事實上,SAT 並沒有在特定月份上容易或困難,curve 大原則還是一樣的,容易的題組,curve 就嚴格,困難的題組,curve 就寬鬆。

我們統計分析了從2016年3月開始到現在的亞太與北美每個月份的 curve,並無發現在月份上有特別的難易趨勢慣性。2019年5月亞太如此「凶狠」的配分(語法錯1個扣40分,數學錯1個扣30分)也不是因為5月慣例上困難(2018年5月 curve 正常),而是因為 College Board 在版本等化配分時就確認了這套題組的語法與數學題組難度偏低,配分當然就趨嚴格,但閱讀題組的配分還是正常的。

在分析過所有從2016年3月到2019年12月的北美及亞太 curve 後,對於想要考到 1500+ 的同學,我們會建議先操練語法與數學部分實際作題的精準度。 在分析5月亞太 curve 時,會發現中段分數區基本上還算正常,但是高分區扣分比增加(如語法錯1題扣40,但是之後基本上都是錯1題扣10分),而增加了拿高分的難度,亦即,錯題數較少階段(1-5題)的扣分,會比錯題數較多階段(6-10題)的扣分更多。

舉例來說,2019年3月亞太題組的配分中,錯5題扣70分,而錯10題卻只扣了100分。在2018年12月的亞太題組,錯5題扣100分,錯10題扣 160分。因此我們可以得知,語法及數學在高分段的扣分會比相對低分段的扣分更重。

所以,對於數學部分及語法部分,想要挑戰 1500+ 高分的同學就要儘量減少失誤,儘量在涵蓋完這兩部分的知識範圍後,增加專注度、仔細程度及做題效率。(1500+ 基本上數學部分要全對,語法部分儘量不要錯超過2-3題)。

相關文章
我是一名高中生的母親,我兒子在今年 (2019-2020) 大學申請季幾乎被所有學校拒絕,我不是想藉此吹噓他有多完美...
我的孩子現在大一了,這封感言其實是從孩子一年半前考完 SAT 時就想要寫,但想想比我孩子優秀的同學大有人在...
各科教師均具備五年以上教學資歷,輔導 SAT、AP、TOEFL / IELTS、GRE、檢定、競賽、作品集等各項申請必備成績。...