首先引用CET官網的一段解釋:
全國大學英語四六級考試(CET)分為四級(CET-4)和六級(CET-6)兩個級別。 全國大學英語四、六級考試的設計參照《大學英語課程教學要求》(以下簡稱《教學要求》)。 第四級是指《教學要求》中規定的“一般要求”; 第六級是指《教學要求》中規定的“較高要求”。 大學英語四級、大學英語六級的成績報告采用常模參照法,不設及格分數線。 四級考試的常模組是從全國16所大學的約3萬名非英語專業考生中遴選出來的; 六級常模組是從全國五所重點大學的約5000名非英語專業考生中選拔出來的。 每次考試后的紙質成績均參照常模折算成報考成績。
每次四六級考試結束后,相關話題往往會成為某個平臺的熱搜。 大多數人在抱怨自己的聽力能力差或不會翻譯和寫作后,立即開始尋找組織發布的標準答案并開始評估自己的分數。
市場上有許多評分系統。 以百次站為例:
簡而言之,這種評分方式就是對每一道題計算一個固定的分數。 每個問題類型的正確答案數乘以單個問題的分數,形成每個問題類型的分數,然后將它們相加。 ,得到最終的總分。 換句話說,它認為四級和六級的評分方法與我們經歷過的大多數考試的評分方法相同。
這種評分方法的缺點是你只知道分數的絕對水平,而無法了解自己在人群中的相對位置。 例如,聽力1-15每題得7.1分四級分數分布,但這15題的準確率并不相等。 同理,這15題和最后10題的難度也不相等。 確實,平均起來,最后的題比前面的題稍微難一點,但是你能說1-15題中最難的題一定比16-25題中最簡單的題容易嗎?
既然答案是否定的,為什么最后10道聽力題的分數必須是前15道題的兩倍呢?
此外,您還可以詢問:
為什么某道簡單題我的分數還是不高?
為什么某道題很難,但我的分數還是不低?
排除了與本文無關的各種因素,包括但不限于個人表現、嚴格審核等。你要知道,4、6級的設置就是為了讓某些人無論如何都無法通過。 如果您還不知道其機制,請繼續閱讀。
文章開頭提到的“常模參照法”,其實是引入了一群人來和你進行比較,通過比較你在這群人中的表現排名(即常模)來確定你的最終分數。 分數。 用數學語言來說,這是正態分布。 換句話說,您報告的分數不是您的測試分數,而是您的測試分數標準化的結果。
什么是正態分布? 相信玩過抽卡游戲的人都知道,絕對的歐洲皇帝和非洲酋長都是一小撮人。 大多數人在聲討計劃的過程中,總是在幾乎保證抽到的時候抽到最高等級的牌(不是)。 然后,以抽到頂牌的次數N為橫坐標,以抽到頂牌N次的概率為縱坐標,所抽出的圖像將呈現對稱的倒鐘形。
正態分布的概率密度函數
為了充分描述正態分布,我們需要知道兩個參數,期望和標準差。
期望易于理解。 在四級和六級考試中,期望是給定樣本(范數)的數學期望(平均分)。
標準差的定義是這樣的:
標準差 ( ) 最常用于概率統計中,作為統計分布程度 ( ) 的度量。 標準差定義為總體中每個單位的標準值與其均值的偏差平方的算術平均值的平方根。 它反映了群體內個體之間的分散程度。
為了便于理解,只需定性地認識到它是一個描述樣本分布濃度的量即可。
當我們知道了一個符合正態分布的樣本的期望值和標準差時,我們也就知道了樣本中每個值的概率是如何隨值本身變化的。 (即已知的概率密度函數)
此外,我們想知道得分X(根據定義應該從-∞開始)對應的總人數中,得分最差的人占總人數的比例只需積分概率密度函數f(x)即可在區間 (-∞,x) 上。 (全國每次考四六級的考生都很多,雖然只用其中一部分作為范數構建正態分布模型,但我們仍然可以把成績看成集合上的連續分布的正整數。事實上,你可以得到任何分數對應的位置百分比)
經過上述準備,就可以回答題主的問題了:
①大學英語六級的成績標準是什么?
上面已經分析過了。
② 為什么仍然存在分數低于表中最低分數的情況?
該表給出的實際上是區間上特定分數x與對應概率y的對應關系y=f(x)
。 因為f(x)對于正整數x是連續的,自然f(x)的值y也必須是連續的。
當然,沒有列出的原因可能是:
①對于實際情況,分數x取-∞或+∞是沒有意義的。 把取值范圍縮小一點,然后以聽力成績為例。 當你的答案相當差的時候(比如全錯),排名百分位數甚至低于2%,正常分數肯定會低于100分。(也就是說四級分數分布,你幾乎是百分之一)
②只是沒必要列出那么詳細。 4級和6級通常被視為通過考試,過多擔心排名是沒有用的。
分析到這里,就該進行實際計算了。
CET官方給出的報告分數計算公式為:
=\frac{x-Mean}{SD}×70+500,其中
x為試卷的原始分數,Mean為常模試卷的平均分數,SD為常模試卷分數的標準差。
容易得到這個正態分布的期望是500點,標準差SD是70點。
將兩個參數代入正態分布的概率密度函數
f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-(\frac{({x-\mu})^{2}}{2\sigma^2}) }
必須
f(x)=\frac{1}{\sqrt{2\pi}×70}e^{-(\frac{({x-500})^{2}}{2×70^2})}
化簡后,我們有:
f(x)\.^{-(\frac{({x-500})^{2}}{9800})}
其定積分為:
F(x)=\int_{-∞}^{x}0.^{-(\frac{({x-500})^{2}}{9800})}
正態分布的概率密度函數的原始函數沒有初等形式。 為了計算這個積分的結果,我們可以考慮從定積分的定義出發,將積分轉化為區間上n(n→∞)個曲邊梯形(視為無限細分下的矩形)的面積和。
這樣,對于每個給定的報告分數x,我們總能找到對應的累積概率F(x)。
為了簡單起見,直接使用Scipy模塊給出積分結果:
from scipy import integrate
from math import e
import numpy as np
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['KaiTi', 'SimHei', 'FangSong']
plt.rcParams['font.size'] = 12
sco=np.arange(1000)
pro=np.zeros(1000)
pro_int=np.zeros(1000)
def f(x):
return 0.005699*(e**(-(((x-500)**2)/9800)))
def probability(score):
return integrate.quad(f,0,score)
for i in range(0,1000):
pro[i]=0.005699 * (e ** (-(((i - 500) ** 2) / 9800)))*100
pro_int_i=probability(i)[0]*100
pro_int[i]=pro_int_i
print("報告得分為%d的百分位為f"%(i,pro_int_i)+'%')
fig, ax1 = plt.subplots()
ax2 = ax1.twinx()
ax1.plot(sco, pro, 'r-')
ax2.plot(sco, pro_int, 'b--')
ax1.set_xlabel('報告分數')
ax1.set_ylabel('得分概率',color='r')
ax2.set_ylabel('累計百分率', color='b')
plt.title("得分概率與累計百分率隨報告分數的變化情況")
plt.show()
積分的下限設置為x=0,因為在實際情況中,當分數x≥0且x<0時,函數值很小,可以忽略不計。
以報告分數 x\in[0,999] 為橫軸,左縱軸和右縱軸分別繪制得分概率和累積得分率:
乍一看,最終報告分數的分布似乎相當離散。然而,根據 3\sigma 原理,考生的報告分數 x 分布在
(430,570)的概率約為68.26\%
(360,640)的概率約為95.44\%
(300,700)的概率約為99.74\%
以下是部分計算結果:
報告 0 分的百分位為 0.%
……………………………………………………
報告 10 分的百分位為 0.%
……………………………………………………
報告分數為 98 的百分位為 0.%
報告分數為 99 的百分位為 0.%
……………………………………………………
報告分數 112 的百分位數是 0.%
報告分數 113 的百分位數是 0.%
……………………………………………………
報告分數 239 的百分位數是 0.%
報告分數 240 的百分位為 0.%
……………………………………………………
報告分數 252 的百分位數是 0.%
報告分數 253 的百分位數是 0.%
……………………………………………………
報告分數 337 的百分位數是 0.%
報告分數 338 的百分位數是 1.%
……………………………………………………
報告分數 356 的百分位數是 1.%
報告分數 357 的百分位數是 2.%
……………………………………………………
報告分數 410 的百分位數是 9.%
報告分數 411 的百分位數是 10.%
報告分數 412 的百分位數是 10.%
……………………………………………………
報告分數 423 的百分位數是 13.%
報告分數 424 的百分位數是 13.%
報告分數 425 的百分位數是 14.%
報告分數 426 的百分位數是 14.%
報告分數 427 的百分位數是 14.%
報告分數 428 的百分位數是 15.%
……………………………………………………
報告分數 495 的百分位數是 47.%
報告分數 496 的百分位數是 47.%
報告分數 497 的百分位數是 48.%
報告分數 498 的百分位數是 48.%
報告分數 499 的百分位數是 49.%
報告分數為 500 的百分位為 49.%
報告分數 501 的百分位數是 50.%
報告分數 502 的百分位數是 51.%
報告分數 503 的百分位數是 51.%
報告分數 504 的百分位數是 52.%
報告分數 505 的百分位數是 52.%
……………………………………………………
報告分數 536 的百分位數是 69.%
報告分數 537 的百分位數是 70.%
……………………………………………………
報告分數 558 的百分位數是 79.%
報告分數 559 的百分位數是 80.%
……………………………………………………
報告分數 589 的百分位數是 89.%
報告分數 590 的百分位數是 90.%
……………………………………………………
報告分數 616 的百分位數是 95.%
報告分數 617 的百分位數是 95.%
……………………………………………………
報告分數 670 的百分位數是 99.%
……………………………………………………
報告分數 710 的百分位數是 99.%
如果通過標準是425,那么大約有14%的人無法通過。 但考慮到英語四級和英語六級的抽樣標準不同(英語六級只對五所頂尖大學的非英語專業學生開放),實際上英語六級的整體通過率肯定相差甚遠。低于86%。
忽略較小和較大的值(即x<338或x>662),只取百分位數在1%到99%之間的分布重新繪制分布圖,則有:
所以,除了終極學渣和學神之外,六級的分數分布還是比較平滑的。
同理,還可以計算出各子模塊得分的概率分布,進而可以計算出第四級情況。
所以千萬不要以為自己聽力損失120分或者130分就很好了......
適當的底部 2% 水平