Grundlegendes zu skalierten Ergebnissen bei standardisierten Tests

Skalierte Ergebnisse sind eine Art Prüfungsergebnis. Sie werden häufig von Testunternehmen verwendet, die Prüfungen mit hohen Einsätzen durchführen, z. Zertifizierung und Lizenzprüfungen. Skalierte Ergebnisse werden auch für K-12 Common Core-Tests und andere Prüfungen verwendet, mit denen die Fähigkeiten der Schüler und der Lernfortschritt bewertet werden.

Raw Scores vs. Skalierte Scores

Der erste Schritt zum Verständnis skalierter Scores besteht darin, zu lernen, wie sie sich von Roh-Scores unterscheiden. Eine rohe Punktzahl gibt die Anzahl der Prüfungsfragen an, die Sie richtig beantworten. Wenn eine Prüfung beispielsweise 100 Fragen enthält und Sie 80 davon richtig beantworten, beträgt Ihre Rohpunktzahl 80. Ihre prozentual korrekte Punktzahl, bei der es sich um eine Art Rohpunktzahl handelt, beträgt 80%, und Ihre Klasse ist ein B-.

Eine skalierte Bewertung ist eine Rohbewertung, die angepasst und in eine standardisierte Skala umgewandelt wurde. Wenn Ihre Rohpunktzahl 80 beträgt (weil Sie 80 von 100 Fragen richtig gestellt haben), wird diese Punktzahl angepasst und in eine skalierte Punktzahl umgewandelt. Rohwerte können konvertiert werden

instagram viewer

linear oder nichtlinear.

Beispiel für eine skalierte Punktzahl

Das HANDLUNG ist ein Beispiel für eine Prüfung, bei der mithilfe der linearen Transformation Rohwerte in skalierte Werte umgewandelt werden. Das folgende Konversationsdiagramm zeigt, wie Rohwerte aus jedem Abschnitt der ACT in skalierte Werte umgewandelt werden.

Raw Score Englisch	Raw Score Math	Raw Score Reading	Raw Score Science	Skalierte Punktzahl
75	60	40	40	36
72-74	58-59	39	39	35
71	57	38	38	34
70	55-56	37	37	33
68-69	54	35-36	-	32
67	52-53	34	36	31
66	50-51	33	35	30
65	48-49	32	34	29
63-64	45-47	31	33	28
62	43-44	30	32	27
60-61	40-42	29	30-31	26
58-59	38-39	28	28-29	25
56-57	36-37	27	26-27	24
53-55	34-35	25-26	24-25	23
51-52	32-33	24	22-23	22
48-50	30-31	22-23	21	21
45-47	29	21	19-20	20
43-44	27-28	19-20	17-18	19
41-42	24-26	18	16	18
39-40	21-23	17	14-15	17
36-38	17-20	15-16	13	16
32-35	13-16	14	12	15
29-31	11-12	12-13	11	14
27-28	8-10	11	10	13
25-26	7	9-10	9	12
23-24	5-6	8	8	11
20-22	4	6-7	7	10
18-19	-	-	5-6	9
15-17	3	5	-	8
12-14	-	4	4	7
10-11	2	3	3	6
8-9	-	-	2	5
6-7	1	2	-	4
4-5	-	-	1	3
2-3	-	1	-	2
0-1	0	0	0	1

Quelle: ACT.org.

Der Gleichstellungsprozess

Der Skalierungsprozess erstellt eine Basisskala, die als Referenz für einen anderen Prozess dient, der als Gleichsetzen bezeichnet wird. Der Gleichstellungsprozess ist erforderlich, um Unterschiede zwischen mehreren Versionen desselben Tests zu berücksichtigen.

Obwohl Testhersteller versuchen, den Schwierigkeitsgrad eines Tests von einer Version zur nächsten gleich zu halten, sind Unterschiede unvermeidlich. Durch Gleichsetzen kann der Testhersteller die Ergebnisse statistisch so anpassen, dass die durchschnittliche Leistung der Version erreicht wird Einer der Tests entspricht der durchschnittlichen Leistung in Version zwei des Tests, Version drei des Tests und so weiter auf.

Nach dem Skalieren und Gleichsetzen sollten skalierte Scores austauschbar und leicht vergleichbar sein, unabhängig davon, welche Version des Tests durchgeführt wurde.

Gleiches Beispiel

Schauen wir uns ein Beispiel an, um zu sehen, wie sich der Gleichstellungsprozess auf skalierte Scores bei standardisierten Tests auswirken kann. Stellen Sie sich vor, Sie und ein Freund nehmen das SAT. Sie werden beide die Prüfung im selben Testzentrum ablegen, aber Sie werden den Test im Januar ablegen, und Ihr Freund wird den Test im Februar ablegen. Sie haben unterschiedliche Testdaten und es gibt keine Garantie dafür, dass Sie beide dieselbe Version des SAT verwenden. Möglicherweise sehen Sie eine Form des Tests, während Ihr Freund eine andere sieht. Obwohl beide Tests ähnliche Inhalte haben, sind die Fragen nicht genau gleich.

Nach dem SAT kommen Sie und Ihr Freund zusammen und vergleichen Ihre Ergebnisse. Sie haben beide eine rohe Punktzahl von 50 in der Mathe-Sektion, aber Ihre skalierte Punktzahl beträgt 710 und die skalierte Punktzahl Ihres Freundes beträgt 700. Ihr Kumpel fragt sich, was passiert ist, da Sie beide die gleiche Anzahl von Fragen richtig gestellt haben. Aber die Erklärung ist ziemlich einfach; Sie haben jeweils eine andere Version des Tests durchgeführt, und Ihre Version war schwieriger als seine. Um die gleiche skalierte Punktzahl für den SAT zu erhalten, hätte er mehr Fragen richtig beantworten müssen als Sie.

Testhersteller, die einen Gleichstellungsprozess verwenden, verwenden eine andere Formel, um eine eindeutige Skala für jede Version der Prüfung zu erstellen. Dies bedeutet, dass es für jede Version der Prüfung kein einziges Umrechnungsdiagramm für Rohdaten gibt. Aus diesem Grund wurde in unserem vorherigen Beispiel eine Rohbewertung von 50 an einem Tag in 710 und an einem anderen Tag in 700 umgewandelt. Denken Sie daran, wenn Sie Übungstests durchführen und Conversion-Diagramme verwenden, um Ihre Rohbewertung in eine skalierte Bewertung umzuwandeln.

Zweck der skalierten Scores

Rohwerte sind definitiv einfacher zu berechnen als skalierte Werte. Testunternehmen möchten jedoch sicherstellen, dass die Testergebnisse fair und genau verglichen werden können, selbst wenn die Testteilnehmer an verschiedenen Daten unterschiedliche Versionen oder Formen des Tests verwenden. Skalierte Ergebnisse ermöglichen genaue Vergleiche und stellen sicher, dass Personen, die einen schwierigeren Test absolviert haben, nicht bestraft werden und Personen, die einen weniger schwierigen Test absolviert haben, keinen unfairen Vorteil erhalten.