Κλασική θεωρία δοκιμών

Κλασική θεωρία δοκιμών / Πειραματική ψυχολογία

Μια δοκιμή είναι α επιστημονικό όργανο στο μέτρο που μετρά αυτό που προτίθεται, δηλαδή είναι έγκυρο και μετρά καλά, δηλαδή είναι ακριβές ή αξιόπιστο. Εάν βρούμε ένα εργαλείο στο οποίο δεν μπορούμε να εμπιστευτούμε τα μέτρα που παρέχουν, αφού ποικίλουν από καιρό σε καιρό όταν μετράμε το ίδιο αντικείμενο τότε θα πούμε ότι δεν είναι αξιόπιστο. Ένα όργανο μέτρησης σωστά κάτι, πρέπει να είναι ακριβές, γιατί αλλιώς, μετράτε τι μετράτε, μετράτε λάθος. Επομένως, η ακρίβεια είναι μια απαραίτητη αλλά όχι επαρκής συνθήκη. Επιπλέον, πρέπει να είναι έγκυρη, δηλαδή, αυτό που μετρά με ακρίβεια θα είναι αυτό που πρόκειται να μετρήσει, και τίποτα άλλο.

Μπορεί επίσης να σας ενδιαφέρει: Θεωρία Αντίδρασης Αντικειμένου - Εφαρμογές και Δοκιμές

Αξιοπιστία:

Απόλυτη και σχετική αξιοπιστία: Μπορούμε να αντιμετωπίσουμε το πρόβλημα της αξιοπιστίας μιας δοκιμής με δύο διαφορετικούς τρόπους, αν και στο βάθος συμπίπτουν.

Αξιοπιστία ως ανακρίβεια των μετρήσεων: Όταν ένα υποκείμενο ανταποκρίνεται σε μια δοκιμή, αποκτά εμπειρικό αποτέλεσμα, το οποίο επηρεάζεται από ένα σφάλμα. Αν δεν υπήρχε λάθος, το θέμα θα έλαβε το πραγματικό του σκορ. Η δοκιμή είναι ασαφής επειδή η εμπειρική βαθμολογία δεν ταιριάζει με την πραγματική πραγματική βαθμολογία. Αυτή η διαφορά μεταξύ των δύο βαθμολογιών είναι το σφάλμα δειγματοληψίας, το σφάλμα μέτρησης. Το τυπικό σφάλμα μέτρησης θα είναι η τυπική απόκλιση των σφαλμάτων μέτρησης. Το τυπικό σφάλμα μέτρησης υποδηλώνει την απόλυτη ακρίβεια της δοκιμής, δεδομένου ότι επιτρέπει την εκτίμηση της διαφοράς μεταξύ της ληφθείσας μέτρησης και εκείνης που θα επιτευχθεί αν δεν υπήρχε σφάλμα.

Η αξιοπιστία ως σταθερότητα των μετρήσεων: Μια δοκιμή θα είναι πιο αξιόπιστη όσο πιο σταθερά ή σταθερά τα αποτελέσματα που παρέχει όταν επαναλαμβάνεται. Όσο πιο σταθερά είναι τα αποτελέσματα σε δύο περιπτώσεις, τόσο μεγαλύτερη είναι η συσχέτιση μεταξύ τους. Αυτή η συσχέτιση ονομάζεται συντελεστής αξιοπιστίας. Αυτό μας εκφράζει όχι το ποσό του σφάλματος, αλλά τη συνοχή της δοκιμής με τον εαυτό της και τη σταθερότητα των πληροφοριών που προσφέρει. Το συντελεστής αξιοπιστίας εκφράζει τη σχετική αξιοπιστία της δοκιμής.

Ο συντελεστής αξιοπιστίας και ο δείκτης αξιοπιστίας: - Ο συντελεστής αξιοπιστίας μιας δοκιμής είναι η συσχέτιση της δοκιμής με την ίδια, που λαμβάνεται για παράδειγμα σε δύο παράλληλες μορφές: rxx. - Ο δείκτης ακριβείας είναι η εμπειρική συσχέτιση μεταξύ των αποτελεσμάτων των τεστ και αληθινή αποτελέσματα: RXV Το ποσοστό ακρίβειας θα είναι πάντα μεγαλύτερη από το συντελεστή αξιοπιστίας Για τον προσδιορισμό του συντελεστή αξιοπιστίας της σημείωσης τρεις κλασικές μεθόδους:

  • Βρίσκοντας τη συσχέτιση μεταξύ της δοκιμής και η επανάληψη: Η μέθοδος της επανάληψης ή επαναληπτικών μετρήσεων μέθοδο: Συνίσταται εφαρμόζοντας την ίδια δοκιμή η ίδια ομάδα δύο φορές και ο συσχετισμός υπολογίζεται μεταξύ των δύο συνόλων των βαθμολογιών. Αυτή η συσχέτιση είναι ο συντελεστής αξιοπιστίας. Αυτή η μέθοδος συνήθως δίνει έναν υψηλότερο συντελεστή αξιοπιστίας από εκείνους που λαμβάνονται από άλλες διαδικασίες και μπορεί να μολυνθεί από παράγοντες που προκαλούν ανησυχία.
  • Βρείτε τη συσχέτιση μεταξύ δύο παράλληλων μορφών της εξέτασης: Η μέθοδος των παράλληλων μορφών: Προετοιμάστε δύο παράλληλες μορφές της ίδιας δοκιμής, δηλαδή δύο ισοδύναμες μορφές που δίνουν τις ίδιες πληροφορίες και ισχύουν για την ίδια ομάδα θεμάτων. Ο συσχετισμός μεταξύ των δύο μορφών είναι ο συντελεστής αξιοπιστίας. Με αυτή τη μέθοδο, μη επαναλαμβάνοντας την ίδια δοκιμή, αποφεύγονται οι ανησυχητικές πηγές αξιοπιστίας των δοκιμών.
  • Βρείτε τη συσχέτιση μεταξύ δύο παράλληλων ημίσεων της δοκιμής: Η μέθοδος των δύο ημίσεων: Η δοκιμή διαιρείται σε δύο ισοδύναμα μισά και η συσχέτιση μεταξύ τους βρίσκεται. Είναι η προτιμώμενη μέθοδος, αφού είναι απλή και αγνοεί τους περιορισμούς των προηγούμενων διαδικασιών. Μπορείτε να επιλέξετε τα περίεργα στοιχεία της δοκιμασίας, να αποτελέσετε το ήμισυ και τα ίσια στοιχεία να αποτελέσετε το άλλο.

Ο συντελεστής αξιοπιστίας και ο συσχετισμός μεταξύ παράλληλων δοκιμών

Το συντελεστής αξιοπιστίας μιας δοκιμής δείχνει το ποσοστό ότι η πραγματική διακύμανση είναι της εμπειρικής διακύμανσης: graphic33 Ο συντελεστής αξιοπιστίας μιας δοκιμής κυμαίνεται μεταξύ 0 και 1. Για παράδειγμα: εάν η συσχέτιση μεταξύ δύο παράλληλων δοκιμών είναι rxx´ = 0.80, σημαίνει ότι το 80% της διακύμανσης της δοκιμασίας οφείλεται στο πραγματικό μέτρο και το υπόλοιπο, δηλαδή το 20% της διακύμανσης της δοκιμασίας, οφείλεται στο σφάλμα. Το δείκτη αξιοπιστίας μιας δοκιμής είναι η συσχέτιση μεταξύ των εμπειρικών της βαθμολογιών και του πραγματικού δείκτη αξιοπιστίας της βαθμολογίας = Ο δείκτης αξιοπιστίας είναι ίσος με την τετραγωνική ρίζα του συντελεστή αξιοπιστίας

Αφού έχουν αναπτυχθεί δύο παράλληλες μορφές δοκιμής, εφαρμόζεται η διαδικασία ανάλυσης διακύμανσης για να ελεγχθεί η ομοιογένεια των διακυμάνσεων και η διαφορά μεταξύ των μέτρων. Εάν διακυμάνσεις είναι ομοιογενή, η διαφορά μεταξύ των μέσων δεν είναι σημαντική και οι δύο μορφές είναι κατασκευασμένα με τον ίδιο αριθμό στοιχείων του ίδιου τύπου και ψυχολογική περιεχόμενο, μπορεί να ειπωθεί ότι είναι παράλληλες. Αν όχι, πρέπει να τα μεταρρυθμίσετε μέχρι να είναι. Η έλλειψη αξιοπιστίας προσδιορίζεται με την τιμή rxx´= 0 4.- Το τυπικό σφάλμα μέτρησης: Η διαφορά μεταξύ της εμπειρικής και της πραγματικής βαθμολογίας είναι το τυχαίο σφάλμα, που ονομάζεται σφάλμα μέτρησης. Η τυπική απόκλιση των σφαλμάτων μέτρησης ονομάζεται τυπικό σφάλμα μέτρησης. Το τυπικό σφάλμα μέτρησης επιτρέπει να γίνονται εκτιμήσεις για την απόλυτη αξιοπιστία της δοκιμής, δηλαδή για να εκτιμηθεί πόσο σφάλμα μέτρησης επηρεάζει μια βαθμολογία.

Αξιοπιστία και μήκος: Η διάρκεια της δοκιμής αναφέρεται στον αριθμό των στοιχείων της. Η αξιοπιστία εξαρτάται από αυτό το μήκος. Εάν μια δοκιμή αποτελείται από τρία στοιχεία, ένα άτομο μπορεί να πάρει μια βαθμολογία 1 και σε άλλο, ή με ένα παράλληλο τρόπο, ένα σκορ

Από τη μία φορά στην άλλη, το σκορ ποικίλλει κατά ένα σημείο. ένα σημείο πάνω από τρία είναι μια διακύμανση 33%, μια μεγάλη διακύμανση. Εάν τα άτομα αποκτήσουν τυχαίες παραλλαγές αυτού του τύπου, η συσχέτιση της δοκιμής με την ίδια ή με τις δύο παράλληλες μορφές της δοκιμής θα μειωθεί σημαντικά και δεν μπορεί να είναι υψηλή. Αν η δοκιμασία είναι πολύ μεγαλύτερη, αν έχετε, για παράδειγμα, 100 στοιχεία, ένα θέμα μπορεί να πάρει 70 μονάδες σε μία περίπτωση και 67 σε παράλληλη βάση. Από το ένα στο άλλο έχει αλλάξει 3 πόντους. είναι σχετικά μικρή διακύμανση σε σχέση με το συνολικό τεστ, συγκεκριμένα το 3%. Αυτές οι μικρές τυχαίες αλλαγές αυτού του μεγέθους, οι οποίες συμβαίνουν στις βαθμολογίες των υποκειμένων, που μετακινούνται από μια μορφή σε παράλληλες, οι σχετικά ασήμαντη, δεν μειώνονται όσο πριν από την συσχέτιση μεταξύ των δύο.

Ο συντελεστής αξιοπιστίας θα είναι πολύ υψηλότερος από ό, τι στην προηγούμενη περίπτωση. Η εξίσωση Spearman-Brown εκφράζει τη σχέση μεταξύ αξιοπιστίας και μήκους. Η ακρίβεια μιας δοκιμής είναι μηδέν όταν το μήκος είναι 0 και αυξάνεται όσο αυξάνεται το μήκος. Αν και η αύξηση είναι σχετικά μικρότερη καθώς το μήκος του τμήματος είναι μεγαλύτερο. Αυτό σημαίνει ότι η ακρίβεια μεγαλώνει πολύ στην αρχή και σχετικά λιγότερο αργότερα. Όταν το μήκος τείνει στο άπειρο, ο συντελεστής αξιοπιστίας τείνει να

Με την αύξηση της διάρκειας μιας δοκιμής, η ακρίβειά της αυξάνεται επειδή αυξάνει την πραγματική διακύμανση με ρυθμό υψηλότερο από τη διακύμανση σφάλματος. Αυτό σημαίνει ότι η ακρίβεια της δοκιμής αυξάνεται επειδή μειώνεται το ποσοστό διακύμανσης που οφείλεται στο σφάλμα. Ο τύπος του Rulon, καθώς και ο τύπος των Flanagan και Guttman, είναι ιδιαίτερα εφαρμόσιμοι κατά τον υπολογισμό του συντελεστή αξιοπιστίας με τη μέθοδο των δύο μισών. Αυτοί είναι οι τύποι που χρησιμοποιούνται για τον υπολογισμό του συντελεστή αξιοπιστίας.

Αξιοπιστία και συνέπεια: Ο συντελεστής αξιοπιστίας μπορεί επίσης να βρεθεί με άλλο τρόπο, είναι ο λεγόμενος άλφα συντελεστή o συντελεστής γενικευσιμότητας ή αντιπροσωπευτικότητας (Cronbach). Αυτός ο συντελεστής άλφα υποδεικνύει την ακρίβεια με την οποία ορισμένα στοιχεία μετρούν μια πτυχή της προσωπικότητας ή της συμπεριφοράς. Μπορεί να ερμηνευτεί ως: Μια εκτίμηση της μέσης συσχέτισης όλων των πιθανών στοιχείων σε μια συγκεκριμένη πλευρά. Μέτρο της ακρίβειας της δοκιμής ανάλογα με τη συνοχή ή την εσωτερική της συνοχή (αλληλεξάρτηση μεταξύ των στοιχείων της, σε ποιο βαθμό τα στοιχεία δοκιμής μετρούν όλα αυτά) και το μήκος της. Υποδεικνύοντας την αντιπροσωπευτικότητα της δοκιμής, δηλαδή το ποσό στο οποίο το δείγμα των αντικειμένων που την συνθέτει είναι αντιπροσωπευτικό του πληθυσμού πιθανών αντικειμένων του ίδιου τύπου και ψυχολογικού περιεχομένου. Το άλφα συντελεστή αντικατοπτρίζει κυρίως δύο βασικές έννοιες στην ακρίβεια ενός τεστ: 1. Η αλληλεξάρτηση μεταξύ των στοιχείων του: ο βαθμός στον οποίο όλα μετράνε το ίδιο πράγμα.

Η διάρκεια της δοκιμής: όταν αυξάνεται ο αριθμός των περιπτώσεων ενός δείγματος και αν εξαλειφθούν τα συστηματικά σφάλματα, το δείγμα αντιπροσωπεύει τον πληθυσμό καλύτερο από ότι εξάγεται και είναι πιο απίθανο το τυχαίο σφάλμα. Εάν τα αντικείμενα δοκιμής είναι διχοτομική (είτε 1 ή 0, συμφωνία ή διαφωνία, κλπ), η εξίσωση συντελεστής άλφα απλοποιείται, με αποτέλεσμα εξισώσεις Kuder-Richardson (KR20 και KR21). Δεδομένου ενός ορισμένου αριθμού στοιχείων, μια δοκιμή θα είναι πιο αξιόπιστη, όταν είναι πιο ομοιογενής. Ο συντελεστής alpha μας λέει την αξιοπιστία καθώς αντιπροσωπεύει την ομοιογένεια και τη συνέπεια ή την εσωτερική συνοχή των στοιχείων μιας δοκιμασίας.

Πρότυπα και κριτήρια αξιοπιστίας

Σύμφωνα με το μοντέλο του δείγματος χώρου αντικειμένων, ο στόχος της δοκιμής είναι να εκτιμηθεί το μέτρο που θα λαμβανόταν εάν χρησιμοποιήθηκαν όλα τα αντικείμενα του χώρου δείγματος. Αυτό το μέτρο θα είναι το πραγματικό σκορ, στο οποίο οι πραγματικές μετρήσεις προσεγγίζουν περισσότερο ή λιγότερο. Ανάλογα με το βαθμό στον οποίο ένα δείγμα αντικειμένων συσχετίζεται με τις πραγματικές βαθμολογίες, η δοκιμή είναι περισσότερο ή λιγότερο αξιόπιστη. Σε αυτό το μοντέλο είναι κεντρική μήτρα συσχετισμού μεταξύ όλων των στοιχείων στο μοντέλο δειγματικό χώρο muestral.Este επιμένει πιο άμεσα στην εσωτερική συνοχή, και στο βαθμό που επιτυγχάνεται εξασφαλίζει έμμεσα σταθερότητα.

Το γραμμικό μοντέλο των παράλληλων δοκιμών επιμένει στην σταθερότητα των βαθμολογιών, και στο βαθμό που η σταθερότητα επιτυγχάνεται εμμέσως ευνοεί εσωτερική συνοχή. Αν εφαρμόσουμε ένα τεστ για τη διάγνωση και μεμονωμένες προβλέψεις, ο συντελεστής αξιοπιστίας του 0,90 θα πρέπει να είναι επάνω. Στις προβλέψεις και τις συλλογικές ταξινομήσεις, δεν είναι τόσο η απαίτηση, αν και δεν είναι βολικό να ξεφύγουμε πολύ από 0'90 έως 0'80.

Μερικές φορές σε κάποιο είδος των εξετάσεων, όπως η προσωπικότητα, είναι δύσκολο να επιτευχθεί αναλογία πάνω από 0,70. Εάν οι παράλληλες μορφές, ή παράλληλη μισά εφαρμόζεται, μετά από μια περισσότερο ή λιγότερο μεγάλες διαστήματος, οι τυχαία σφάλματα μπορεί να είναι πιο πολυάριθμες από εκείνα που επηρεάζουν το συντελεστή άλφα. Αυτό συμβαίνει επειδή αυτό που μειώνει τον συσχετισμό δεν είναι μόνο τα τυχαία σφάλματα που είναι εγγενή στη δοκιμή και σε μία μόνο περίπτωση, τα οποία είναι εκείνα που λαμβάνουν υπόψη το συντελεστή άλφα, αλλά και επηρεάζουν όλα τα λάθη που μπορεί να προέλθουν από τις δύο διαφορετικές καταστάσεις , η οποία μπορεί να διαφέρει σε πολλές λεπτομέρειες. Επομένως, ο συντελεστής άλφα είναι συνήθως μεγαλύτερος από τους άλλους συντελεστές.

Εκτός από το συντελεστή που βρέθηκαν από επαναλαμβάνοντας την ίδια δοκιμή όπως το πιο πιθανό ότι τυχαία σφάλματα της πρώτης αίτησης στη δεύτερη επανάληψη, και αντί να μειώνεται η συσχέτιση μεταξύ τόσο της αύξησης. Πρέπει να διασφαλιστεί ότι η δεύτερη εφαρμογή είναι εντελώς ανεξάρτητη από την πρώτη. Εάν το επιτύχουμε αυτό, θα είναι η πιο εύκολη και φθηνότερη μέθοδος και θα είναι σκόπιμη όταν προσπαθείτε να εκτιμήσετε τη σταθερότητα των βαθμολογιών, ειδικά σε μεγάλες χρονικές περιόδους και με πολύπλοκες δοκιμές. > Επόμενο: Ισχύς των δοκιμών

Αυτό το άρθρο είναι καθαρά ενημερωτικό, στην ηλεκτρονική ψυχολογία δεν έχουμε την ικανότητα να κάνουμε μια διάγνωση ή να προτείνουμε μια θεραπεία. Σας προσκαλούμε να πάτε σε ψυχολόγο για να αντιμετωπίσετε την περίπτωσή σας ειδικότερα.

Αν θέλετε να διαβάσετε περισσότερα άρθρα παρόμοια με Κλασική θεωρία δοκιμών, Σας συνιστούμε να εισάγετε την κατηγορία της Πειραματικής Ψυχολογίας.