Στατιστική μελέτη συχνότητας ονομάτων Ελληνίδων & Ελλήνων,
βασισμένη σε δείγμα ~97.072 ατόμων (Α.Σ.Ε.Π. 2008)
| # | Όνομα | Εμφανίσεις | Εκτίμηση / 10εκ. | 95% CI |
|---|
Ποια είναι τα πιο συνηθισμένα ονόματα Ελληνίδων και Ελλήνων; Η σελίδα αυτή επιχειρεί να απαντήσει στο ερώτημα αυτό μέσα από στατιστική ανάλυση δείγματος 97.072 ατόμων — πρόκειται, απ' όσο γνωρίζουμε, για ένα από τα μεγαλύτερα δείγματα που έχουν δημοσιευθεί στο διαδίκτυο για το θέμα αυτό (Απρίλιος 2009).
Πέραν της κατάταξης ονομάτων καθαυτής, η μελέτη αποσκοπεί και στην ανάδειξη ορισμένων στοιχειωδών στατιστικών ζητημάτων. Ερωτήματα που εκ πρώτης όψεως φαίνονται απλά, συχνά δεν επιδέχονται απάντηση τύπου «σωστό ή λάθος».
Οδηγίες ανάγνωσης του πίνακα. Τα ανδρικά ονόματα διακρίνονται από τα γυναικεία μέσω χρωματικής κωδικοποίησης. Η στήλη «Εμφανίσεις» καταγράφει τον αριθμό εμφανίσεων εκάστου ονόματος εντός του δείγματος. Η στήλη «Εκτίμηση / 10εκ.» αντιστοιχεί στον αναμενόμενο αριθμό φορέων του ονόματος εντός πληθυσμού 10.000.000 (υποθέτοντας 5 εκ. ανά φύλο· ο αμιγώς ελληνικός πληθυσμός υπολογίζονταν περί τα 10 εκ. το 2009, αφαιρουμένων των μεταναστών). Η στήλη «95% CI» δίνει το αντίστοιχο διάστημα εμπιστοσύνης, δηλαδή τον ελάχιστο και μέγιστο αναμενόμενο αριθμό ατόμων σε επίπεδο βεβαιότητας 95%.
Το δείγμα αντλήθηκε από τα στοιχεία 97.072 συμμετεχόντων σε διαγωνισμό του Α.Σ.Ε.Π. (φθινόπωρο 2008· δημοσίευση αποτελεσμάτων Μάρτιος 2009). Η ιστοσελίδα του Α.Σ.Ε.Π. δημοσίευσε τα αποτελέσματα σε αρχεία Excel, χωρισμένα σε 5–6 αλφαβητικά τμήματα (λόγω του ορίου 65.536 γραμμών ανά φύλλο). Τα τμήματα αυτά ενοποιήθηκαν σε ενιαίο αρχείο κειμένου· οι αθροίσεις πραγματοποιήθηκαν μέσω ειδικού λογισμικού.
Κατά πόσον είναι αντιπροσωπευτικό το δείγμα αυτό; Εφόσον το ενδιαφέρον εστιάζεται στα ονόματα Ελλήνων υπηκόων (και όχι μεταναστών), η απάντηση φαίνεται θετική: κατά κανόνα, μετανάστες δεν συμμετέχουν σε διαγωνισμούς πρόσληψης στο ελληνικό Δημόσιο. Εντοπίζονται, βεβαίως, ολιγάριθμα «μη τυπικά ελληνικά» ονόματα στον πίνακα (Έλληνες υπήκοοι μουσουλμανικής κουλτούρας ή με αλλοδαπό γονέα), πλην εμφανίζονται σε ελάχιστες συχνότητες. Σημειωτέον ότι αφαιρέθηκαν τα ονόματα γραμμένα σε λατινικούς χαρακτήρες (η ένταξή τους θα ανήγαγε το δείγμα σε 103.247 άτομα), καθώς και τα ονόματα μοναδικής εμφανίσεως· η συμπερίληψή τους θα οδηγούσε σε σχεδόν διπλασιασμό του πίνακα.
Η σημαντική υπεροχή γυναικών στο δείγμα (υπερδιπλάσιες σε σχέση με τους άνδρες) δεν αποτελεί έκπληξη: η εξασφάλιση που παρείχε, τουλάχιστον μέχρι το 2009, η θέση στο Δημόσιο προσέλκυε δυσανάλογα περισσότερες γυναίκες.
Ως προς τη μεθοδολογική σημασία αυτής της ανισοκατανομής: δεν είναι δόκιμη η άμεση σύγκριση εμφανίσεων μεταξύ ανδρικού και γυναικείου ονόματος εντός του δείγματος (π.χ. δεν έχει νόημα η δήλωση «οι Ελένες είναι περισσότερες από τους Γιώργηδες» βάσει αριθμών του δείγματος). Η σύγκριση μεταξύ φύλων καθίσταται δυνατή μόνο μέσω των εκτιμήσεων πληθυσμού: με βεβαιότητα 95%, ο ανώτατος αναμενόμενος αριθμός Ελενών (~302.000) υστερεί του κατώτατου αριθμού Γεωργίων (~511.000). Αντιθέτως, δεν δύναται να τεκμηριωθεί αν οι Γεώργιοι υπερτερούν αριθμητικά των Μαριών. Ονόματα του αυτού φύλου, φυσικά, επιτρέπεται να συγκρίνονται ελεύθερα ακόμη και εντός του δείγματος.