Tα fake news βρίσκονται στο επίκεντρο της επικαιρότητας τον τελευταίο καιρό – οπότε και σε εξέλιξη είναι οι προσπάθειες για την αντιμετώπισή τους.
Όπως αναφέρει το MIT News, σε αυτό το πλαίσιο, ερευνητές του Computer Science and Artificial Intelligence Lab (CSAIL) του ΜΙΤ και του Qatar Computing Research Institute (QCRI) ανέπτυξαν ένα σύστημα machine learning το οποίο επικεντρώνεται όχι μόνο στους μεμονωμένους ισχυρισμούς, αλλά στις πηγές τους, για τις οποίες καθορίζει εάν είναι ακριβείς και έγκυρες ή προκατειλημμένες.
«Αν μια ιστοσελίδα έχει δημοσιεύσει fake news στο παρελθόν, υπάρχει μια καλή πιθανότητα ότι θα το κάνει ξανά» λέει ο μεταδιδακτορικός Ραμί Μπαλί, lead author του σχετικού paper. «Εξετάζοντας αυτόματα δεδομένα για αυτά τα sites, ελπίζουμε πως το σύστημά μας μπορεί να βοηθήσει στο να εξακριβωθεί ποια είναι πιο πιθανόν να το κάνουν εξαρχής».
Σύμφωνα με τον Μπαλί, το σύστημα χρειάζεται μόνο περίπου 150 άρθρα για να διαπιστώσει με αξιοπιστία εάν μια πηγή ειδήσεων είναι έγκυρη- κάτι που σημαίνει πως μια τέτοια προσέγγιση θα μπορούσε να χρησιμοποιηθεί για τον εντοπισμό και την κατάδειξη ιστοσελίδων- πηγών fake news πριν αυτά εξαπλωθούν ευρύτερα.
Το σύστημα αποτελεί καρπό συνεργασίας μεταξύ επιστημόνων υπολογιστών του CSAIL του ΜΙΤ και του QCRI, που υπάγεται στο Hamad Bin Khalifa University στο Κατάρ. Οι ερευνητές σε πρώτη φάση πήραν δεδομένα από το Media Bias/Fact Check (MBFC), μια ιστοσελίδα με ανθρώπους fact-checkers, οι οποίοι αναλύουν την ακρίβεια/ εγκυρότητα και τα επίπεδα προκατάληψης άνω των 2.000 ενημερωτικών ιστοσελίδων, και από χαμηλού traffic «φάρμες» περιεχομένου. Στη συνέχεια έδωσαν αυτά τα στοιχεία σε έναν αλγόριθμο machine learning, προγραμματίζοντάς τον να καταχωρεί τις ενημερωτικές ιστοσελίδες με τον ίδιο τρόπο όπως το MBFC. Όταν του δινόταν μια νέα πηγή ειδήσεων, το σύστημα είχε επίπεδο ακριβείας 65% στο να διαπιστώσει εάν ήταν υψηλού, μεσαίου ή χαμηλού επιπέδου εγκυρότητας, και περίπου 70% ακρίβεια στο να διαπιστώσει εάν ήταν αριστερών, δεξιών ή μετριοπαθών τάσεων.
Σύμφωνα με τους ερευνητές, ο πιο αξιόπιστος τρόπος εντοπισμού των fake news και της προκατειλημμένης αναφοράς ειδήσεων ήταν η εξέταση των κοινών γλωσσικών χαρακτηριστικών στις ειδήσεις της πηγής, περιλαμβανομένων των επιπέδων συναισθήματος, πολυπλοκότητας και της δομής. Για παράδειγμα, οι ιστοσελίδες fake news διαπιστώθηκε πως ήταν πιο πιθανόν να χρησιμοποιήσουν «υπερβολική», υποκειμενική και συναισθηματική γλώσσα. Από άποψης προκαταλήψεων, τα «αριστερά» sites ήταν πιθανότερο να έχουν γλώσσα που σχετιζόταν με βλαπτικότητα/ φροντίδα και με δικαιοσύνη/ αμοιβαιότητα.
Ο Πρέσλαβ Νάκοφ, επιστήμονας του QCRI και ένας εκ των ερευνητών, τονίζει πως το σύστημα εξελίσσεται ακόμα, και ότι, ακόμα και με βελτιώσεις στα επίπεδα ακριβείας του, θα λειτουργούσε καλύτερα σε συνεργασία με «συμβατικούς», ανθρώπους fact-checkers.
Όπως αναφέρει το MIT News, σε αυτό το πλαίσιο, ερευνητές του Computer Science and Artificial Intelligence Lab (CSAIL) του ΜΙΤ και του Qatar Computing Research Institute (QCRI) ανέπτυξαν ένα σύστημα machine learning το οποίο επικεντρώνεται όχι μόνο στους μεμονωμένους ισχυρισμούς, αλλά στις πηγές τους, για τις οποίες καθορίζει εάν είναι ακριβείς και έγκυρες ή προκατειλημμένες.
«Αν μια ιστοσελίδα έχει δημοσιεύσει fake news στο παρελθόν, υπάρχει μια καλή πιθανότητα ότι θα το κάνει ξανά» λέει ο μεταδιδακτορικός Ραμί Μπαλί, lead author του σχετικού paper. «Εξετάζοντας αυτόματα δεδομένα για αυτά τα sites, ελπίζουμε πως το σύστημά μας μπορεί να βοηθήσει στο να εξακριβωθεί ποια είναι πιο πιθανόν να το κάνουν εξαρχής».
Σύμφωνα με τον Μπαλί, το σύστημα χρειάζεται μόνο περίπου 150 άρθρα για να διαπιστώσει με αξιοπιστία εάν μια πηγή ειδήσεων είναι έγκυρη- κάτι που σημαίνει πως μια τέτοια προσέγγιση θα μπορούσε να χρησιμοποιηθεί για τον εντοπισμό και την κατάδειξη ιστοσελίδων- πηγών fake news πριν αυτά εξαπλωθούν ευρύτερα.
Το σύστημα αποτελεί καρπό συνεργασίας μεταξύ επιστημόνων υπολογιστών του CSAIL του ΜΙΤ και του QCRI, που υπάγεται στο Hamad Bin Khalifa University στο Κατάρ. Οι ερευνητές σε πρώτη φάση πήραν δεδομένα από το Media Bias/Fact Check (MBFC), μια ιστοσελίδα με ανθρώπους fact-checkers, οι οποίοι αναλύουν την ακρίβεια/ εγκυρότητα και τα επίπεδα προκατάληψης άνω των 2.000 ενημερωτικών ιστοσελίδων, και από χαμηλού traffic «φάρμες» περιεχομένου. Στη συνέχεια έδωσαν αυτά τα στοιχεία σε έναν αλγόριθμο machine learning, προγραμματίζοντάς τον να καταχωρεί τις ενημερωτικές ιστοσελίδες με τον ίδιο τρόπο όπως το MBFC. Όταν του δινόταν μια νέα πηγή ειδήσεων, το σύστημα είχε επίπεδο ακριβείας 65% στο να διαπιστώσει εάν ήταν υψηλού, μεσαίου ή χαμηλού επιπέδου εγκυρότητας, και περίπου 70% ακρίβεια στο να διαπιστώσει εάν ήταν αριστερών, δεξιών ή μετριοπαθών τάσεων.
Σύμφωνα με τους ερευνητές, ο πιο αξιόπιστος τρόπος εντοπισμού των fake news και της προκατειλημμένης αναφοράς ειδήσεων ήταν η εξέταση των κοινών γλωσσικών χαρακτηριστικών στις ειδήσεις της πηγής, περιλαμβανομένων των επιπέδων συναισθήματος, πολυπλοκότητας και της δομής. Για παράδειγμα, οι ιστοσελίδες fake news διαπιστώθηκε πως ήταν πιο πιθανόν να χρησιμοποιήσουν «υπερβολική», υποκειμενική και συναισθηματική γλώσσα. Από άποψης προκαταλήψεων, τα «αριστερά» sites ήταν πιθανότερο να έχουν γλώσσα που σχετιζόταν με βλαπτικότητα/ φροντίδα και με δικαιοσύνη/ αμοιβαιότητα.
Ο Πρέσλαβ Νάκοφ, επιστήμονας του QCRI και ένας εκ των ερευνητών, τονίζει πως το σύστημα εξελίσσεται ακόμα, και ότι, ακόμα και με βελτιώσεις στα επίπεδα ακριβείας του, θα λειτουργούσε καλύτερα σε συνεργασία με «συμβατικούς», ανθρώπους fact-checkers.