Πόλεμος Πληροφοριών

Το AI του Facebook μπορεί να αναλύει μιμίδια, αλλά μπορεί να τα κατανοήσει; Η τεχνολογία Rosetta του Facebook αναλύει δισεκατομμύρια εικόνες που περιέχουν κείμενο, αλλά τα μιμίδια είναι πολύ περίπλοκα για τεχνητή νοημοσύνη. Δισεκατομμύρια κείμενα, φωτογραφίες και βίντεο ανεβαίνουν στα μέσα κοινωνικής δικτύωσης κάθε μέρα. Αυτός είναι ένας πλούτος πληροφοριών που οι ανθρώπινοι συντονιστές και οι ελεγκτές γεγονότων τους δεν μπορούν να διερευνήσουν, να ελέγξουν και να ελέγξουν πλήρως. Εταιρείες όπως το Facebook και το YouTube βασίζονται εδώ και πολύ καιρό στην τεχνητή νοημοσύνη για να κρατήσουν τα ανεπιθύμητα μηνύματα, τη βία, το κρίσιμο περιεχόμενο και την πορνογραφία από τις πλατφόρμες τους!

Κάτι σαν ένα κρίσιμο μιμίδιο χωρίς κείμενο μπορεί να είναι δύσκολο για τους υπερυπολογιστές και τους αλγόριθμούς τους να αναλυθούν και να επεξεργαστούν, καθώς αυτή η εργασία απαιτεί τον υπολογισμό πολλών διαφορετικών οπτικών στοιχείων ταυτόχρονα. Τα αυτοματοποιημένα συστήματα, τα λεγόμενα συστήματα bot, πρέπει να αναγνωρίζουν και να «διαβάζουν» τις λέξεις πάνω από τη φωτογραφία καθώς και να αναλύουν και να εκχωρούν την ίδια την εικόνα. Τα μιμίδια μπορούν επίσης να περιγραφούν ως περίπλοκα πολιτιστικά αντικείμενα που είναι δύσκολο να κατανοηθούν εκτός πλαισίου. Παρά τις προκλήσεις που θέτουν, όλες οι μεγάλες πλατφόρμες κοινωνικής δικτύωσης χρησιμοποιούν ήδη AI για τον έλεγχο των μιμιδίων, συμπεριλαμβανομένου του Facebook, το οποίο χρησιμοποιεί ένα εργαλείο που ονομάζεται Rosetta για να αναλύει φωτογραφίες και βίντεο που περιέχουν κείμενο και λεζάντες.

Σύμφωνα με το Facebook, η Rosetta χρησιμοποιείται ήδη για την αυτόματη ανίχνευση περιεχομένου που παραβιάζει τις οδηγίες ρητορικής μίσους. Με τη βοήθεια της Rosetta, το Facebook προσπαθεί να ελέγχει το περιεχόμενο των χρηστών, συμπεριλαμβανομένων φωτογραφιών και βίντεο και όχι μόνο αναρτήσεων που βασίζονται σε κείμενο. Η Rosetta υποστηρίζει τη διαδικασία κατά την οποία ελέγχεται αυτόματα εάν οι εικόνες και τα βίντεο που περιέχουν κείμενο έχουν προηγουμένως επισημανθεί ως "κρίσιμα". Η Rosetta συνδυάζει την τεχνολογία OCR (οπτική αναγνώριση χαρακτήρων) με άλλες τεχνικές μηχανικής εκμάθησης για να προβάλει, να επεξεργαστεί, να ταξινομήσει και να αντιστοιχίσει κείμενο μέσα και πάνω σε φωτογραφίες και βίντεο και στη συνέχεια να το αποθηκεύσει. Πρώτον, το OCR χρησιμοποιείται για να προσδιορίσει πού βρίσκεται το κείμενο σε ένα μιμίδιο ή ένα βίντεο. Αυτό τους επιτρέπει να μετασχηματίζουν γρήγορα δεδομένα και να χρησιμοποιούν τους «επιλογείς» τους για να αξιολογούν το περιεχόμενο.

Μόλις η Rosetta μάθει πού βρίσκονται οι λέξεις, το Facebook χρησιμοποιεί ένα νευρωνικό δίκτυο που μπορεί να κατανοήσει το κείμενο, τη μεταγραφή και το νόημά του. Αυτό το κείμενο μπορεί στη συνέχεια να περάσει από άλλα συστήματα, όπως ένα σύστημα που ελέγχει εάν το μιμίδιο είναι ένα ιογενές μήνυμα που έχει ήδη απομυθοποιηθεί σύμφωνα με τις οδηγίες τους. Οι προγραμματιστές και οι ερευνητές της Rosetta ισχυρίζονται ότι το εργαλείο μπορεί πλέον να εξάγει κείμενο από οποιαδήποτε εικόνα που ανεβάζεται δημόσια στο Facebook σε πραγματικό χρόνο και να αναγνωρίζει τα κείμενα καθώς και να «διαβάζει» τα αναγνωριστικά γλώσσας, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών, Γερμανικών και Αραβικών.

Η Rosetta μπορεί επίσης να αναλύσει εικόνες που περιέχουν κείμενο σε πολλές διαφορετικές μορφές, όπως φωτογραφίες από πινακίδες διαμαρτυρίας, μενού εστιατορίων, βιτρίνες καταστημάτων και άλλα. Ο Viswanath Sivakumar, μηχανικός λογισμικού στο Facebook που εργάζεται στο Rosetta, είπε σε ένα email ότι το εργαλείο λειτουργεί καλά τόσο για την αναγνώριση κειμένου σε ένα τοπίο όπως μια πινακίδα του δρόμου όσο και για μιμίδια - αλλά το τελευταίο είναι πιο δύσκολο. «Στο πλαίσιο του προληπτικού εντοπισμού ρητορικής μίσους και άλλου περιεχομένου που παραβιάζει τις πολιτικές, οι εικόνες σε στυλ μιμιδίων παρουσιάζουν την πιο περίπλοκη πρόκληση της τεχνητής νοημοσύνης», έγραψε.

Σε αντίθεση με τους ανθρώπους, μια τεχνητή νοημοσύνη συνήθως χρειάζεται επίσης να δει δεκάδες χιλιάδες παραδείγματα για να μάθει να ολοκληρώνει μια περίπλοκη εργασία, λέει ο Sivakumar. Αλλά τα μιμίδια δεν είναι απεριόριστα ελεγχόμενα, ακόμη και για το Facebook, και η συλλογή και αποθήκευση αρκετών παραδειγμάτων σε διαφορετικές γλώσσες και συναισθήματα μπορεί επίσης να αποδειχθεί δύσκολη. Η εύρεση μηνυμάτων υψηλής ποιότητας είναι μια διαρκής πρόκληση για την έρευνα της τεχνητής νοημοσύνης ευρύτερα. Τα δεδομένα συχνά πρέπει να επισημαίνονται με μη αυτόματο τρόπο και να αρχειοθετούνται προσεκτικά. Πολλές βάσεις δεδομένων προστατεύονται επίσης από πνευματικά δικαιώματα.

Προκειμένου να τροφοδοτήσει τη Rosetta με τα απαραίτητα δεδομένα και να εκπαιδεύσει τη χρησιμότητά της, το κείμενο, μαζί με τις λεζάντες και τις τοποθεσίες από τις οποίες δημοσιεύτηκαν, συνδυάζονται σε μια υπολογιστική διαδικασία. Με απλά λόγια, έχετε δημιουργήσει ένα πρόγραμμα για να δημιουργήσετε ακριβώς εκείνα τα παραδείγματα των οποίων το περιεχόμενο φαίνεται αμφισβητήσιμο. Αυτό σημαίνει ότι ολόκληρη η διαδικασία είναι αυτοματοποιημένη σε κάποιο βαθμό: ένα πρόγραμμα φτύνει αυτόματα τα μιμίδια και ένα άλλο προσπαθεί να τα αναλύσει. Η τεχνητή νοημοσύνη θα αντιμετωπίσει πολύ μεγάλες προκλήσεις. Για παράδειγμα, η Rosetta έρχεται αντιμέτωπη με γλώσσες όπως τα αραβικά, τα οποία διαβάζονται από τα δεξιά προς τα αριστερά, σε αντίθεση με άλλες γλώσσες όπως τα αγγλικά ή τα γερμανικά. Η Ροζέτα «διαβάζει» τα αραβικά ανάποδα και μετά το Facebook αντιστρέφει τους χαρακτήρες μετά την επεξεργασία. Αυτό το τέχνασμα λειτουργεί εκπληκτικά καλά και επιτρέπει ένα ενοποιημένο μοντέλο που λειτουργεί τόσο για γλώσσες από αριστερά προς τα δεξιά όσο και από δεξιά προς αριστερά.

Τα αυτοματοποιημένα συστήματα μπορεί να είναι εξαιρετικά χρήσιμα για τον έλεγχο περιεχομένου και τον έλεγχο γεγονότων, αλλά δεν είναι πάντα εύκολα. Για παράδειγμα, το WeChat χρησιμοποιεί δύο διαφορετικούς αλγόριθμους για να φιλτράρει τις εικόνες. Το πρώτο, ένα πρόγραμμα που βασίζεται σε OCR, φιλτράρει φωτογραφίες που περιέχουν κείμενο για απαγορευμένα θέματα, ενώ τα άλλα λογοκρίνουν εικόνες παρόμοιες με εκείνες σε μια μαύρη λίστα που πιθανότατα δημιουργήθηκε από την κινεζική κυβέρνηση. Μέσω των φίλτρων του WeChat, μπορείτε εύκολα να αφαιρέσετε τα χαρακτηριστικά μιας εικόνας, καθώς και τον χρωματισμό ή τον αλλαγμένο προσανατολισμό. Η Rossetta του Facebook είναι πολύπλοκη, αλλά μάλλον όχι τέλεια. Το σύστημα μπορεί να παρακαμφθεί από δυσανάγνωστο κείμενο ή παραμορφωμένες γραμματοσειρές. Όλοι οι αλγόριθμοι αναγνώρισης εικόνων είναι επίσης δυνητικά ευάλωτοι σε αντικρουόμενα παραδείγματα, ελαφρώς αλλοιωμένες εικόνες που φαίνονται ίδιες στους ανθρώπους αλλά προκαλούν σύγχυση σε μια τεχνητή νοημοσύνη.

Το Facebook και άλλες πλατφόρμες όπως το Twitter, το YouTube και το Reddit υφίστανται τεράστια πίεση για την αστυνόμευση ορισμένων τύπων περιεχομένου σε πολλές χώρες. Το 2018, η Ευρωπαϊκή Ένωση πρότεινε νέους νόμους που θα απαιτούσαν από τις εταιρείες μέσων κοινωνικής δικτύωσης να αφαιρούν τις τρομοκρατικές αναρτήσεις εντός μιας ώρας από την κοινοποίηση, διαφορετικά θα αντιμετωπίζουν πρόστιμα. Η Rosetta και άλλα παρόμοια αυτοματοποιημένα εργαλεία ήδη βοηθούν το Facebook και άλλες πλατφόρμες να συμμορφώνονται με παρόμοιους νόμους σε χώρες όπως η Γερμανία. Και γίνονται καλύτεροι στις δουλειές τους: Πριν από δύο χρόνια, ο Διευθύνων Σύμβουλος Mark Zuckerberg είπε ότι τα συστήματα AI του Facebook παρεμποδίζουν προληπτικά μόνο περίπου το μισό περιεχόμενο που αφαίρεσε η εταιρεία. Οι άνθρωποι πρέπει πρώτα να σημειώσουν τα υπόλοιπα. Σύμφωνα με το Facebook, τα εργαλεία τεχνητής νοημοσύνης του ανιχνεύουν σχεδόν το 100 τοις εκατό των ανεπιθύμητων μηνυμάτων που καταδικάζουν, καθώς και το 99,5 τοις εκατό του τρομοκρατικού περιεχομένου και το 86 τοις εκατό της γραφικής βίας. Άλλες πλατφόρμες όπως το YouTube έχουν σημειώσει παρόμοια επιτυχία με αυτοματοποιημένα συστήματα αναγνώρισης περιεχομένου.

Ωστόσο, αυτό δεν σημαίνει ότι συστήματα τεχνητής νοημοσύνης όπως η Rosetta είναι μια τέλεια λύση, ειδικά όταν πρόκειται για πιο λεπτές μορφές έκφρασης. Σε αντίθεση με ένα μενού εστιατορίου, μπορεί να είναι δύσκολο να αναλυθεί η σημασία ενός μιμιδίου χωρίς να γνωρίζουμε το πλαίσιο στο οποίο δημοσιεύτηκε. Γι' αυτό υπάρχουν ολόκληροι ιστότοποι που τα εξηγούν. Τα μιμίδια συχνά παρουσιάζουν εσωτερικά αστεία ή είναι πολύ συγκεκριμένα για μια συγκεκριμένη διαδικτυακή υποκουλτούρα και το ηθικό και ηθικό υπόβαθρό της. Και μια τεχνητή νοημοσύνη εξακολουθεί να μην είναι σε θέση να κατανοήσει ένα μιμίδιο ή ένα βίντεο όπως ένα άτομο. Προς το παρόν, το Facebook θα πρέπει ακόμα να βασίζεται στους ανθρώπινους συντονιστές και τους ελέγχους γεγονότων τους για να λάβουν αποφάσεις σχετικά με το αν θα αφαιρέσουν ένα μιμίδιο.

Μεταφραστικό άρθρο από το περιοδικό Wired 14.09.2018 Σεπτεμβρίου XNUMX

(μέσω Vale Rion)

Επειδή πάντα με ρωτούν ποιος είναι ο ευκολότερος τρόπος να επενδύσεις στο Bitcoin: με την εφαρμογή Ρελάι Μπορεί να γίνει σε λίγα μόνο βήματα και χωρίς περίπλοκη εγγραφή. Κανείς δεν έχει πρόσβαση στο Bitcoin σας εκτός από εσάς. Με τον κωδικό παραπομπής REL105548 Οι χρεώσεις σας θα μειωθούν κατά 0,5%.

Το "Dravens Tales from the Crypt" είναι μαγευτικό για πάνω από 15 χρόνια με ένα άγευστο μείγμα χιούμορ, σοβαρής δημοσιογραφίας - για τα τρέχοντα γεγονότα και ανισόρροπα ρεπορτάζ στην πολιτική του Τύπου - και ζόμπι, γαρνιρισμένα με πολλή τέχνη, διασκέδαση και πανκ ροκ. Ο Ντρέιβεν έχει μετατρέψει το χόμπι του σε μια δημοφιλή μάρκα που δεν μπορεί να ταξινομηθεί.

Το ιστολόγιό μου δεν σχεδιάστηκε ποτέ για να διαδίδει ειδήσεις, πόσο μάλλον να παίρνει πολιτική, αλλά με την επικαιρότητα δεν μπορώ παρά να συλλάβω πληροφορίες εδώ που κατά τα άλλα λογοκρίνονται σε όλα τα άλλα κανάλια. Γνωρίζω ότι η σελίδα σχεδιασμού μπορεί να μην φαίνεται "σοβαρή" σε πολλούς από αυτή την άποψη, αλλά δεν θα το αλλάξω αυτό για να ευχαριστήσω το "mainstream". Όποιος είναι ανοιχτός σε πληροφορίες που δεν συμμορφώνονται με το κράτος βλέπει το περιεχόμενο και όχι τη συσκευασία. Προσπάθησα αρκετά για να δώσω στους ανθρώπους πληροφορίες τα τελευταία 2 χρόνια, αλλά γρήγορα παρατήρησα ότι δεν έχει σημασία πώς είναι «πακεταρισμένο», αλλά ποια είναι η στάση του άλλου απέναντί του. Δεν θέλω να βάλω μέλι στο στόμα κανενός για να ανταποκριθώ στις προσδοκίες με κανέναν τρόπο, οπότε θα διατηρήσω αυτό το σχέδιο γιατί ελπίζω κάποια στιγμή να μπορέσω να σταματήσω αυτές τις πολιτικές δηλώσεις, γιατί δεν είναι ο στόχος μου να συνεχίσω έτσι για πάντα Αφήνω στον καθένα πώς θα το αντιμετωπίσει. Είστε ευπρόσδεκτοι να αντιγράψετε και να διανείμετε το περιεχόμενο, το ιστολόγιό μου ήταν πάντα κάτω από το Άδεια WTFPL.

Δυσκολεύομαι να περιγράψω τι κάνω εδώ, το DravensTales έχει γίνει πολιτιστικό ιστολόγιο, μουσικό ιστολόγιο, blog σοκ, blog τεχνολογίας, blog τρόμου, διασκεδαστικό blog, blog για αντικείμενα που βρέθηκαν στον Ιστό, περίεργο Διαδίκτυο, blog σκουπιδιών, blog τέχνης, θερμοσίφωνας, zeitgeist blog με την πάροδο των ετών , Scrap blog και αρπάξτε το blog bag. Όλα όσα είναι σωστά ... - και όμως όχι. Το κύριο επίκεντρο του ιστολογίου είναι η σύγχρονη τέχνη, με την ευρύτερη έννοια της λέξης.

Για να διασφαλίσετε τη λειτουργία του ιστότοπου, είστε ευπρόσδεκτοι Κάντε μια δωρεά μέσω πιστωτικής κάρτας, Paypal, Google Pay, Apple Pay ή πάγιας εντολής/τραπεζικού λογαριασμού. Ευχαριστώ πολύ όλους τους αναγνώστες και τους υποστηρικτές αυτού του ιστολογίου!