Η τεχνητή νοημοσύνη μπορεί γρήγορα να αποκαλύψει νέα φυσική, αλλά έχει μια εκπληκτική σύλληψη

Η τεχνητή νοημοσύνη παίζει ήδη σημαντικό ρόλο βοηθώντας τους κοσμολόγους να μελετήσουν το σύμπαν. Τώρα, νέα έρευνα δείχνει ότι μια τεχνική μηχανικής μάθησης που ονομάζεται μάθηση μεταφοράς θα μπορούσε να κάνει την αναζήτηση νέας φυσικής πολύ πιο γρήγορη και λιγότερο δαπανηρή. Ωστόσο, η έρευνα αποκάλυψε επίσης ένα εκπληκτικό μειονέκτημα: η τεχνητή νοημοσύνη μερικές φορές μπορεί να εξαρτάται τόσο πολύ από αυτά που έχει ήδη μάθει που δυσκολεύεται να αναγνωρίσει οτιδήποτε πραγματικά νέο.

Έρευνα, που δημοσιεύτηκε Journal of Cosmology and Astroparticle Physics (JCAP), εξετάστε πώς η μάθηση μεταφοράς μπορεί να βοηθήσει τους ερευνητές να διερευνήσουν θεωρίες που υπερβαίνουν το τυπικό κοσμολογικό μοντέλο.

Η τεχνητή νοημοσύνη και η ανακάλυψη της νέας φυσικής

Το τρέχον πρότυπο μοντέλο κοσμολογίας, γνωστό ως ΛCDM, εξηγεί με επιτυχία πολλές ιδιότητες μεγάλης κλίμακας του Σύμπαντος, συμπεριλαμβανομένης της διαστολής του και της κατανομής των γαλαξιών. Ωστόσο, οι επιστήμονες πιστεύουν ότι το μοντέλο δεν είναι η τελική απάντηση.

Πρόσφατες παρατηρήσεις έχουν εγείρει ερωτήματα που θα μπορούσαν να οδηγήσουν σε νέα φυσική, συμπεριλαμβανομένων των ογκωδών νετρίνων, της αλλοιωμένης βαρύτητας και των επιπτώσεων της εξελισσόμενης σκοτεινής ενέργειας. Η διερεύνηση αυτών των δυνατοτήτων απαιτεί από τους ερευνητές να δημιουργήσουν έναν μεγάλο αριθμό λεπτομερών προσομοιώσεων υπολογιστή, καθεμία από τις οποίες αντιπροσωπεύει ένα εικονικό σύμπαν κατασκευασμένο χρησιμοποιώντας διαφορετικές φυσικές υποθέσεις.

Η δημιουργία αυτών των προσομοιώσεων είναι υπολογιστικά δαπανηρή και συχνά απαιτεί σημαντική υπολογιστική ισχύ.

Χρήση μάθησης μεταφοράς για μείωση του κόστους προσομοίωσης

Οι ερευνητές έχουν διερευνήσει εάν η μάθηση με μεταφορά μπορεί να κάνει αυτή τη διαδικασία πιο αποτελεσματική.

Η μάθηση μεταφοράς επιτρέπει σε ένα σύστημα τεχνητής νοημοσύνης να εφαρμόζει τη γνώση που αποκτά από μια εργασία σε μια άλλη σχετική εργασία. Αντί να εκπαιδεύσει πλήρως ένα νευρωνικό δίκτυο στις πιο περίπλοκες και υπολογιστικά ακριβές προσομοιώσεις, η ομάδα το εκπαίδευσε αρχικά σε απλούστερες προσομοιώσεις βασισμένες στο ΛCDM. Αυτή η αρχική φάση, γνωστή ως προεκπαίδευση, ακολουθήθηκε στη συνέχεια από πρόσθετη εκπαίδευση χρησιμοποιώντας πιο εξελιγμένα μοντέλα που ενδεχομένως περιλάμβαναν νέα φυσική.

«Είναι βασικά μια συντόμευση», εξηγεί ο συν-συγγραφέας της μελέτης Adrian Baer, ​​κοσμολόγος στο Ινστιτούτο Flatiron και στο Πανεπιστήμιο του Πρίνστον. “Συνήθως οι άνθρωποι εκπαιδεύουν την τεχνητή νοημοσύνη απευθείας στις πιο ακριβές υπολογιστικές προσομοιώσεις. Αυτό που κάνουμε είναι πρώτα να χρησιμοποιήσουμε απλούστερες και λιγότερο δαπανηρές προσομοιώσεις ΛCDM για να δώσουμε στο AI μια ιδέα για το τι συμβαίνει και μετά να προχωρήσουμε σε πιο σύνθετα μοντέλα.”

Η Bayer συγκρίνει μεθόδους μάθησης από σχολικά βιβλία.

«Διαβάζεις πρώτα ένα βασικό βιβλίο για να πάρεις μια ιδέα για τη γνώση», λέει ο Bayer, «και μετά προχωράς στο πραγματικά πολύπλοκο βιβλίο».

Σύμφωνα με την πρώτη συγγραφέα Veena Krishnaraj, μεταπτυχιακή φοιτήτρια στο Πανεπιστήμιο του Πρίνστον, αυτή η τεχνική εμποδίζει την τεχνητή νοημοσύνη να «χωνέψει τα πάντα με τη μία».

Τα αποτελέσματα ήταν ενδιαφέροντα. Σε ορισμένες περιπτώσεις, η μάθηση με μεταφορά μειώνει τον αριθμό των δαπανηρών προσομοιώσεων που απαιτούνται κατά περισσότερο από δέκα.

Όταν η προηγούμενη γνώση γίνεται ζήτημα

Η έρευνα αποκάλυψε επίσης μια λιγότερο προφανή πρόκληση γνωστή ως αρνητική μεταφορά.

Χρησιμοποιώντας την αναλογία του σχολικού βιβλίου της Bayer, φανταστείτε να μαθαίνετε ιατρική από ένα εισαγωγικό κείμενο και στη συνέχεια να αντιμετωπίζετε μια σπάνια ασθένεια που μοιάζει πολύ με μια κοινή πάθηση. Η υπάρχουσα γνώση είναι συνήθως χρήσιμη, αλλά μερικές φορές μπορεί να ενθαρρύνει λανθασμένα συμπεράσματα.

Το ίδιο πρόβλημα μπορεί να προκύψει σε συστήματα AI.

Σε ορισμένες περιπτώσεις, οι υπογραφές της νέας φυσικής είναι παρόμοιες με μοτίβα που η τεχνητή νοημοσύνη έχει ήδη συσχετίσει με το τυπικό κοσμολογικό μοντέλο.

Οι ερευνητές παρατήρησαν αυτό το φαινόμενο όταν μελέτησαν προσομοιώσεις που περιελάμβαναν τεράστια νετρίνα. Μερικές από τις παρατηρητικές υπογραφές που σχετίζονται με τη μάζα των νετρίνων μοιάζουν πολύ με αλλαγές που σχετίζονται με μια υπάρχουσα παράμετρο ΛCDM που ονομάζεται σ8, η οποία μετρά πόσο ισχυρά σμήνη ύλης υπάρχουν σε όλο το σύμπαν.

Λόγω αυτής της ομοιότητας, το προεκπαιδευμένο νευρωνικό δίκτυο αρχικά είχε δυσκολία να διακρίνει τα δύο αποτελέσματα.

“Η αρνητική μετατόπιση δεν είναι τυχαία. Οδηγείται από τη φυσική αποσύνθεση που είναι εγγενής στο μοντέλο”, λέει ο Krishnaraj.

Με άλλα λόγια, διαφορετικές φυσικές διεργασίες μπορούν να παράγουν πολύ παρόμοιες παρατηρήσιμες υπογραφές, καθιστώντας δύσκολο τον ακριβή προσδιορισμό της παραμέτρου που είναι υπεύθυνη για το AI.

«Οπότε είναι κάτι που πρέπει να γνωρίζουμε και να προσπαθήσουμε να το μετριάσουμε», καταλήγει.

Υποσχέσεις και κίνδυνοι για τη μελλοντική κοσμολογία

Τα αποτελέσματα υπογραμμίζουν τόσο τα πιθανά οφέλη όσο και τους περιορισμούς της εφαρμογής των εννοιών του θεμελιώδους μοντέλου στη φυσική. Αυτές οι μέθοδοι μοιάζουν πολύ με τις τεχνικές πίσω από τα σύγχρονα συστήματα παραγωγής τεχνητής νοημοσύνης και τα μεγάλα γλωσσικά μοντέλα.

Όπως σημειώνουν οι ερευνητές στο έγγραφο, η προ-προπόνηση μπορεί να επιταχύνει την εξαγωγή συμπερασμάτων, «αλλά μπορεί επίσης να εμποδίσει την εκμάθηση νέας φυσικής».

Μέχρι στιγμής, η μέθοδος έχει δοκιμαστεί μόνο χρησιμοποιώντας προσομοιώσεις. Το επόμενο βήμα θα είναι η εφαρμογή του σε πραγματικές αστρονομικές παρατηρήσεις.

Η ομάδα πιστεύει ότι η μάθηση μεταφοράς θα μπορούσε να γίνει ένα σημαντικό εργαλείο για τις επερχόμενες κοσμικές έρευνες, οι οποίες αναμένεται να συλλέξουν μια πρωτοφανή ποσότητα πληροφοριών υψηλής ακρίβειας για το σύμπαν τα επόμενα χρόνια.

Veena Krishnaraj, Adrian E. Η εργασία “Transfer Learning Beyond the Standard Model” από τους Baer, ​​​​Christian Krug Jesperson και Peter Melchior είναι τώρα διαθέσιμη ΕΙΝΑΙ.

Σύνδεσμος πηγής