Πόσο εύκολο είναι να αναγνωρίσεις μια συνομιλία που έχει δημιουργηθεί από τεχνητή νοημοσύνη;
Νέα μελέτη εξετάζει αν οι προφορικές συνομιλίες που δημιουργούνται από μεγάλα γλωσσικά μοντέλα (LLMs) μπορούν να ξεγελάσουν τους ανθρώπους.
Μια νέα μελέτη που δημοσιεύτηκε στο περιοδικό Cognitive Science εξετάζει κατά πόσο οι προφορικές συνομιλίες που παράγονται από μεγάλα γλωσσικά μοντέλα (Large Language Models - LLMs) μπορούν να πείσουν τους ανθρώπους ότι είναι «ανθρώπινες» και όχι τεχνητές.
Ο επικεφαλής της μελέτης Eric Mayor, PhD, ανώτερος ερευνητής στο Πανεπιστήμιο της Βασιλείας, μαζί με τον Lucas Bietti, PhD, αναπληρωτή καθηγητή ψυχολογίας στο Νορβηγικό Πανεπιστήμιο Επιστήμης και Τεχνολογίας (NTNU), και τον Adrian Bangerter, PhD, καθηγητή ψυχολογίας στο Πανεπιστήμιο της Νεσατέλ, διερεύνησαν την ικανότητα των LLMs να μιμούνται αυθεντικές ανθρώπινες συνομιλίες.
«Η δυνατότητα των μεγάλων γλωσσικών μοντέλων να προσομοιώνουν την ανθρώπινη σκέψη και συμπεριφορά θεωρείται μια επερχόμενη παραδειγματική αλλαγή για την ψυχολογική και κοινωνική έρευνα», έγραψαν οι ερευνητές.
Φιλοσοφία vs AI: Ίσως ήρθε η ώρα η τεχνητή νοημοσύνη να μάθει να ρωτά αντί να απαντά
13 λόγοι που ένας υψηλός δείκτης νοημοσύνης μπορεί να σε κάνει λιγότερο ευτυχισμένη
Παγκόσμια Ημέρα Ψυχικής Υγείας: Η ψυχολόγος Έφη Σίκαλη μάς μιλά για τον κίνδυνο της AI ψυχοθεραπείας
Sorry, αλλά ο AI «θεραπευτής» σου δεν σκέφτεται εσένα
Η ραγδαία εξάπλωση της γενετικής τεχνητής νοημοσύνης
Η γενετική τεχνητή νοημοσύνη (Generative AI) είναι ο όρος-ομπρέλα για τα συστήματα που δημιουργούν πρωτότυπο περιεχόμενο -εικόνες, βίντεο, ήχο ή κείμενο- μέσω μηχανικής μάθησης.
Σύμφωνα με την Ετήσια Έκθεση AI Index 2025 του Stanford Institute for Human-Centered AI, το 71% των ερωτηθέντων χρησιμοποίησε γενετική AI το 2024 -υπερδιπλάσιο ποσοστό από το 33% του προηγούμενου έτους.
Τα LLMs αποτελούν υποκατηγορία της γενετικής AI που επικεντρώνεται στην επεξεργασία και παραγωγή φυσικής γλώσσας. Ενδεικτικοί πάροχοι είναι οι OpenAI (σειρά GPT), Anthropic (Claude), Meta (Llama), Google (Gemini), Mistral AI (Mistral) και Cohere (Command).
Σύμφωνα με την εταιρεία Grand View Research, η παγκόσμια αγορά των LLMs αναμένεται να φτάσει τα 35 δισεκατομμύρια δολάρια έως το 2030, από 7,36 εκατομμύρια σήμερα -μια εντυπωσιακή ετήσια αύξηση 36,9%.
Τα πειράματα: GPT-4, Claude, Vicuna και Wayfarer στη δοκιμή
Οι ερευνητές διεξήγαγαν δύο πειράματα για να αξιολογήσουν την ικανότητα των LLMs να αναπαράγουν προφορικές ανθρώπινες συνομιλίες.
Στο πρώτο πείραμα, συνέκριναν αυθεντικά απομαγνητοφωνημένα τηλεφωνικά διαλόγια με συνομιλίες που παρήγαγαν τα μοντέλα GPT-4, Claude Sonnet 3.5, Vicuna και Wayfarer.
Από μια βάση δεδομένων περίπου 2.500 ανθρώπινων συνομιλιών, επέλεξαν τυχαία 200 και δημιούργησαν άλλες 200 αντίστοιχες μέσω των μοντέλων. Στόχος ήταν η μέγιστη δυνατή ομοιότητα με πραγματικούς διαλόγους.
Τα αποτελέσματα έδειξαν ότι οι συνομιλίες των LLMs είχαν μεγαλύτερες φράσεις, περισσότερη ευθυγράμμιση νοήματος και λεξιλογίου, αλλά διαφορετικές εισαγωγές και κλεισίματα σε σχέση με τις ανθρώπινες. Τα μοντέλα χρησιμοποιούσαν δείκτες συντονισμού (όπως «ναι», «κατάλαβα», «σωστά») με διαφορετικό τρόπο και συχνότητα.
Ενδιαφέρον εύρημα: οι ανοιχτού κώδικα εκδοχές Vicuna και Wayfarer παρήγαν πιο «ανθρώπινους» διαλόγους σε σχέση με τα εμπορικά συστήματα.
Οι επιστήμονες σημείωσαν ότι οι συνομιλίες των LLMs εμφάνιζαν υπερβολική γλωσσική ευθυγράμμιση, μη φυσική χρήση συντονιστικών εκφράσεων και τεχνητό ρυθμό ανάπτυξης της αλληλεπίδρασης.
Μπορούν οι άνθρωποι να ξεχωρίσουν τη διαφορά;
Στο δεύτερο πείραμα, οι ερευνητές ζήτησαν από 1.081 άτομα να αξιολογήσουν αν οι συνομιλίες που άκουγαν είχαν δημιουργηθεί από ανθρώπους ή από LLMs.
Οι 741 συμμετέχοντες άκουσαν σύντομα αποσπάσματα, ενώ οι υπόλοιποι 340 αξιολόγησαν μεγαλύτερα τμήματα διαλόγων.
Τα αποτελέσματα ήταν ξεκάθαρα:
Οι άνθρωποι μπορούσαν να αναγνωρίσουν πολύ πιο εύκολα τις συνομιλίες που είχαν παραχθεί από LLMs όταν αυτές ήταν μεγάλες σε διάρκεια.
Σε μικρά αποσπάσματα, τα LLMs κατάφεραν να «περάσουν» κάποιες στιγμές ως ανθρώπινες, αλλά απέτυχαν σε άλλες.
Σε εκτενή αποσπάσματα, οι συμμετέχοντες διέκριναν με μεγάλη ακρίβεια τις τεχνητές συνομιλίες, κάτι που δείχνει ότι τα μοντέλα ακόμη αποτυγχάνουν να πείσουν ακουστικά.
Το συμπέρασμα
Προς το παρόν, τα LLMs δεν μπορούν να ξεγελάσουν τους ανθρώπους σε προφορικό επίπεδο. Οι ερευνητές επισημαίνουν, ωστόσο, ότι άλλα μοντέλα ή διαφορετικοί τρόποι εκπαίδευσης και «prompting» θα μπορούσαν να δώσουν πιο ρεαλιστικά αποτελέσματα στο μέλλον.
Όπως καταλήγουν οι ίδιοι:
«Οι προφορικές συνομιλίες που παράγονται από μεγάλα γλωσσικά μοντέλα διαφέρουν ποιοτικά και ποσοτικά από τις ανθρώπινες. Προς το παρόν, ο άνθρωπος μπορεί να τις αναγνωρίσει -αλλά αυτό ίσως να μην ισχύει για πολύ ακόμη».
Με την εξέλιξη των αλγορίθμων, την αύξηση των δεδομένων εκπαίδευσης και τη βελτίωση της φωνητικής τεχνολογίας, το επόμενο στάδιο της τεχνητής ομιλίας δεν θα είναι να μιμηθεί τον άνθρωπο. Θα είναι να τον ξεπεράσει.
