Τόσο οι πάροχοι φροντίδας όσο και οι ασθενείς χρησιμοποιούν το Διαδίκτυο για να λάβουν γρήγορες πληροφορίες υγειονομικής περίθαλψης. Ως εκ τούτου, δεν προκαλεί έκπληξη το γεγονός ότι το περιεχόμενο προσανατολισμένο στη γονιμότητα έχει διερευνηθεί εκτενώς με τα χρόνια. Δυστυχώς, αν και εκατομμύρια αποτελέσματα εμφανίζονται σε μία μόνο αναζήτηση στο Google για τη λέξη «στειρότητα», η ιατρική ακρίβεια αυτού του περιεχομένου δεν επαληθεύεται.
Οι εξελίξεις στην Επεξεργασία Φυσικής Γλώσσας (NLP), ένας κλάδος της Τεχνητής Νοημοσύνης (AI), επέτρεψαν στους υπολογιστές να μαθαίνουν και να χρησιμοποιούν την ανθρώπινη γλώσσα για να επικοινωνούν. Πρόσφατα, το OpenAI ανέπτυξε ένα chatbot AI που ονομάζεται ChatGPT, το οποίο επιτρέπει στους ανθρώπινους χρήστες να έχουν συνομιλίες με μια διεπαφή υπολογιστή.
Μια πρόσφατη μελέτη Γονιμότητας και Στειρότητας χρησιμοποίησε τη γονιμότητα ως τομέα για να δοκιμάσει την απόδοση του ChatGPT και να αξιολογήσει τη χρήση του ως κλινικό εργαλείο.
Η πρόσφατη εξέλιξη του ChatGPT
Η μοναδικότητα του ChatGPT μπορεί να αποδοθεί στην ικανότητά του να εκτελεί γλωσσικές εργασίες, όπως να γράφει άρθρα, να απαντά σε ερωτήσεις ή ακόμα και να λέει αστεία. Αυτά τα χαρακτηριστικά αναπτύχθηκαν μετά από πρόσφατες εξελίξεις στους νέους αλγόριθμους βαθιάς μάθησης (DL).
Για παράδειγμα, ο Generative Pretrained Transformer 3 (GPT-3) είναι ένας αλγόριθμος DL, ο οποίος είναι αξιοσημείωτος για το τεράστιο σύνολο δεδομένων εκπαίδευσης που αποτελείται από 57 δισεκατομμύρια λέξεις και 175 δισεκατομμύρια παραμέτρους από διάφορες πηγές.
Τον Νοέμβριο του 2022, το ChatGPT κυκλοφόρησε αρχικά ως ενημερωμένη έκδοση του μοντέλου GPT-3.5. Στη συνέχεια, έγινε η ταχύτερα αναπτυσσόμενη εφαρμογή όλων των εποχών, αποκτώντας πάνω από 100 εκατομμύρια χρήστες στους δύο μήνες της κυκλοφορίας της.
Παρόλο που υπάρχει η δυνατότητα χρήσης του ChatGPT ως κλινικού εργαλείου για πρόσβαση των ασθενών σε ιατρικές πληροφορίες, υπάρχουν ορισμένοι περιορισμοί στη χρήση αυτού του μοντέλου για κλινικές πληροφορίες.
Από τον Φεβρουάριο του 2023, το ChatGPT εκπαιδεύτηκε με δεδομένα μέχρι το 2021. ως εκ τούτου, δεν είναι εξοπλισμένο με τα πιο πρόσφατα δεδομένα. Επιπλέον, μια από τις κρίσιμες ανησυχίες σχετικά με τη χρήση του είναι η παραγωγή λογοκλοπών και ανακριβών πληροφοριών.
Λόγω της ευκολίας χρήσης και της ανθρώπινης γλώσσας, οι ασθενείς παρασύρονται να χρησιμοποιήσουν αυτήν την εφαρμογή για να κάνουν ερωτήσεις σχετικά με την υγεία τους και να λάβουν απαντήσεις. Ως εκ τούτου, είναι επιτακτική ανάγκη να χαρακτηριστεί η απόδοση αυτού του μοντέλου ως κλινικό εργαλείο και να διευκρινιστεί εάν παρέχει παραπλανητικές απαντήσεις.
Σχετικά με τη μελέτη
Η τρέχουσα μελέτη δοκίμασε την έκδοση ChatGPT “13 Φεβρουαρίου” για να αξιολογήσει τη συνέπειά της στην απάντηση κλινικών ερωτήσεων που σχετίζονται με τη γονιμότητα που μπορεί να κάνει ένας ασθενής στο chatbot. Η απόδοση του ChatGPT αξιολογήθηκε με βάση τρεις τομείς.
Ο πρώτος τομέας συσχετίστηκε με συχνές ερωτήσεις σχετικά με τη στειρότητα στον ιστότοπο των Κέντρων Ελέγχου και Πρόληψης Νοσημάτων των Ηνωμένων Πολιτειών (CDC). Συνολικά 17 συχνές ερωτήσεις, όπως «τι είναι η υπογονιμότητα;» ή «πώς αντιμετωπίζουν οι γιατροί την υπογονιμότητα;» θεωρηθηκαν.
Αυτές οι ερωτήσεις εισήχθησαν στο ChatGPT κατά τη διάρκεια μιας μόνο συνεδρίας. Οι απαντήσεις που παρήγαγε το ChatGPT συγκρίθηκαν με τις απαντήσεις που έδωσε το CDC.
Ο δεύτερος τομέας χρησιμοποίησε σημαντικές έρευνες σχετικά με τη γονιμότητα. Για αυτόν τον τομέα χρησιμοποιήθηκε το ερωτηματολόγιο της Κλίμακας Γονιμότητας του Κάρντιφ (CFKS), το οποίο περιλαμβάνει ερωτήσεις σχετικά με τη γονιμότητα, τις εσφαλμένες αντιλήψεις και τους παράγοντες κινδύνου για μειωμένη γονιμότητα. Επιπλέον, το ερωτηματολόγιο έρευνας για τη γονιμότητα και τη θεραπεία υπογονιμότητας (FIT-KS) χρησιμοποιήθηκε επίσης για την αξιολόγηση της απόδοσης του ChatGPT.
Ο τρίτος τομέας επικεντρώθηκε στην αξιολόγηση της ικανότητας του chatbot να αναπαράγει το κλινικό πρότυπο στην παροχή ιατρικών συμβουλών. Αυτός ο τομέας δομήθηκε με βάση τη γνώμη της Επιτροπής της Αμερικανικής Εταιρείας Αναπαραγωγικής Ιατρικής (ASRM) «Βελτιστοποίηση της φυσικής γονιμότητας».
Ευρήματα μελέτης
Το ChatGPT έδωσε απαντήσεις στις πρώτες ερωτήσεις τομέα που έμοιαζαν με τις απαντήσεις που έδωσε το CDC σχετικά με τη στειρότητα. Η μέση διάρκεια των απαντήσεων που παρέχονται από το CDC και το ChatGPT ήταν η ίδια.
Κατά την ανάλυση της αξιοπιστίας του περιεχομένου που παρέχεται από το ChatGPT, δεν βρέθηκαν σημαντικά διαφορετικά γεγονότα μεταξύ των δεδομένων CDC και των απαντήσεων που παράγονται από το ChatGPT. Δεν παρατηρήθηκε διαφορική πολικότητα συναισθήματος και υποκειμενικότητα. Σημειωτέον, μόνο το 6,12% των πραγματικών δηλώσεων ChatGPT προσδιορίστηκαν ως εσφαλμένες, ενώ μία δήλωση αναφέρθηκε ως αναφορά.
Στον δεύτερο τομέα, το ChatGPT πέτυχε υψηλές βαθμολογίες που αντιστοιχούν στο 87ο εκατοστημόριο της διεθνούς κοόρτης του Bunting το 2013 για το CFKS και το 95ο εκατοστημόριο με βάση την κοόρτη του 2017 της Kudesia για το FIT-KS. Για όλες τις ερωτήσεις, το ChatGPT παρείχε ένα πλαίσιο και αιτιολόγηση για τις επιλογές απαντήσεων. Επιπλέον, το ChatGPT έδωσε μια ασαφή απάντηση μόνο μία φορά και η απάντηση δεν θεωρήθηκε ούτε σωστή ούτε λανθασμένη.
Στον τρίτο τομέα, το ChatGPT αναπαρήγαγε στοιχεία που λείπουν και για τις επτά συνοπτικές δηλώσεις από το “Βελτιστοποίηση φυσικής γονιμότητας”. Για κάθε απάντηση, το ChatGPT υπογράμμιζε το γεγονός που αφαιρέθηκε από τη δήλωση και δεν παρείχε στοιχεία που δεν συμφωνούσαν. Σε αυτόν τον τομέα, ελήφθησαν σταθερά αποτελέσματα σε όλες τις επαναλαμβανόμενες χορηγήσεις.
Περιορισμοί
Η τρέχουσα μελέτη έχει αρκετούς περιορισμούς, συμπεριλαμβανομένης της αξιολόγησης μόνο μιας έκδοσης του ChatGPT. Πρόσφατα, η κυκλοφορία παρόμοιων μοντέλων, όπως το Microsoft Bing και το Google Bard με τεχνητή νοημοσύνη, θα επιτρέψει στους ασθενείς να έχουν πρόσβαση σε εναλλακτικά chatbots. Επομένως, η φύση και η διαθεσιμότητα αυτών των λειτουργιών υπόκεινται σε γρήγορες αλλαγές.
Κατά την παροχή άμεσων απαντήσεων, υπάρχει πιθανότητα το ChatGPT να χρησιμοποιεί δεδομένα από αναξιόπιστες αναφορές. Επιπλέον, η συνέπεια του μοντέλου μπορεί να επηρεαστεί κατά την επόμενη επανάληψη. Επομένως, είναι επίσης σημαντικό να χαρακτηριστεί η μεταβλητότητα στην απόκριση του μοντέλου με διάφορα ενημερωμένα δεδομένα.
Πηγή : news-medical.net