KI übertrifft Ärzte bei Epilepsie-Diagnose: ChatGPT revolutioniert die Planung von Gehirnoperationen

KI übertrifft Ärzte bei Epilepsie-Diagnose: ChatGPT revolutioniert die Planung von Gehirnoperationen
Für 70 Millionen Menschen weltweit, die mit Epilepsie leben, kann die genaue Lokalisierung ihrer Anfallsquelle im Gehirn den Unterschied zwischen andauernder Behinderung und Heilung durch eine Operation bedeuten. Bahnbrechende Forschung der National Institutes of Health zeigt nun, dass ChatGPT – das KI-System, das für das Schreiben von Aufsätzen und die Beantwortung von Fragen bekannt ist – die Planung lebensverändernder Gehirnoperationen für Epilepsiepatienten revolutionieren könnte.
Die Herausforderung, die Signale des Gehirns zu deuten
Wenn jemand einen Anfall erleidet, liefert der Körper Hinweise darauf, welcher Teil des Gehirns fehlzündet. Diese Anzeichen und Symptome – Anfallssemiologie genannt – können Sprachprobleme, Armbewegungen oder sensorische Veränderungen umfassen. Experten-Neurologen verbringen Jahre damit zu lernen, diese subtilen Signale zu interpretieren, um die epileptogene Zone zu lokalisieren – jene spezifische Gehirnregion, die Anfälle verursacht und während einer Operation entfernt werden muss.
„Die Interpretation der Anfallssemiologie ist keine triviale Aufgabe, da sie stark auf Expertenwissen angewiesen ist und oft auf inkonsistenten und unzusammenhängenden Beschreibungen basiert”, erklären die Forscher. Diese Herausforderung ist besonders akut in Regionen mit begrenztem Zugang zu Epilepsie-Spezialisten, wodurch viele Patienten ohne angemessene Bewertung für eine potenziell heilende Operation bleiben.
KI auf dem Prüfstand
Um zu untersuchen, ob ChatGPT bei diesem komplexen Diagnoseprozess helfen könnte, stellten Forscher des Stevens Institute of Technology und mehrerer medizinischer Zentren eine beispiellose Datenbank von Anfallsbeschreibungen zusammen. Sie sammelten 852 Fälle aus medizinischen Fachzeitschriften und 184 Fälle vom Far Eastern Memorial Hospital in Taiwan und schufen so eine umfassende Sammlung echter Patientensymptome mit ihren bestätigten Anfallsquellen.
Das Team testete ChatGPT-4 auf zwei Arten: ohne Beispiele (Zero-Shot-Prompting) oder mit drei Beispielfällen zur Orientierung (Few-Shot-Prompting). Um einen fairen Vergleich zu gewährleisten, rekrutierten sie acht zertifizierte Epileptologen aus den USA und Deutschland, die dieselben 100 zufällig ausgewählten Anfallsfälle interpretierten.
Überraschende Ergebnisse stellen medizinische Annahmen in Frage
Die Ergebnisse waren beeindruckend. Bei den häufigsten Anfallstypen, die im Frontal- und Temporallappen entstehen – die 80% der Epilepsie-Operationen ausmachen – erreichte ChatGPT eine Genauigkeit von 80-90% und übertraf damit deutlich die menschlichen Spezialisten, die in diesen Regionen nur 44-73% Genauigkeit erreichten.
„ChatGPT-4 übertraf die Epileptologen signifikant bei der Identifizierung von EZ-Standorten in häufigeren Regionen”, berichtet die Studie, wobei die statistische Signifikanz (p < 0,001) bestätigt, dass dies keine Zufallsergebnisse waren.
Allerdings hatte das KI-System Schwierigkeiten mit selteneren Anfallstypen. Bei Anfällen, die in weniger häufigen Bereichen wie dem Parietallappen oder der Inselrinde entstehen, sank die Genauigkeit von ChatGPT auf 20-40%, und bei den extrem seltenen Anfällen des Gyrus cinguli erreichte es nur 3% Genauigkeit.
Ein Werkzeug für globale Gesundheitsgerechtigkeit
Am wichtigsten ist vielleicht, dass die Forscher sich vorstellen, dass ChatGPT je nach Gesundheitsumfeld unterschiedliche Rollen übernimmt. Dr. Feng Liu und Kollegen schlagen vor, dass „es in Epilepsiezentren mit reichhaltigen Ressourcen als Co-Pilot fungieren kann, um Epileptologen bei der Verbesserung der diagnostischen Effizienz zu unterstützen.”
Der potenzielle Einfluss der Technologie könnte in unterversorgten Gebieten noch größer sein. „In ressourcenbeschränkten Epilepsiezentren, wo der Zugang zu spezialisierter Epilepsieversorgung knapp ist, könnte ChatGPT besonders wertvoll sein, um Allgemeinmediziner oder nicht spezialisierte Kliniker bei der vorläufigen Anfallsklassifizierung und Entscheidungsfindung zu unterstützen”, bemerken die Autoren.
Die Grenzen verstehen
Die Forscher betonen sorgfältig, dass ChatGPT noch nicht bereit ist, menschliche Ärzte zu ersetzen. Das System kann keine kausalen Zusammenhänge herstellen oder auf die gesamte Palette diagnostischer Werkzeuge wie Bildgebung des Gehirns oder EEG-Aufzeichnungen zugreifen, die Ärzte verwenden. Außerdem umfassten die Trainingsdaten der KI überwiegend Fälle aus Europa, Ostasien und Nordamerika, was möglicherweise ihre Wirksamkeit für Patienten aus anderen Regionen einschränkt.
Interessanterweise zeigte die Studie auch, dass Jahre klinischer Erfahrung nicht unbedingt mit der diagnostischen Genauigkeit unter den Epileptologen korrelierten. Ein Spezialist mit 35 Jahren Erfahrung schnitt am besten ab, während ein anderer mit 16 Jahren am schlechtesten abschnitt, was darauf hindeutet, dass selbst menschliche Expertise inkonsistent sein kann.
Blick in die Zukunft
Diese Forschung eröffnet aufregende Möglichkeiten zur Verbesserung der Epilepsieversorgung weltweit. Die Autoren schlagen vor, dass zukünftige Studien die Mustererkennung von ChatGPT mit anderen diagnostischen Werkzeugen kombinieren könnten, um umfassende KI-Assistenten für die neurologische Versorgung zu schaffen.
„Neben diesen Metriken hat ChatGPT das Potenzial, die klinische Entscheidungsfindung in Epilepsiezentren weiter zu unterstützen und zu verbessern, um optimale postoperative Ergebnisse zu erzielen”, schließen die Forscher und weisen darauf hin, dass die KI riesige Fallmengen verarbeiten könnte, die für jeden einzelnen Arzt unmöglich zu überprüfen wären.
Da sich die KI-Technologie weiter entwickelt, deutet diese Studie darauf hin, dass wir uns einer Zukunft nähern, in der anspruchsvolle medizinische Expertise für Patienten überall zugänglich wird, unabhängig von ihrem Standort oder ihren wirtschaftlichen Umständen. Für Millionen, die mit Epilepsie leben, kann diese Zukunft nicht früh genug kommen.
Zusammenfassung der Forschungsarbeit
Methodik
- Zusammenstellung von 852 Anfallssemiologie-Fällen aus Fachzeitschriften und 184 Fällen aus einem taiwanesischen Krankenhaus
- Test von ChatGPT-4 mit Zero-Shot- und Few-Shot-Prompting-Methoden
- Vergleich der KI-Leistung mit 8 zertifizierten Epileptologen bei der Bewertung von 100 Fällen
- Genauigkeitsmessung mittels regionaler Sensitivität, gewichteter Sensitivität und Netto-Positiv-Inferenzrate
Hauptergebnisse
- ChatGPT-4 erreichte 80-90% Genauigkeit bei Frontal- und Temporallappen-Anfällen
- KI übertraf Epileptologen signifikant bei häufigen Anfallstypen (p < 0,001)
- Leistung sank auf 20-40% bei seltenen Anfallslokalisationen
- Gesamtgewichtete Sensitivität: ChatGPT-4 (0,61-0,63) vs. Epileptologen (0,49-0,51)
Studienbeschränkungen
- Kann keine kausalen Zusammenhänge zwischen Symptomen und Anfallslokalisationen herstellen
- Begrenzte Repräsentation von Fällen aus Südamerika und Afrika in den Trainingsdaten
- Kleine Stichprobengröße teilnehmender Epileptologen (insgesamt 8)
- KI kann nicht auf vollständiges diagnostisches Instrumentarium (Bildgebung, EEG usw.) zugreifen
Diskussion & Erkenntnisse
- ChatGPT zeigt vielversprechende Ansätze als diagnostische Hilfe für häufige Epilepsietypen
- Könnte den Zugang zu Expertenwissen in unterversorgten Regionen erheblich verbessern
- Am besten als „Co-Pilot”-Werkzeug geeignet, nicht als Ersatz für Spezialisten
- Zukünftige Integration mit anderen diagnostischen Werkzeugen könnte Effektivität steigern
- Demonstriert Potenzial der KI, den Zugang zu spezialisiertem medizinischem Wissen zu demokratisieren
Quelle
Yaxi Luo, et al. Clinical Value of ChatGPT for Epilepsy Presurgical Decision-Making: Systematic Evaluation of Seizure Semiology Interpretation. Journal of Medical Internet Research (2025) DOI: 10.2196/69173 On medRxiv. DOI: 10.1101/2024.04.13.24305773