2023 Autor: Agatha Gilson | [email protected]. Zuletzt bearbeitet: 2023-05-21 04:40
CHICAGO - Bei den jüngsten Bemühungen, künstliche Intelligenz (KI) auf die herausfordernde Aufgabe der Klassifizierung von Schilddrüsenknoten anzuwenden, zeigt ein Bildähnlichkeitsalgorithmus eine Genauigkeit, die ähnlich und in einigen Aspekten besser ist als die besten verfügbaren ultraschallbasierten Klassifizierungssysteme.
"Durch die Verwendung von AI-Modellen mit Bildähnlichkeit können wir die Subjektivität beseitigen und die Anzahl unnötiger Biopsien verringern", sagte Johnson Thomas, MD, der die Ergebnisse hier auf der 89. Jahrestagung der American Thyroid Association (ATA) vorstellte.
"Im Vergleich zu veröffentlichten Ergebnissen des Thyroid Imaging Reporting and Data System (TI-RADS) und des ATA-Klassifizierungssystems des American College of Radiology weist unser Bildähnlichkeitsmodell einen vergleichbaren negativen Vorhersagewert mit besserer Empfindlichkeit, Spezifität und positivem Vorhersagewert auf." fügte Thomas hinzu, der Abteilungsleiter der Abteilung für Endokrinologie, Mercy Hospital, Springfield, Missouri.
Und dieses System unterscheidet sich von anderen AI "Black Box" -Systemen, die für die Klassifizierung von Schilddrüsenknoten entwickelt wurden, betonte er.
"Der Vorteil dieses Systems ist, dass es nicht nur ein binäres Ergebnis liefert, sondern auch sehr intuitiv ist", sagte er gegenüber Medscape Medical News.
Franklin N. Tessler, MD von der Abteilung für Radiologie der Universität von Alabama in Birmingham, war der Meinung, dass KI das Potenzial hat, der Beurteilung von Schilddrüsenknoten ein kritisches Element der Objektivität hinzuzufügen.
"Ich bin ein Befürworter der Anwendung von Computertechniken auf die Knötchencharakterisierung. Ich denke, dass dies eine sehr glänzende Zukunft hat. [Und] Im Allgemeinen wird das Lernen von Maschinen- und KI-Bildgebung eine überlagerte und unterstützende Technologie sein", sagte er Medscape Medical News.
"Es kann viele demografische Faktoren geben, die ein Mensch möglicherweise nicht berücksichtigt. Ich denke, dies wird enorme Auswirkungen auf die Bildgebung haben - nicht nur Schilddrüsen, sondern so ziemlich alles."
Der vermehrte Einsatz von Bildgebung hat zu der aktuellen Schätzung geführt, dass bis zu einer von zwei Frauen über 50 möglicherweise Schilddrüsenknoten haben - weniger als 10% davon sind jedoch krebsartig.
Derzeitige nichtinvasive Klassifizierungssysteme lassen jedoch zu wünschen übrig, sagte Thomas, und "alle sind subjektiv, mit signifikanten Abweichungen zwischen und innerhalb des Beobachters".
In der Zwischenzeit wurden KI-Systeme entwickelt, um Deep-Learning-Modelle zu verwenden, um die Subjektivität zu verringern, die die Bildinterpretation durcheinander bringen kann. Solche Systeme sind bereits von der US-amerikanischen Food and Drug Administration (FDA) für diagnostische Zwecke bei diabetischer Retinopathie, Schlaganfall und Brustläsionen zugelassen. Thomas bemerkte.
Während verschiedene KI-Algorithmen für die Erkennung von Schilddrüsenknoten mit maschinellem Lernen auf der Grundlage eines binären "Black-Box" -Systems entwickelt wurden, unterscheidet sich das von Thomas und seinen Kollegen entwickelte System durch die Verwendung eines Bildähnlichkeitsalgorithmus, der den Klinikern übereinstimmende Vergleiche ermöglicht.
Zur Erstellung des Modells wurden mithilfe von Deep Learning alle verfügbaren Bilder für 482 Knoten von Patienten verarbeitet, die sich von Februar 2012 bis Februar 2017 im Mercy Hospital einer Biopsie oder Schilddrüsenoperation unterzogen hatten.
Knoten wurden aus dem Modell ausgeschlossen, wenn keine endgültige Diagnose für gutartig oder bösartig bestand.
Bei der Bewertung der Genauigkeit des Systems testeten die Autoren 103 Schilddrüsenknoten bei Patienten, die von März 2017 bis Juli 2018 einer Biopsie oder Operation unterzogen wurden.
Insgesamt waren 66 Knoten im Trainingssatz bösartig und 33 in den Testknoten bösartig.
Die Ergebnisse zeigten, dass das AI-System eine Sensitivität und Spezifität von 87, 8% bzw. 78, 5% aufwies. Das Modell hatte einen negativen Vorhersagewert (NPV) von 93, 2% und einen positiven Vorhersagewert (PPV) von 65, 9% für die Diagnose.
Insgesamt betrug die Genauigkeit des Systems 81, 5%.
"Die Ergebnisse legen nahe, dass die Verwendung des AI-Systems zur Bildähnlichkeit zu einer Reduzierung der Biopsien um 57, 3% führen könnte", sagte Thomas.
Eine kürzlich in Endocrine Practice veröffentlichte Studie, die einen direkten Vergleich der konventionellen ATA- und ACR-TI-RADS-Klassifizierungssysteme für die Diagnose von 323 Knötchen darstellt, zeigte bei beiden Systemen für die meisten Maßnahmen niedrigere Genauigkeitsraten im Vergleich zu den Ergebnisse mit dem KI-System von Thomas berichtet.
Diese Studie zeigte eine Sensitivität von 77, 3% gegenüber 78, 4% für ATA- bzw. ACR-TI-RADs; eine Spezifität von 76, 6% gegenüber 73, 2%; ein PPV von 55, 3% gegenüber 52, 3%; und einen Kapitalwert von 90% für beide, stellte er fest.
Thomas erklärte, wie sich dieses neue System unterscheidet. Für den AI-Bildähnlichkeitsalgorithmus werden Ultraschallbilder durch Faltungsschichten verarbeitet, um einen eindeutigen Bildvektor zu erzeugen, der dann in einer Datenbank gespeichert wird.
"Jede Schicht extrahiert ein bestimmtes Merkmal, wie Mikroverkalkung oder unregelmäßige Ränder, was zu einem Bildvektor führt, der einem eindeutigen Fingerabdruck ähnelt."
Der eindeutige Bildvektor aus einem Testbild wird dann mit dem nächsten Nachbarn aus der Datenbank anderer Vektoren verglichen, wodurch eine Risikostratifizierung von Knoten am Behandlungsort ermöglicht wird.
Thomas bemerkte, dass das KI-Modell durch die Bereitstellung eines Bildähnlichkeitssystems eine Verbesserung gegenüber dem KI-Modell des "Black-Box-Algorithmus" bietet, das nur die Diagnose von bösartig oder gutartig liefert.
"Ärzte können ähnliche Bilder mit bekannten Diagnosen vergleichen und ihre eigene Entscheidung treffen. Ich denke, sobald Ärzte unser System verwenden, werden sie diesem mehr vertrauen als einem Black-Box-Algorithmus", sagte er gegenüber Medscape Medical News.
Das System enthält Bilder von den beliebtesten Ultraschallgeräten in den USA, jedoch sind möglicherweise nicht alle kompatibel. Daher funktioniert dies möglicherweise nicht bei allen Bildern, die von allen Ultraschallgeräten aufgenommen wurden.
"Im Gegensatz zu AI-Algorithmen zur Bildklassifizierung zeigt unser Bildähnlichkeitsalgorithmus ähnliche Bilder aus unserer Datenbank an, und der bewertende Arzt kann dann seine Testbilder mit den Ausgabebildern vergleichen und die Genauigkeit überprüfen", sagte er.
Thomas stellte jedoch fest, dass das System noch mit Daten anderer Institutionen validiert werden muss, und sagte, dass das System möglicherweise eine Risikostratifizierung von Knoten am Point of Care ermöglichen und auf mobilen Geräten, Computern oder als Cloud-Dienst verwendet werden könnte.
"Hoffentlich werden dadurch unnötige Biopsien reduziert", schloss er.
89. Jahrestagung der American Thyroid Association. Abstract # 27. Präsentiert am 1. November 2019.