Praxis Wissen

Rückenschmerzen: Welche diagnostischen Tests nützen wirklich?

Cochrane erstellt systematische Reviews zu medizinischen Themen und nimmt eine wichtige Rolle in der evidenzbasierten Medizin (EbM) ein. Am meisten verbreitet sind Cochrane Reviews zu Interventionen, in der Therapien miteinander verglichen und untersucht werden, es gibt aber auch Cochrane Reviews zu diagnostischen oder prognostischen Fragestellungen. Zu Rückenschmerzen wurde ein Cochrane Review erstellt, der sich mit der diagnostischen Fragestellung der Wirbel­säulenfraktur beschäftigte. Hierbei wurden Studien eingeschlossen, die verschie­dene klinische Tests (red flags) zum Ausschluss von Wirbelsäulenfrakturen bei Schmerzen im unteren Rücken untersucht hatten. Ergebnisse des Reviews zeigen, dass drei red flags die Genauigkeit der Diagnose von Wirbelsäulenfrakturen verbessern, vor allem wenn die red flags in Kombination angewendet wurden. Den Abstract des Reviews [1] stellen wir im Folgenden in deutscher Sprache vor (s. Kasten S. 36/37).

Bedeutung für die Hausarztpraxis

Nur drei einfache Fragen und schon ­erhöht sich für den praktisch tätigen Hausarzt die Sicherheit, keine Fraktur zu übersehen. Kommen Patienten mit Rückenschmerzen in die Hausarztpraxis, so erheben Ärzte ­eine Anamnese und untersuchen den Rücken, um eine Wirbelsäulenfraktur ­auszuschließen. Der Grund für diese Überprüfung auf Frakturen ist, dass sich die Behandlung einer Fraktur von der Behandlung von gewöhnlichen Rückenschmerzen unterscheidet. Frakturen sind selten, sie sind nur in einem bis 4,5 Prozent der Fälle die Ursache von Rückenschmerzen.

Die vorgestellte Studie hebt die Kombination aus folgenden Fragen besonders hervor: Verwendung von Steroiden, das Alter der Patienten sowie die Frage nach vorrausgegangenen Traumata verbessern die Diagnostik. Wenn Tests nicht genau sind, erhalten Patienten ohne Bruch eine Röntgen- oder CT-Aufnahme, welche sie nicht benötigen, und werden unnötigen Belastungen durch Röntgenstrahlen ausgesetzt. Weiterhin bedeutet das unnötige Verunsicherung für den Patienten sowie insgesamt höhere Kosten.

Cochrane Review: Red flags bei Rückenschmerzen zum Ausschluss einer Wirbelsäulenfraktur [1]

Schmerzen im unteren Rücken sind ein weit verbreitetes Krankheitsbild in der Primärversorgung. Ein Hauptziel bei der klinischen Untersuchung ist es, ­Patienten mit zugrundeliegender schweren Pathologie, wie z. B. Wirbelsäulenfrakturen, zu identifizieren, welche zusätzliche Untersuchung und spezifische Behandlung erfordern können. Alle ­evidenzbasierten, klinischen Leitlinien empfehlen die Verwendung von Merkmalen und Symptomen (red flags) zur Untersuchung von schwerwiegenden Ursachen von Rückenschmerzen. Es bleibt jedoch unklar, ob die diagnostische Genauigkeit der Merkmale und Symptome ausreicht, um diese Empfehlung zu unterstützen.

Ziel ist es, die Genauigkeit der Diagnostik von Merkmalen und Symptomen, die in der Anamnese oder der klinischen ­Untersuchung erhoben wurden, zur Untersuchung von Wirbelsäulenfrakturen bei Patienten mit Schmerzen im unteren ­Rücken zu überprüfen.

Studienmerkmale: Elektronische Daten­banken wurden von ihrem Beginn an bis zum 7. März 2012 nach Primärstudien durchsucht. Referenzen und zitierte Arbeiten der eingeschlossenen Studien wurden ebenfalls untersucht.

Es wurden diejenigen Studien berücksichtigt, welche die Ergebnisse verschiedener Aspekte der Anamnese oder der körperlichen Untersuchung bei Patienten mit Schmerzen im unteren Rücken mit dem Goldstandard (Bildgebung) verglichen. Die Auswahlkriterien wurden unabhängig von zwei Review-Autoren angewendet.

Drei Autoren bewerteten unabhängig das Risiko für Bias und extrahierten Studiendaten. Das Risiko für Bias wurde anhand des 11-Punkte QUADAS-Tools bewertet. ­Studieneigenschaften, Patienten, Index Tests und Referenzstandards wurden extrahiert. Soweit vorhanden, wurden Rohdaten zur Berechnung der Sensitivität und Spezifität mit einem 95 Prozent-Konfidenzintervall (KI) verwendet. Aufgrund der Heterogenität der Studien und Tests war kein statistisches pooling angebracht und die Analyse für dieses Review war deskriptiv. Es wurden Likelihood-Ratios für jeden Test berechnet und als Hinweis für seine klinische Brauchbarkeit verwendet.

Insgesamt wurden acht Studien eingeschlossen, vier aus dem Bereich der Primärversorgung, eine aus dem Bereich der fachärztlichen Versorgung und drei aus der weiterführenden Versorgung (Notaufnahme). Insgesamt war das Risiko für Bias der Studien moderat, ­wobei das Risiko für Selektionsbias und ­Verifikationsbias die wesentlichen Fehler waren. Die Berichter­stattung über Index- und Referenztestung wurde schlecht berichtet. Die Prävalenz der Wirbelsäulenfraktur im Unfall- und Notfallsetting lag zwischen 6,5 und 11 Prozent und in der Primärversorgung zwischen 0,7 und 4,5 ­Prozent. Es wurden 29 Index-Tests untersucht, ­davon jedoch nur zwei in mehr als zwei ­Studien. Die deskriptiven Analysen zeigten, dass drei Merkmale und/oder Symptome in der Primärversorgung potenziell nützlich sein können. Diese zeigten eine bedeutsame, positive Likelihood ratio (LR+), jedoch meist ungenaue Schätzer (signifikantes Trauma, höheres ­Alter, Gebrauch von Kortikosteroiden; LR+ Punktschätzer von jeweils 3,42 bis 12,85, 3,69 bis 9,39, 3,97 bis 48,50). Ein Warnsignal in der tertiären Versorgung erschien wichtig (Prellung/Kratzer; LR + 31,09, 95%-kI 18,25 bis 52,96). Die Ergebnisse von kombinierten Testungen waren informativer als mit einzelnen Merkmalen und/oder Symptomen. In der Regel hatten dann LR+ Schätzungen eine größere Stärke und Präzision.

Ergebnisse: Die verfügbare Evidenz weist nicht darauf hin, dass es sinnvoll ist, möglichst viele Merkmale und Symptome zur ­Untersuchung von Wirbelsäulenfrakturen bei Patienten mit Schmerzen im unteren Rücken anzuwenden. Basierend auf der Evidenz von einzelnen Studien, erscheinen wenige aber dafür zuverlässige Merkmale und ­Symptome sinnvoller, da die meisten eine geringe diagnostische Genauigkeit aufwiesen. Das zeigte sich durch die ungenauen ­Schätzer der Likelihood Ratios. Wurden Kombinationen von Merkmalen und/oder Symp­tomen verwendet, schien sich auch der Nutzen zu verbessern. Die Ergebnisse der begrenzt-vorhandenen Evidenz führen zu einer schwachen Empfehlung, dass ­eine Kombination von wenigen Merkmalen und Symptomen nützlich sein könnte, um auf Wirbelsäulenfrakturen hin zu untersuchen. Anzumerken ist, dass viele Merkmale und Symptome hohe, falsch positive Ergebnisse haben; und wenn hier kritiklos agiert wird, hätte das Konsequenzen für die Behandlungskosten und die Endpunkte bei Patienten mit Schmerzen im unteren Rücken. Weitere Forschung sollte sich auf entsprechende Zusammensetzungen von Merkmalen und/oder Symptomen sowie angemessene Berichterstattung über Index- und Referenz-Tests konzentrieren.

Was sind diagnostische Tests?

Ein diagnostischer Test bestimmt anhand eines oder mehrerer Parameter, ob die teilnehmende Testperson an einer bestimmten Krankheit leidet oder nicht. Ein positives oder negatives Testergebnis bedeutet, dass die Person laut Test krank oder gesund ist. Das Testergebnis kann jedoch auch fehlerhaft sein, so dass gesunde Personen fälschlicherweise als krank und tatsächlich kranke Personen als gesund klassifiziert werden. Die Genauigkeit diagnostischer Tests ist also wesentlich für nachfolgende Therapieentscheidungen.

Die Genauigkeit eines diagnostischen Tests lässt sich anhand seiner Sensitivität und seiner Spezifität beurteilen und wird in sog. Diagnosestudien untersucht. Dabei werden die Ergebnisse einer etablierten Methode (Referenztest, soweit vorhanden) mit denen der neuen diagnostischen Methode (Index Test) verglichen. Der Referenztest teilt die Studienpopulation in tatsächlich Kranke und Gesunde ein, die Diagnosestudie untersucht, wie genau der neue Test diese Aufteilung abbildet. Die diagnostische Sensitivität berechnet die Wahrscheinlichkeit, dass tatsächlich kranke Personen im neuen Test als krank klassifiziert werden, während die diagnostische Spezifität die Wahrscheinlichkeit berechnet, dass tatsächlich gesunde Personen auch als gesund eingestuft werden. Je höher die Sensitivität, desto sicherer kann die Krankheit bei einem negativen Testergebnis ausgeschlossen werden. Bei einer hohen Spezifität kann eine Erkrankung dagegen mit höherer Sicherheit bestätigt werden.

Weiterhin wird in Diagnosestudien auch das Likelihood-Ratio (LR) des diagnostischen Tests ermittelt. Hierbei wird ein Quotient berechnet, und zwar aus der Wahrscheinlichkeit, dass der Patient tatsächlich erkrankt ist und das Testergebnis positiv (Testergebnis bildet Krankheit korrekt ab) und der Wahrscheinlichkeit, dass der Test positiv ist, der Patient aber gesund ist (Test hat die Tendenz, „krank zu machen“). Je ­höher der Wert, desto zuverlässiger ist ein positives Testergebnis.

Interessenkonflikte: Die Autoren haben keine deklariert.

Literatur: 1. Williams CM, Henschke N, Maher CG, van Tulder MW, Koes BW, Macaskill P, Irwig L.: Red flags to screen for vertebral fracture in patients presenting with low-back pain. Cochrane Database of Systematic Reviews 2013, Issue 1. Art. No.: CD008643. DOI: 10.1002/14651858.CD008643.pub2.

(M. Schmidt, J. Schelling, L. Schmittdiel, S. Voigt-Radloff, D. Küllenberg de Gaudry)

PDF