PDF zu Markdown konvertieren
Text aus PDFs als strukturiertes Markdown — direkt im Browser.
PDFs sind fürs Lesen und Drucken gemacht, nicht fürs Weiterverarbeiten: Der Text steckt in einem festen Layout ohne logische Struktur. Wer den Inhalt in ein Wiki übernehmen, in einem Editor weiterbearbeiten oder einem KI-Tool übergeben will, braucht ihn als strukturierten Text — genau das liefert Markdown.
Dieser Converter extrahiert den Text deiner PDF-Datei Seite für Seite und rekonstruiert die Struktur: Überschriften werden anhand der Schriftgröße im Verhältnis zum Fließtext erkannt und als #-, ##- oder ###-Headings ausgegeben, fett gedruckte kurze Zeilen werden als Zwischenüberschriften behandelt, Seitenwechsel als Trennlinien markiert.
Wichtig zu wissen: Die Erkennung arbeitet heuristisch und funktioniert am besten bei textbasierten PDFs mit klarer Typografie. Gescannte PDFs (Bilder von Text), Tabellen und mehrspaltige Layouts werden nicht zuverlässig umgesetzt. Die Konvertierung läuft komplett lokal in deinem Browser — ohne Upload.
So wandelst du eine PDF-Datei in Markdown um
- Ziehe deine .pdf-Datei in das Feld oben oder wähle sie per Klick aus.
- Der Text wird Seite für Seite extrahiert und mit erkannten Überschriften als Markdown ausgegeben. Prüfe das Ergebnis in der Vorschau.
- Korrigiere bei Bedarf einzelne Überschriften direkt im Markdown-Tab und lade das Ergebnis als .md-Datei herunter.
Fragen zur PDF-Konvertierung
Warum werden manche Überschriften nicht erkannt?
Die Erkennung basiert auf dem Schriftgrößen-Verhältnis zum Fließtext. Wenn ein PDF Überschriften in der gleichen Größe wie den Fließtext setzt (nur fett oder farbig), werden sie als ### erkannt oder bleiben Fließtext. Im Markdown-Tab kannst du das direkt korrigieren.
Funktionieren gescannte PDFs?
Nein. Gescannte PDFs enthalten Bilder statt Text — dafür wäre OCR (Texterkennung) nötig, die der Converter aktuell nicht bietet. Es funktionieren nur PDFs mit echtem, auswählbarem Text.
Werden Tabellen aus PDFs übernommen?
Nein. PDF speichert Tabellen nur als positionierten Text ohne Struktur, eine zuverlässige Rekonstruktion ist nicht möglich. Bei DOCX-Dateien werden Tabellen dagegen vollständig konvertiert.
Was bedeutet die Trennlinie (---) im Ergebnis?
Jeder Seitenwechsel im PDF wird als horizontale Trennlinie markiert. So bleibt nachvollziehbar, welcher Inhalt von welcher Seite stammt — du kannst die Linien natürlich einfach löschen.