ToolPal
Code auf einem Monitordisplay

HTML zu Markdown: Wann konvertieren und was geht verloren

📷 Ilya Pavlov / Pexels

HTML zu Markdown: Wann konvertieren und was geht verloren

Das Konvertieren von HTML zu Markdown ist nicht verlustfrei. Erfahren Sie, was sauber übertragen wird, was verloren geht, und wie Sie es mit kostenlosen Tools richtig machen.

DVon Daniel Park27. März 20267 Min. Lesezeit

Wenn Sie jemals mit Webinhalten gearbeitet haben, haben Sie wahrscheinlich den Moment erlebt, in dem Sie einen Haufen HTML hatten und sich Markdown gewünscht haben. Oder umgekehrt. Die beiden Formate koexistieren in der Entwicklerwelt in einer unruhigen Beziehung — HTML ist die Sprache des Webs, Markdown ist die Sprache der Menschen, die für das Web schreiben.

Dieser Leitfaden handelt von dieser Konvertierung: Wann sie sinnvoll ist, was Sie dabei einbüßen, und wie Sie es effizient durchführen.

Was Markdown ist und warum Entwickler es lieben

Markdown wurde 2004 von John Gruber und Aaron Swartz mit einem einfachen Ziel erstellt: ein Klartextformat zu schaffen, das sich von Natur aus gut liest, aber auch in sauberes HTML konvertiert werden kann.

Es war ein durchschlagender Erfolg. Heute treibt Markdown GitHub READMEs, GitLab-Wikis, Notion-Seiten, Obsidian-Vaults, Dokumentationsseiten und unzählige Blog-Plattformen an. Wenn Sie jemals **fett** oder # Überschrift in einem Texteditor getippt haben, haben Sie Markdown geschrieben.

Der Reiz ist real. Vergleichen Sie das Schreiben in rohem HTML:

<h2>Erste Schritte</h2>
<p>Installieren Sie das Paket mit <code>npm install my-package</code> und importieren Sie es dann:</p>
<ul>
  <li>Standard-Export importieren</li>
  <li>Die <code>init()</code>-Funktion aufrufen</li>
</ul>

Versus Markdown:

## Erste Schritte

Installieren Sie das Paket mit `npm install my-package` und importieren Sie es dann:

- Standard-Export importieren
- Die `init()`-Funktion aufrufen

Dieselben Informationen. Die Markdown-Version ist schneller zu schreiben, leichter in Rohform zu lesen und weniger fehleranfällig (keine vergessenen schließenden Tags).

Wann Sie HTML tatsächlich in Markdown konvertieren würden

Die Konvertierung taucht in einigen bestimmten Situationen auf.

Migration von einem CMS zu einem Static Site Generator

Das ist der große Fall. Sie haben eine WordPress-Site, eine Wix-Site oder ein benutzerdefiniertes CMS, das Inhalte als HTML in einer Datenbank speichert. Sie möchten zu Gatsby, Hugo, Jekyll oder Astro wechseln — diese arbeiten alle nativ mit Markdown-Dateien.

Der Inhalt existiert noch; er hat nur das falsche Format. Anstatt Hunderte von Posts von Hand neu zu schreiben, exportieren Sie das HTML und konvertieren es en masse zu Markdown.

GitHub READMEs und Dokumentation schreiben

GitHub rendert Markdown wunderschön, aber manchmal liegt Ihr Quellmaterial als HTML vor — eine Webseite, eine Dokumentationssite, ein Design-Brief im Rich-Text-Format. Anstatt HTML-Chaos in Ihr README zu kopieren, konvertieren Sie es zuerst in sauberes Markdown.

Webinhalte archivieren oder wiederverwenden

Angenommen, Sie haben eine Webseite gescrapt oder heruntergeladen und möchten ihren Inhalt in einem lesbaren, bearbeitbaren Format archivieren. HTML mit all seinen Klassen, IDs, Skripten und Tracking-Pixeln ist ein Albtraum zu lesen. Markdown, das von diesem Lärm befreit ist, ist sauber und portabel.

Rich-Text-Einfügungen bereinigen

Das passiert ständig: Sie kopieren Text von einer Webseite oder Google Doc und fügen ihn in Ihren Editor ein. Sie erhalten verstecktes HTML oder Rich-Text-Formatierung, die alle möglichen Probleme verursacht. Das in Markdown zu konvertieren, gibt Ihnen etwas Sauberes und Vorhersehbares.

Was bei der Konvertierung verloren geht

CSS-Styling ist weg. Schriftgrößen, Farben, benutzerdefinierter Abstand, Rahmen, Hintergründe — nichts davon überlebt. Markdown hat keine Möglichkeit, "dieser Text ist rot" auszudrücken.

Komplexe Tabellenunterstützung ist partiell. Markdown unterstützt grundlegende Tabellen (über die GitHub Flavored Markdown-Erweiterung), aber nur einfache. Mehrzeilige Header, zusammengeführte Zellen, colspan/rowspan — diese existieren in Markdown nicht.

HTML-Attribute außer href und src werden entfernt. data-*-Attribute, class, id, style, aria-* — die Markdown-Entsprechungen von Links und Bildern tragen diese nicht.

Benutzerdefinierte Komponenten und Einbettungen. iFrames, Video-Einbettungen, benutzerdefinierte HTML-Elemente — Markdown hat keine Entsprechung.

Die Umkehrung ist verlustfrei. Markdown zu HTML ist eine vollständige Konvertierung. In die andere Richtung ist verlustbehaftet. Bewahren Sie ein Backup auf.

Wie die Konvertierung tatsächlich funktioniert

HTML-zu-Markdown-Konverter funktionieren, indem sie das HTML in einen DOM-Baum parsen und dann jedes Element durchlaufen und in sein Markdown-Äquivalent übersetzen:

  • &lt;h1> bis &lt;h6> werden zu # bis ######
  • &lt;p> wird zu einem Absatz mit Leerzeilen darum
  • &lt;strong> und &lt;b> werden zu **fett**
  • &lt;em> und &lt;i> werden zu *kursiv*
  • &lt;a href="..."> wird zu [Text](url)
  • &lt;img src="..."> wird zu ![alt](src)
  • &lt;ul> und &lt;ol> werden zu Markdown-Listen
  • &lt;code> wird zu Backtick-umhülltem Code
  • &lt;pre><code>-Blöcke werden zu eingezäunten Code-Blöcken

Unser kostenloses HTML-zu-Markdown-Tool verwenden

Unser HTML-zu-Markdown-Konverter verarbeitet die häufigsten Konvertierungsszenarien ohne Installation oder Konfiguration.

Verwendung:

  1. Fügen Sie Ihr HTML in das Eingabefenster auf der linken Seite ein
  2. Die Markdown-Ausgabe erscheint sofort auf der rechten Seite
  3. Überprüfen Sie die Konvertierung auf alles, das falsch aussieht
  4. Kopieren Sie das Markdown und verwenden Sie es, wo Sie es brauchen

Wenn Sie eine Vorschau sehen möchten, wie Ihr Markdown gerendert wird, können Sie mit dem Markdown-Vorschau-Tool Markdown einfügen und die gerenderte HTML-Ausgabe nebeneinander sehen.

Manuelle Konvertierung vs. automatisierte Tools

Manuelle Konvertierung gibt Ihnen volle Kontrolle. Sie können Urteile fällen. Das Ergebnis ist genau das, was Sie wollen. Aber es skaliert nicht.

Automatisierte Tools (Online-Konverter, CLI-Tools, Bibliotheken) verarbeiten Massenkonvertierungen und sind schnell. Sie benötigen fast immer einen Bereinigungsdurchlauf, insbesondere für:

  • Navigationselemente, die in die Konvertierung einbezogen wurden
  • Boilerplate-Text (Cookie-Hinweise, Newsletter-CTAs)
  • Seltsame Formatierungsartefakte aus komplexen CSS-Layouts

Spezialisierte Tools und Bibliotheken

Turndown.js (JavaScript) ist wahrscheinlich die am häufigsten verwendete HTML-zu-Markdown-Bibliothek im Node.js-Ökosystem.

const TurndownService = require('turndown');
const turndownService = new TurndownService();
const markdown = turndownService.turndown('<h1>Hallo Welt</h1>');

Pandoc ist das Schweizer Taschenmesser der Dokumentkonvertierung. Es konvertiert zwischen Dutzenden von Formaten: HTML, Markdown, Word, PDF, LaTeX und mehr.

html2text (Python) ist eine leichtgewichtige Python-Bibliothek für die Konvertierung von HTML in Nur-Text im Markdown-Stil.

Markdownify ist eine weitere Python-Option, speziell auf HTML-zu-Markdown mit sauberer Ausgabe ausgerichtet.

Best Practices für saubere Konvertierungen

HTML vor der Konvertierung bereinigen. Wenn möglich, entfernen Sie Navigation, Fußzeilen, Sidebars und anderen Boilerplate, bevor Sie das HTML an den Konverter übergeben.

Überschriftenstruktur überprüfen. Wenn das Quell-HTML inkonsistente Überschriftenebenen hatte, hat das konvertierte Markdown das gleiche Problem.

Links sorgfältig behandeln. Relative Links, die auf der ursprünglichen Site sinnvoll waren, werden in Ihren neuen Markdown-Dateien keinen Sinn ergeben.

Bildpfade überprüfen. Bildreferenzen in Markdown müssen auf zugängliche URLs oder lokale Dateipfade zeigen.

Rendering nach der Konvertierung testen. Fügen Sie Ihr konvertiertes Markdown in ein Vorschau-Tool (Markdown-Vorschau) ein und vergleichen Sie es mit dem Original.

Ein praktischer Migrations-Workflow

  1. Exportieren Sie Ihren Inhalt aus dem Quell-CMS
  2. Wenn Sie HTML-Dateien erhalten, führen Sie sie durch einen Massenkonverter mit Turndown.js oder pandoc
  3. Führen Sie einen ersten Überprüfungsdurchgang durch — suchen Sie nach offensichtlichen Konvertierungsartefakten
  4. Aktualisieren Sie defekte Bildpfade und Links
  5. Überprüfen Sie die Überschriftenstruktur und beheben Sie Hierarchieprobleme
  6. Führen Sie die abschließenden Markdown-Dateien durch ein Vorschau-Tool
  7. Importieren Sie in Ihre neue Site und überprüfen Sie die Live-Ausgabe

Wann nicht konvertieren

Wenn Ihre Seite komplexe interaktive Komponenten hat — JavaScript-gesteuerte Tabs, Akkordeons, dynamische Inhalte — wird das Konvertieren der HTML-Hülle in Markdown genau die Dinge entfernen, die die Seite funktionsfähig machen.

Wenn präzise visuelle Formatierung entscheidend ist (Landing Pages, Marketingmaterialien), ist Markdowns fehlende Stilkontrolle ungeeignet.

Abschließende Gedanken

HTML und Markdown dienen unterschiedlichen Zwecken und unterschiedlichen Zielgruppen. HTML ist für Browser. Markdown ist für Menschen, die Dinge schreiben, die in Browsern enden.

Die Konvertierung zwischen ihnen ist ein gelöstes Problem — die Tools existieren, sie sind gut, und sie sind kostenlos. Die eigentliche Fähigkeit liegt darin, zu wissen, wann die Konvertierung Mehrwert schafft und wann nicht, und zu wissen, wie man die Ausgabe so bereinigt, dass sie tatsächlich verwendbar ist.

Für schnelle Einmal-Konvertierungen ist unser HTML-zu-Markdown-Tool der schnellste Weg. Für größere Migrationen kombinieren Sie es mit einem programmatischen Ansatz und einem soliden Überprüfungsprozess.

In jedem Fall, sobald Ihre Inhalte in Markdown sind, werden Sie sich wahrscheinlich fragen, warum Sie sie jemals in HTML aufbewahrt haben.

Häufig gestellte Fragen

D

Über den Autor

Daniel Park

Senior frontend engineer based in Seoul. Seven years of experience building web applications at Korean SaaS companies, with a focus on developer tooling, web performance, and privacy-first architecture. Open-source contributor to the JavaScript ecosystem and founder of ToolPal.

Mehr erfahren

Artikel teilen

XLinkedIn

Verwandte Beiträge