So extrahieren Sie Text mit Spectacle, dem Screenshot-Tool von KDE.

  • Spectacle kann Text aus Plasma 6.6 extrahieren, jedoch nicht standardmäßig.
  • Die Tesseract OCR-Pakete müssen installiert werden.

Text extrahieren mit Spectacle

Seit letztem Februar, zeitgleich mit dem Start von Plasma 6.6, Vorstellung Es kann Text aus Screenshots extrahieren. Diese Funktion ist als optische Zeichenerkennung (OCR) bekannt. Sie ist jedoch nicht standardmäßig aktiviert, und Sie fragen sich vielleicht, warum die Option auch nach dem Update auf die neueste Version (derzeit Plasma 6.6.5) nicht angezeigt wird.

Der Grund ist einfach: Die benötigten Pakete fehlen. Dasselbe gilt für die Option, einen QR-Code zu scannen, um auf ein WLAN-Netzwerk zuzugreifen – aber das ist ein Thema für einen anderen Artikel. Hier erklären wir es. So aktivieren Sie die OCR-Unterstützung in Spectacle, sofern Sie Plasma 6.6 oder höher verwenden.

Aktivieren Sie die OCR-Unterstützung in Spectacle, wenn Sie Plasma 6.6 oder höher verwenden.

Wenn wir nach dem Update einen Screenshot machen, sehen wir, dass die Option zum Extrahieren von Text nicht angezeigt wird, anders als in der Anleitung beschrieben. VersionshinweiseEs gibt sogar ein Beispielvideo:

Wenn wir Spectacle öffnen und die Einstellungen aufrufen, sehen wir im Bereich „OCR“ ein Symbol mit einem „i“, das uns weitere Informationen liefert. Es besagt lediglich, dass die Funktion nicht verfügbar ist.

OCR nicht verfügbar

Spectacle kann mithilfe seiner Benutzeroberfläche Text extrahieren, aber die eigentliche Magie geschieht durch... Tesserakt OCRDies ist üblich bei Software, die von Linux-basierten Systemen verwendet wird: Viele Programme sind die Frontendaber sie hängen von etwas ab Backend Lass ihn die Arbeit machen.

Um die Meldung im vorherigen Screenshot auszublenden und durch die OCR-Optionen zu ersetzen, müssen die erforderlichen Tesseract-Pakete installiert werden. In meinem Fall, mit einer Arch-basierten Distribution wie Manjaro, sind dies folgende Pakete:

  • Tesserakt
  • tesseract-data-osd
  • tesseract-data-cat
  • tesseract-data-eng
  • tesseract-data-spa

Tesseract-Pakete

Von den oben genannten Paketen sind diejenigen, die auf -cat, -eng und -spa enden, die Sprachen, die ich erkennen lassen möchte (Katalanisch, da ich aus Ostspanien komme, Englisch und Spanisch). Tesserakt Es handelt sich um das Hauptpaket, und die Endung -osd ermöglicht es der Software, die Schreibrichtung zu erkennen, was theoretisch die Erkennung von Text auch dann ermöglicht, wenn dieser beispielsweise um 90º gedreht ist.

Es ist zwar klar, aber der Wiederholung wert: Wer weitere Sprachen benötigt, muss lediglich die entsprechenden Pakete installieren. Zum Beispiel die Endung -ita für Italienisch, -fra für Französisch oder -rus für Russisch.

Installation dessen, was erforderlich ist

Die Installation auf verschiedenen Distributionen hängt von der jeweiligen Distribution ab. Im Fall von Manjaro kann sie mit Pamac (dem grafischen Paketverwaltungstool) erfolgen, aber auch mit sudo pacman -S tesseract tesseract-data-osd tesseract-data-cat tesseract-data-eng tesseract-data-spaBei anderen Distributionen, wie beispielsweise solchen, die auf Debian oder openSUSE basieren, kann das Paket tesseract-ocr heißen.

Nach der Installation der Pakete wird Ihnen die Option zum Erstellen eines Screenshots angezeigt, wie im Screenshot der Kopfzeile und im KDE-Tutorialvideo gezeigt. Durch Klicken auf „Text extrahieren“ wird eine Benachrichtigung angezeigt, über die Sie den Text in die Zwischenablage kopieren oder in einem Texteditor öffnen können.

Hinweis: Sie müssen die Sprachen in den Einstellungen aktivieren.

Sobald die Option verfügbar ist, ändern sich auch die Einstellungen. Die Meldung, dass sie nicht verfügbar ist, wird durch den Abschnitt „Texterkennung (OCR)“ ersetzt. Dieser Abschnitt besteht nur aus zwei Teilen:

  • Sprachauswahl: über Kontrollkästchen. Wir wählen die Sprachen aus, aus denen wir Text extrahieren möchten. So sehen wir auch, welche Sprachen installiert und welche unterstützt werden.
  • Das Schließen des Fensters nach dem Entpacken verhindert das automatische Speichern. Dies ist eine Frage der persönlichen Präferenz; ich habe diese Option deaktiviert. Dadurch wird sichergestellt, dass die Datei immer in die Zwischenablage kopiert wird.

Es handelt sich um einen einfachen Vorgang, der jedoch nicht standardmäßig aktiviert ist. Durch die Installation einiger Pakete kann Spectacle dann „lesen“.