2009-08-11 13:11:38 +0000 2009-08-11 13:11:38 +0000
26
26

Wie kann ich Unicode-Text in Notepad++ bearbeiten?

Manchmal bearbeite ich englischen Text, der Unicode-Zeichen enthält. Aus irgendeinem Grund konvertiert Notepad++ auf meinem PC Unicode-Zeichen in ???‘s, wodurch der Text beschädigt wird und alle diese Daten verloren gehen. Ich suche nach einer Möglichkeit, solchen Text zu bearbeiten und dabei die Unicode-Zeichen zu erhalten. Ich verwende Consolas als Schriftart. Wenn die Schriftart nicht alle diese Zeichen hat, warum sollte ich die Daten verlieren, wenn ich den Text aus Notepad++ heraus kopiere (über die Zwischenablage von Windows)?

Antworten (5)

15
15
15
2011-09-17 11:54:32 +0000

Das in der Frage beschriebene Problem tritt auf, wenn ein leeres/neues Dokument auf “ANSI” eingestellt ist und Unicode Zeichen darin eingefügt werden.

Es gibt keine automatische Erkennung bei Verwendung mit einem leeren/neuen Dokument, zumindest nicht in der Version von Notepad++, mit der ich es getestet habe (v5.4.5). “ANSI” ist der Standard in Notepad++ für ein neues Dokument, es sei denn, er wird im Menü EinstellungenVoreinstellungen → Registerkarte Neues Dokument/Speicherverzeichnis öffnen eingestellt.

Lösung

Die Lösung ist, die Kodierung vor dem Einfügen auf UTF-8 zu setzen, Menü FormatKodierung in UTF-8:

Beispiel

Ich habe einen Text in ein neues Notepad++ Dokument kopiert, Russisch (русский язык, russkiy yazyk), von Firefox, das die Wikipedia-Seite Russische Sprache _ zeigt.

Wenn die Kodierung nicht von “ANSI” geändert wird, ist dies das Ergebnis:

Wenn die Kodierung _geändert wird, ist dies das Ergebnis:

Wie in der Abbildung unten zu sehen ist (der Kyrillisch Teil ist hervorgehoben), konvertiert Notepad++ die Unicode-Zeichen tatsächlich in ASCII 63 (hexadezimal 3F), Fragezeichen. Deshalb gehen die Unicode-Zeichen (im “ANSI”-Modus) verloren, wenn der Text über die Zwischenablage herauskopiert wird (es ist kein Problem der Schriftart - die Information geht verloren).

Getestet auf: Notepad++ v5.4.5 (UNICODE).

15
15
15
2009-08-11 13:30:37 +0000

Wenn die Datei tatsächlich in Unicode kodiert ist, sollte Notepad++ dies automatisch erkennen. Die Schriftart Consolas funktioniert bei mir gut. Sie können eine dieser beiden Menüoptionen ausprobieren:

  • Encoding -> Encode in UTF-8
  • Encoding -> Convert to UTF-8

Ich bin ziemlich sicher, dass die erste das tut, was Sie wollen.

5
5
5
2009-08-11 13:30:46 +0000

Es gibt gute Nachrichten und schlechte Nachrichten.

Gute Nachrichten: Notepad++ unterstützt Unicode (zumindest von dem, was ich sammeln kann).

Schlechte Nachrichten: Anscheinend gibt es Unicode-Unterstützung nur unter Windows XP.

Ich habe gerade keinen Windows-Rechner vor mir stehen. Soweit ich mich erinnere, gibt es irgendwo unter dem Menü “Format” ein Menü “Kodierung”. Die Kodierung für Unicode ist eigentlich am häufigsten UTF-8.

Hier ist ein ‘hübsches’ Bild der Unicode-Unterstützung in Notepad++,

1
1
1
2015-04-14 13:13:05 +0000

Dies hat bei mir funktioniert:

Ich habe auf meinem PC (Windows 7 mit englischem/US-Zeichensatz und rumänischem Nicht-Unicode-Zeichensatz) die Schriftart im Stilkonfigurator auf Courier New geändert. Es funktioniert mit den Schriftarten Courier New & Tahoma + UTF-8-Kodierung.

0
0
0
2018-09-19 10:12:31 +0000

Wählen Sie im oberen Menü das Encoding und dann Encode in UTF-8 oder Encode in UTF-8 Without BOM aus, dann können Sie Text in Unicode-Kodierung bearbeiten.