Das in der Frage beschriebene Problem tritt auf, wenn ein leeres/neues Dokument auf “ANSI” eingestellt ist und Unicode Zeichen darin eingefügt werden.
Es gibt keine automatische Erkennung bei Verwendung mit einem leeren/neuen Dokument, zumindest nicht in der Version von Notepad++, mit der ich es getestet habe (v5.4.5). “ANSI” ist der Standard in Notepad++ für ein neues Dokument, es sei denn, er wird im Menü Einstellungen → Voreinstellungen → Registerkarte Neues Dokument/Speicherverzeichnis öffnen eingestellt.
Lösung
Die Lösung ist, die Kodierung vor dem Einfügen auf UTF-8 zu setzen, Menü Format → Kodierung in UTF-8:
Beispiel
Ich habe einen Text in ein neues Notepad++ Dokument kopiert, Russisch (русский язык, russkiy yazyk), von Firefox, das die Wikipedia-Seite Russische Sprache _ zeigt.
Wenn die Kodierung nicht von “ANSI” geändert wird, ist dies das Ergebnis:
Wenn die Kodierung _geändert wird, ist dies das Ergebnis:
Wie in der Abbildung unten zu sehen ist (der Kyrillisch Teil ist hervorgehoben), konvertiert Notepad++ die Unicode-Zeichen tatsächlich in ASCII 63 (hexadezimal 3F), Fragezeichen. Deshalb gehen die Unicode-Zeichen (im “ANSI”-Modus) verloren, wenn der Text über die Zwischenablage herauskopiert wird (es ist kein Problem der Schriftart - die Information geht verloren).
Getestet auf: Notepad++ v5.4.5 (UNICODE).