2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

Wie kann ich unter Windows den Dateityp ohne Erweiterung bestimmen?

Ich erhalte manchmal Dateien von meinen Kunden, die die falsche Dateierweiterung haben. Zum Beispiel lautet der Name image.jpg, aber die Datei ist eigentlich ein TIFF-Bild. In vielen Fällen kann ich das klären, indem ich die Datei in einem Texteditor öffne, mir die ersten paar Bytes ansehe und dann ableiten kann, um welchen Dateityp es sich handelt.

Das funktioniert bei mir mit JPEG-, TIFF-, GIF- und PDF-Dateien. Es gibt jedoch noch viele weitere Dateitypen.

Ist es möglich, die Identifizierung des richtigen Dateityps durch Analyse der enthaltenen Daten zu automatisieren?

Antworten (5)

147
147
147
2011-04-24 07:47:21 +0000

Sie können das Werkzeug TrID verwenden, das über eine wachsende Bibliothek von Dateitypdefinitionen verfügt, mit denen Dateien identifiziert werden können.

Wildcards werden unterstützt, so dass Sie in Ihrem Beispiel einfach alle zu untersuchenden Bilder in einen Ordner legen könnten, z. B. C:\verifyimages - dann können Sie den Befehl verwenden:

trid C:\verifyimages\*

Dies wird alle Dateien im Ordner verifyimages untersuchen.


Es gibt auch eine GUI-Version, TrIDNet :

Es ist eine Dokumentation verfügbar, wie Sie TrID oder TrIDNet einfach in den Windows Explorer und Total Commander integrieren können:

Windows Explorer

Total Commander

53
53
53
2011-04-24 07:38:08 +0000

Datei

Datei testet jedes Argument in dem Versuch, es zu klassifizieren. Es gibt drei Sätze von Tests, die in dieser Reihenfolge durchgeführt werden: Dateisystemtests, Tests der magischen Zahl und Sprachtests. Der erste Test, der erfolgreich ist, bewirkt, dass der Dateityp ausgegeben wird.

Der gedruckte Typ enthält normalerweise eines der Wörter text (die Datei enthält nur Druckzeichen und ein paar übliche Steuerzeichen und ist wahrscheinlich auf einem ASCII-Terminal sicher zu lesen), executable (die Datei enthält das Ergebnis der Kompilierung eines Programms in einer für den einen oder anderen UNIX-Kern verständlichen Form) oder data, was etwas anderes bedeutet (Daten sind normalerweise “binär” oder nicht druckbar). Ausnahmen sind bekannte Dateiformate (Core-Dateien, tar-Archive), von denen bekannt ist, dass sie binäre Daten enthalten.

14
14
14
2011-04-24 13:16:09 +0000

Ich habe früher für die französische Nationalbibliothek gearbeitet, um ein digitales Archivsystem aufzubauen, das nicht nur digitalisierte Bücher, sondern auch Millionen von digitalen Artefakten mit allen möglichen seltsamen Dateitypen enthält. Wir verwendeten JHOVE , um Dateiformate zu erkennen.

JHOVE ist Open Source, es wird von JSTOR und der Harvard University Library gepflegt. Es ist ziemlich einfach, verwenden .

1
1
1
2018-06-04 11:24:55 +0000

Sie können den Dateityp von jedem Computer einschließlich Windows unter http://www.checkfiletype.com überprüfen.

1
1
1
2011-04-24 11:30:15 +0000

Ich verwende Oracles OutsideIn-Bibliotheken in meinen Programmen. Nicht kostenlos, aber sie funktionieren gut, besonders für Bilder. Die Marktsprache sagt, dass sie über 500 Dateitypen unterstützt.