Thursday, July 12, 2012

Import-CSV en non-ASCII karakters

Wanneer je een CSV bestand importeert met daarin een waarde met hoge ASCII karakters dan zul je zien dat dit karakter wordt weergegeven als een vraagteken. Mooie namen als Düker en Çobanlar zijn in de output van Import-CSV verminkt tot D?ker en ?obanlar. Wanneer je deze output wilt gebruiken om bijvoorbeeld een mailbox of AD account te bewerken dan zal dit mislukken, waar Düker misschien de naam van een object is kan D?ker niet gevonden worden.

De oorzaak hiervan is dat Import-CSV standaard ASCII encoding verwacht, in tegenstelling tot bijvoorbeeld Get-Content die UTF8 ondersteunt. Een work-around kan zijn om het CSV bestand eerst te converteren naar UTF8 als volgt:

cat bestand.csv > bestand2.csv # make utf8

Wanneer we bestand2.csv nu als invoer gebruiken voor Import-CSV zien we dat de karakters juist weergegeven worden.

No comments: