Umlaute mit PDFBox unter Windows

  • Beitrags-Autor:
  • Beitrags-Kategorie:Sonstiges

Die Bereitstellung der passenden deutschen Umlaute in einer Windows-1252 Umgebung ist auf verschiedene Weisen möglich.

// üöäÜÖÄß
return "\u00FC\u00F6\u00E4\u00DC\u00D6\u00C4\u00DF"
byte[] bytes = "üöäÜÖÄß".getBytes(Charset.forName("Windows-1252"))
return new String(bytes, StandardCharsets.UTF_8)
CharsetEncoder encoder = Charset.forName("Windows-1252").newEncoder()
ByteBuffer bytes = encoder2.encode(CharBuffer.wrap("üöäÜÖÄß".toCharArray()))
return new String(bytes.array(), Charset.forName("UTF-8"))