Entries tagged “utf-8”

Passage à l'UTF-8 pour les noms de fichiers : il faut renommer

written by ccomb, on Sep 28, 2003 12:00:00 PM.

1) Contexte

Vous venez de passer votre système de l'iso8859 vers l'UTF-8 et vous utilisiez des noms de fichiers avec des accents. Vous voulez avoir des noms de fichiers en plusieurs langues (grec, tchèque, turc, etc.). D'une manière ou d'une autre vous devez avoir besoin de renommer vos fichiers. Ce script peut vous aider.

2) But

  • Convertir les noms des fichiers qui en ont besoin
  • Puis renommer ces fichiers pour qu'ils soient dans le bon encodage.
  • Pouvoir faire ceci en masse et récursivement sur des sous-répertoires
  • Visualiser le résultat avant de renommer pour de vrai

3) Syntaxe

syntax: utfconvert.py [-h|--help] [--rename] [-r] [args]
-h or --help : this help
--rename : Actually rename from iso8859-1 to utf-8  (otherwise in dummy mode)
-r       : Recursive Mode
-v       : Verbose mode
--revert : from utf-8 to iso8859-1
args : file or directory to recursively rename

3) Le script

Le script le plus récent est celui-ci : http://ccomb.free.fr/utfconvert/utfconvert.py.latest

Les autres sont disponibles http://ccomb.free.fr/utfconvert/

Vous pouvez lancer le script avec comme argument un fichier ou un répertoire. Par défaut, l'encodage de départ est ISO_8859-1 et l'encodage d'arrivée est UTF-8 Si vous ajoutez l'option --revert, il fera le contraire. Si vous voulez l'utiliser avec un autre encodage, vous devrez le modifier directement dans le script. Par défaut le script ne fait rien, il vous montre simplement ce qu'il peut faire. Si vous voulez qu'il exécute ce qu'il a affiché, il suffit de recommencer avec l'option --rename.

Ce script est rudimentaire, mais il a suffit ponctuellement à mon besoin. Si vous voulez plus, vous pouvez le faire vous même. Libre à vous d'en faire ce que vous voulez.


test