You are here
Home > Actualités >

Correction des fichiers CSV contenant des caractères spéciaux non interprétés

Comprendre l’origine du problème d’encodage

Qu’est-ce que l’encodage des caractères

Les fichiers CSV, comme tous les fichiers texte, sont codés avec un jeu de caractères spécifique qui traduit le langage humain en langage compréhensible pour l’ordinateur. Les problèmes apparaissent lorsque l’application qui ouvre le fichier ne reconnaît pas correctement cet encodage, entraînant l’affichage de caractères incompréhensibles à la place des caractères spéciaux comme les accents.

Principaux types d’encodage

Plusieurs encodages sont couramment utilisés :

  • UTF-8 : Standard international Unicode permettant de représenter tous les alphabets et systèmes de caractères connus
  • ANSI : Encodage plus ancien compatible avec Windows
  • Windows-1252 : Encodage propriétaire de Microsoft utilisé par Excel
  • ISO-8859-1 : Encodage plus ancien utilisé par certaines applications spécifiques

Pourquoi Excel pose problème

Excel ne vérifie pas automatiquement le jeu de caractères lors de l’ouverture d’un fichier CSV. Il suppose que le contenu correspond au jeu Windows-1252, causant un décodage incorrect des caractères spéciaux contenus dans des fichiers encodés différemment, particulièrement en UTF-8.

Méthodes de correction par modification de l’encodage

Utilisation de Notepad (Windows)

  1. Ouvrir le fichier CSV avec Notepad
  2. Cliquer sur « Fichier > Enregistrer sous »
  3. Dans le champ « Encodage », sélectionner « ANSI »
  4. Enregistrer le fichier (possiblement sous un nouveau nom)
  5. Ouvrir ce nouveau fichier dans Excel

Utilisation de Notepad++

  1. Télécharger et installer Notepad++
  2. Ouvrir le fichier CSV avec Notepad++
  3. Cliquer sur l’onglet « Encoding »
  4. Sélectionner « Convert to ANSI »
  5. Enregistrer le fichier

Utilisation de Sublime Text

  1. Ouvrir le fichier CSV dans Sublime Text
  2. Accéder à « Fichier > Enregistrer avec codage > UTF-8 »
  3. Enregistrer le fichier

Utilisation d’outils en ligne

Pour les cas nécessitant un encodage spécifique :

  1. Télécharger le fichier CSV initial
  2. Utiliser un outil en ligne de conversion d’encodage
  3. Spécifier l’encodage d’origine et l’encodage de destination
  4. Télécharger le fichier converti

Méthodes de correction lors de l’importation dans Excel

Méthode d’importation par l’onglet Données

  1. Ouvrir un classeur vierge dans Excel
  2. Sous l’onglet « Données », cliquer sur « À partir d’un fichier texte/CSV »
  3. Sélectionner le fichier CSV à importer
  4. Dans la fenêtre qui s’ouvre, sélectionner « 65001 : Unicode (UTF-8) » dans le champ « Origine du fichier »
  5. S’assurer que « Délimité » est sélectionné pour le type de données
  6. Cliquer sur « Charger » ou « Suivant »
  7. Si demandé, sous « Séparateurs », cocher la case « Virgule »
  8. Cliquer sur « Terminer » puis « OK »

Méthode alternative avec versions récentes d’Excel

Excel propose maintenant une option pour ouvrir directement les fichiers avec encodage UTF-8 :

  1. Accéder à Fichier > Enregistrer sous
  2. Sélectionner le format CSV UTF-8 dans les options d’enregistrement

Cas particuliers et solutions spécifiques

Problème de la marque BOM (Byte Order Mark)

Certains fichiers UTF-8 incluent une marque BOM au début, pouvant causer des problèmes. Si Excel affiche « ï»¿ » au début de la première cellule, c’est un signe de problème avec la BOM. Solutions possibles :

  • Désactiver la génération de la BOM lors de la création du fichier
  • Utiliser des outils spécialisés pour supprimer la BOM
  • Importer le fichier via l’option « Données » plutôt que de l’ouvrir directement

Compatibilité avec d’autres applications

Application Gestion de l’encodage
OpenOffice/LibreOffice Demande généralement quel encodage utiliser lors de l’ouverture
Applications web Peuvent nécessiter des encodages spécifiques (ex: ISO-8859-1)

Bonnes pratiques pour éviter les problèmes d’encodage

Prévention en amont

  • Éviter autant que possible les caractères spéciaux dans les données destinées à l’exportation CSV
  • Standardiser l’encodage utilisé dans votre organisation (UTF-8 recommandé)
  • Documenter l’encodage utilisé pour les fichiers partagés
>  PKIo : Certificats d’authentification et de chiffrement

Vérification et tests

  • Toujours tester l’ouverture des fichiers CSV exportés avant leur distribution
  • Avoir à disposition plusieurs méthodes de correction
  • Vérifier à l’avance les exigences d’encodage des systèmes tiers

Utilisation de Google Sheets comme solution alternative

Google Sheets offre une méthode simple pour convertir les fichiers en UTF-8 :

  1. Créer une nouvelle feuille Google Sheets
  2. Importer le fichier CSV problématique
  3. Télécharger le fichier au format souhaité (CSV, XLSX, etc.)

Google Sheets convertira automatiquement le fichier en UTF-8 lors de l’importation et de l’exportation, résolvant ainsi la plupart des problèmes d’encodage.

Recommandations

L’encodage UTF-8 est aujourd’hui le standard le plus universel et devrait être privilégié pour les nouveaux projets. Cependant, la diversité des applications et systèmes existants nécessite parfois d’adapter l’encodage des fichiers CSV. Les méthodes présentées permettent de résoudre efficacement les problèmes de caractères spéciaux non interprétés, que ce soit par la conversion directe du fichier ou par une importation contrôlée.

Pour une solution pérenne, considérez :

  • L’adoption systématique de l’UTF-8 comme standard d’encodage
  • La formation des utilisateurs aux méthodes d’importation adéquates
  • La mise en place de procédures de vérification avant distribution de fichiers CSV

Ces approches garantiront une meilleure interopérabilité des données, particulièrement celles contenant des caractères spéciaux. En suivant ces recommandations, vous minimiserez les problèmes d’encodage et améliorerez la qualité de vos échanges de données.

Top