Partage
  • Partager sur Facebook
  • Partager sur Twitter

Encodage

UTF-8?

    16 mars 2010 à 0:27:12

    Bonjour,

    Le problème doit surement avoir été posé des milliers de fois, mais aucune solution ne résout mon problème...
    public static String getWebPage(String url){
    	try{
    		// Construction de la requete et creation d'un stream
    		BufferedInputStream flux = new BufferedInputStream(((new URL(url)).openConnection()).getInputStream());      
    		StringBuilder builder = new StringBuilder();
    		int octet;
    		// On boucle jusqu'a la fin de la page web
    		while ((octet = flux.read()) != -1){
    			builder.append((char) octet);
    		}
    		flux.close();
    		return builder.toString();
    	}catch(Exception e){
    			e.printStackTrace();
    			return null;
    	}
    }
    

    Ce code me renvoit ma page web avec mes accents 'é' sous la forme 'é'.
    J'ai alors essayé
    byte[] utf8 = builder.toString().getBytes("UTF8");
    return new String(utf8);
    


    La j'ai des caractères encore plus farfelus (é) pour le même accent.
    L'entête de la page web utilise pourtant le charset UTF8.

    Quelqu'un sait-il ou se cache l'erreur? Je dois rendre un travail pour 8h30 et tout mon prog cale la dessus :(
    • Partager sur Facebook
    • Partager sur Twitter
      16 mars 2010 à 0:59:03

      Et si tu essaies avec d'autres types d'encodage ?

      Sinon, une manière brutale de résoudre le problème est d'utiliser une fonction qui va te remplacer ces caractères spéciaux par le bon caractère...

      Tu n'auras pas de mal à trouver une telle fonction en Php, après tu peux l'adapter en Java.
      (Si tu es pressé, c'est peut-être une solution vers laquelle se pencher)

      Edit : (lorsque j'édite avec du code php, ça ne marche pas. Voici un lien contenant les fonctions que je voulais te montrer, ne fais pas attention aux commentaires, ils n'ont rien à voir)
      http://www.unite-saint-albert.be/bam.txt
      • Partager sur Facebook
      • Partager sur Twitter
        16 mars 2010 à 10:26:22

        Merci pour ta réponse.
        Pour ce qui est encodage, j'ai a peu près tout essayé et aucun de fonctionne.

        J'ai donc en effet changé les caractères 'manuellement', mais c'est pas très propre.
        • Partager sur Facebook
        • Partager sur Twitter

        Encodage

        × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
        × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
        • Editeur
        • Markdown