Accueil > Forum > > > > HELP !! Source html, caractère hexa, xml
HELP !! Source html, caractère hexa, xml
jeudi 26 août 2004 à 12:11:47 |
HELP !! Source html, caractère hexa, xml

krole
|
Bonjour, J'ai un gros soucis. Je fais un url.openConnection() par exemple sur http://search.yahoo.com/search?fr=FP-tab-web-t&cop=mss&tab=&n=40&p=gucci%2Bbamboo%2Bwatch+-replica, 1) je récupère la source de la page par la méthode : InputStream iStream = connection.getInputStream(); connection.connect(); ByteArrayOutputStream body = new ByteArrayOutputStream(); int c; while ( (c = iStream.read()) != -1) { body.write(c); } iStream.close(); body.flush(); String contentPage = body.toString(); body.close(); 2) je crée un fichier xml avec certains éléments du code source html 3) j'utilise un xml transform pour afficher le xml créé en html. Mon problème est que, dans certaine source html, je dois récupérer des caractères spéciaux car, dans la source de la page html j'ai bien le caractère spécial (dans ce cas là un ' ) mais dans la source récupére avec ma méthode, le caractère a disparu (et est remplacé par un esape) mais si j'utilise ultraedit et affiche en hexa, le caractère a été remplacé par un et c'est ce caractère que mon transformer xml ne reconnaît pas. Etant donnée que je ne suis pas très à l'aise avec les encodages, j'aimerai bien votre avis pour pouvoir soit transformer ce caractère en decimal, par exemple une fois le code récupéré dans mon string soit le transformer directement lors de ma méthode while ( (c = iStream.read()) != -1) { body.write(c); } Merci à tous, je sais pas si j'ai été assez claire ?!? Carole
|
|
jeudi 26 août 2004 à 12:27:38 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Je pense que c'est un problème au niveau de l'XML transform. Utilises-tu UTF-8 pour le codage? Frouf
|
|
jeudi 26 août 2004 à 13:08:22 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
Non j'utilise ISO-8859-1 et je n'ai pas très envie d'en changer car tous mes xsl sont en ISO-8859-1.
Petite précision, si je vais online voir la source de la page j'ai bien un <b>apostrophe (')</b>, une fois le html récupéré par ma méthode (je l'ai écrit aussi dans un fichier texte pour debugger) je n'ai plus cet apostrophe mais un <b>espace</b> et en éditer hexa un <b>00</b>. Je pense que ce problème pourrait être résolu lors de ma méthode pour récupérer la source car c'est vraiement que sur certaines page que cela pose problème.
Merci, Carole
|
|
jeudi 26 août 2004 à 13:38:30 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Je ne comprend pas, une fois (') edité en hex est , une autre fois c'est 00. Si j'ai bien compris, lorsque tu récupère ta page et que tu l'écrit dans un fichier sans passer par un parseur, l'apostrophe s'est transformé en espace? Cet espace dervait alors être reconnu par le parseur (même si je sais que tu veux un apostrophe). Je ne comprends pas tout.
Frouf
|
|
jeudi 26 août 2004 à 14:01:28 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
Moi non plus !! Le code hexa qui devrait être récupéré, pour un apostrophe est 27 mais j'ai un 00. Et l'erreur relevée par ma classe xml transform est : CaractÞre XML non valide : .
|
|
jeudi 26 août 2004 à 14:13:48 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Je ne vois pas d'où peut venir l'erreur. Ce que je ferais c'est récupérer les caractères avec l'objet DataInputStream et en utilisant readChar(). ptêt que ça peut changer quelque chose. qui sait?
Frouf
|
|
jeudi 26 août 2004 à 14:21:14 |
Re : HELP !! Source html, caractère hexa, xml

wargre
|
hum c'est pas du cp1252 en encodage?
|
|
jeudi 26 août 2004 à 14:53:12 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
C'est quoi du cp1252 (c'est pas mon fort l'encodage). Mais j'ai un début d'amélioration. J'ai rajouter, pour ma connexion : connection.setRequestProperty("Accept-Charset", "iso-8859-1,utf-8");.
Du coup je n'ai plus de page blanche dûe à l'erreur de xml transfom, ce qui est une très bonne chose en soi, mais maintenant j'ai des caractères, dans mon string, du style â?? pour l'apostrophe ou é pour é.
Carole
|
|
jeudi 26 août 2004 à 15:03:42 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Dans ton entête du document XML, tu possèdes quel type d'encodage? pour le configurer: Transformer transformer = transformerFactory.newTransformer(); transformer.setOutputProperty(OutputKeys.METHOD, "xml"); transformer.setOutputProperty(OutputKeys.INDENT, "no"); transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no"); transformer.setOutputProperty(OutputKeys.ENCODING, "ISO-8859-1"); transformer.transform(source,result);
|
ou UTF-8 si ça ne marche pas. Frouf
|
|
jeudi 26 août 2004 à 15:33:05 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
j'ai essayé mais ça ne change rien.
|
|
Cette discussion est classée dans : caractère, source, html, xml, body
Répondre à ce message
Sujets en rapport avec ce message
Java et les balises html xml éxercice trés interessant pour les mathématicien allez les Gars [ par artistouclub ]
Bonjour j'ai voulu développer un pgm qui sert à préciser les sous-balises html utilisées pour une balise donnée dans un fichier html exple:
liaison entre servlet et page html [ par mdh12 ]
salut, mon but est gérer un statistique selon des donnes récupérer d'après un fichier .xml j'ai un code qui tourne et qui affiche un statistique sou
Affichage d'un fichier html [ par mimomama ]
j'ai un fichier XML et j'ai utilisé une classe java bien sur via un fichier XSL pour le transformer en html ,le fichier se créé normalement mais lorsq
Transformation XSLT/XML/HTML [ par EMSIEN ]
Bonjour tout le monde,Tout d'abrd, je n'ai pas trouvé une rubrique spécial XML/XSLT..., donc puisque je suis sous JSP, j'ai posé la question ici.J'ai
Comment générer du html a partir d'un fichier xml et du java [ par shefiu ]
Slt a tous !J'aimerais savoir comment je pourrais générer du html a partir d'un fichier xml et d'un code source java. Je sais qu'il est possible de fa
gestion des fichiers html [ par danny3D ]
Bonjour à tous, je suis dans un projet où je manipulait au paravant des fichiers xml et la vie allait bon train. Mais il se fait que depuis un c
convertir un html en xml suivant un xsd [ par bassoumbassoum ]
salut je veux savoir comment convertir un html en xml via un xsd
JSP Forcer l'écriture d'un fichier xml [ par Evarist ]
Bonjour,Je sauvegarde des news dans un fichier xml. J'utilise une jsp displayNews.jsp pour les affichées.Pour ajouter une news une jsp qui affiche le
html ou xml? [ par limalima ]
Bonjour,J'ai envie d'apprendre le html mais on m'a dit que vu que je me suis lancé dans java, il vaut mieux d'apprende le xml.ma question est donc à q
Livres en rapport
|
Derniers Blogs
XNA IS DEAD!XNA IS DEAD! par richardc
Depuis la semaine dernière (et grâce aux TechDays 2012), je me penche activement sur la nouvelle version de Windows, aka Windows 8. Vous me direz, il était temps puisque la première preview date de Septembre dernier.
OK. Remarquez, on n'en est qu'aux...
Cliquez pour lire la suite de l'article par richardc TECHDAYS PARIS 2012 : WINDOWS SERVER "8" QUOI DE 9 !TECHDAYS PARIS 2012 : WINDOWS SERVER "8" QUOI DE 9 ! par ROMELARD Fabrice
Speakers: Fabrice Meillon et Stanislas Quastana Cette session est basée entièrement sur celle donnée lors de la BUILD cet hiver. Il n'y a pas d'ajout d'information en rapport avec cet évènement passé. Windows 8 Server sera intégralem...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice [HTML5] AUTOUR DU W3C : NOUVEAUX STANDARDS ET WEB MOBILE (LILLE)[HTML5] AUTOUR DU W3C : NOUVEAUX STANDARDS ET WEB MOBILE (LILLE) par Gio
Je m'y prends un peu tard je sais, mais bon je suis développeur web et donc hyper fainéant ! Toujours dans le cadre des technologies émergentes, ici HTML5, parce qu'on aime HTML5 chez Wyg , nous seront présent, le vieux ( Aurélien V.) et moi, pour pr...
Cliquez pour lire la suite de l'article par Gio [WP7] DYNAMICALLY CHANGE STARTUP PAGE[WP7] DYNAMICALLY CHANGE STARTUP PAGE par KooKiz
Let's say that you want to allow the user to customize the startup page of your application. You can easily change the startup page by editing the 'NavigationPage' attribute in the manifest file. But the manifest cannot be modified once the applicatio...
Cliquez pour lire la suite de l'article par KooKiz
Forum
RE : URL ET JAVARE : URL ET JAVA par Pylouq
Cliquez pour lire la suite par Pylouq
Logiciels
DocTranslate (V3.1.0.0)DOCTRANSLATE (V3.1.0.0)DocTranslate est un traducteur de document Microsoft Word, PowerPoint et Excel. Il permet d'autom... Cliquez pour télécharger DocTranslate Tribler (2012)TRIBLER (2012)Tribler est un client pair à pair (P2P/Peer-to-Peer) open source avec la capacité de regarder des... Cliquez pour télécharger Tribler OneSwarm (2012)ONESWARM (2012)Le peer-to-peer qui protège votre vie privée, c'est OneSwarm.
Ce logiciel de peer-to-peer crypté... Cliquez pour télécharger OneSwarm PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V8.4)PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V8.4)PONAMEDIA TV DEVIENS HELLLOOO FLASH
LA TV SUR VOTRE ORDINATEUR.
Toute une plateforme Multi... Cliquez pour télécharger PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO Academy System (17.2.1.0)ACADEMY SYSTEM (17.2.1.0)Logiciel de gestion des établissements.
- élèves/étudiants (inscription, dossier, absence...)
-... Cliquez pour télécharger Academy System
|