Accueil > Forum > > > > HELP !! Source html, caractère hexa, xml
HELP !! Source html, caractère hexa, xml
jeudi 26 août 2004 à 12:11:47 |
HELP !! Source html, caractère hexa, xml

krole
|
Bonjour, J'ai un gros soucis. Je fais un url.openConnection() par exemple sur http://search.yahoo.com/search?fr=FP-tab-web-t&cop=mss&tab=&n=40&p=gucci%2Bbamboo%2Bwatch+-replica, 1) je récupère la source de la page par la méthode : InputStream iStream = connection.getInputStream(); connection.connect(); ByteArrayOutputStream body = new ByteArrayOutputStream(); int c; while ( (c = iStream.read()) != -1) { body.write(c); } iStream.close(); body.flush(); String contentPage = body.toString(); body.close(); 2) je crée un fichier xml avec certains éléments du code source html 3) j'utilise un xml transform pour afficher le xml créé en html. Mon problème est que, dans certaine source html, je dois récupérer des caractères spéciaux car, dans la source de la page html j'ai bien le caractère spécial (dans ce cas là un ' ) mais dans la source récupére avec ma méthode, le caractère a disparu (et est remplacé par un esape) mais si j'utilise ultraedit et affiche en hexa, le caractère a été remplacé par un et c'est ce caractère que mon transformer xml ne reconnaît pas. Etant donnée que je ne suis pas très à l'aise avec les encodages, j'aimerai bien votre avis pour pouvoir soit transformer ce caractère en decimal, par exemple une fois le code récupéré dans mon string soit le transformer directement lors de ma méthode while ( (c = iStream.read()) != -1) { body.write(c); } Merci à tous, je sais pas si j'ai été assez claire ?!? Carole
|
|
jeudi 26 août 2004 à 12:27:38 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Je pense que c'est un problème au niveau de l'XML transform. Utilises-tu UTF-8 pour le codage? Frouf
|
|
jeudi 26 août 2004 à 13:08:22 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
Non j'utilise ISO-8859-1 et je n'ai pas très envie d'en changer car tous mes xsl sont en ISO-8859-1.
Petite précision, si je vais online voir la source de la page j'ai bien un <b>apostrophe (')</b>, une fois le html récupéré par ma méthode (je l'ai écrit aussi dans un fichier texte pour debugger) je n'ai plus cet apostrophe mais un <b>espace</b> et en éditer hexa un <b>00</b>. Je pense que ce problème pourrait être résolu lors de ma méthode pour récupérer la source car c'est vraiement que sur certaines page que cela pose problème.
Merci, Carole
|
|
jeudi 26 août 2004 à 13:38:30 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Je ne comprend pas, une fois (') edité en hex est , une autre fois c'est 00. Si j'ai bien compris, lorsque tu récupère ta page et que tu l'écrit dans un fichier sans passer par un parseur, l'apostrophe s'est transformé en espace? Cet espace dervait alors être reconnu par le parseur (même si je sais que tu veux un apostrophe). Je ne comprends pas tout.
Frouf
|
|
jeudi 26 août 2004 à 14:01:28 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
Moi non plus !! Le code hexa qui devrait être récupéré, pour un apostrophe est 27 mais j'ai un 00. Et l'erreur relevée par ma classe xml transform est : CaractÞre XML non valide : .
|
|
jeudi 26 août 2004 à 14:13:48 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Je ne vois pas d'où peut venir l'erreur. Ce que je ferais c'est récupérer les caractères avec l'objet DataInputStream et en utilisant readChar(). ptêt que ça peut changer quelque chose. qui sait?
Frouf
|
|
jeudi 26 août 2004 à 14:21:14 |
Re : HELP !! Source html, caractère hexa, xml

wargre
|
hum c'est pas du cp1252 en encodage?
|
|
jeudi 26 août 2004 à 14:53:12 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
C'est quoi du cp1252 (c'est pas mon fort l'encodage). Mais j'ai un début d'amélioration. J'ai rajouter, pour ma connexion : connection.setRequestProperty("Accept-Charset", "iso-8859-1,utf-8");.
Du coup je n'ai plus de page blanche dûe à l'erreur de xml transfom, ce qui est une très bonne chose en soi, mais maintenant j'ai des caractères, dans mon string, du style â?? pour l'apostrophe ou é pour é.
Carole
|
|
jeudi 26 août 2004 à 15:03:42 |
Re : HELP !! Source html, caractère hexa, xml

Frouf85
|
Dans ton entête du document XML, tu possèdes quel type d'encodage? pour le configurer: Transformer transformer = transformerFactory.newTransformer(); transformer.setOutputProperty(OutputKeys.METHOD, "xml"); transformer.setOutputProperty(OutputKeys.INDENT, "no"); transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no"); transformer.setOutputProperty(OutputKeys.ENCODING, "ISO-8859-1"); transformer.transform(source,result);
|
ou UTF-8 si ça ne marche pas. Frouf
|
|
jeudi 26 août 2004 à 15:33:05 |
Re : HELP !! Source html, caractère hexa, xml

krole
|
j'ai essayé mais ça ne change rien.
|
|
Cette discussion est classée dans : caractère, source, html, xml, body
Répondre à ce message
Sujets en rapport avec ce message
generer html avec xml+xsl depuis application java [ par scrogneugneu ]
J'ai un fichier xml et un xsl permettant (théoriquement) de générer du html.Question : comment faire depuis un programme java pour générer ce fichier
probleme de balise html avec xml et dom [ par lolofx ]
Bonjour,voila, J'ai une base de donnees contenant des balise html et qd je cree mon fichier xml avec dom, il me remplace automatiquement "j'aimeais sa
generer html a partir de xml en utilisant xsl/fo [ par minou2005 ]
j'ai un document xml et un autre xsl/fo a partir d'eux j'ai géneré un fichier pdf(en utilsant fop et java).mon question : j'ai besoin maintenant de ge
xml ... associer un styleSheet [ par heraclesss ]
Salut à tous ! J'ai développé quelques petits outils en java pour travailler avec du xml. J'ai une fonction qui cré un xml à partir d'un objet de typ
conversion html vers xml [ par sana_ib_th ]
je veux savoir un code source qui sert à convertir un document html en un fichier xml
Fichier XSL trop gros ==> erreur! [ par Zekez ]
Bonjour,Voilà, je tente de transformer du XML via XSLT pour obtenir un autre contenu XML.Pour se faire, j'utilise le code suivant:
Html dans JTextArea [ par Escap ]
Bonjour, Connaitriez-vous un moyen d'afficher dans un Composant JText* une partie d'un fichier xml sous format html.ex : j'ai une fichier xml ou je ch
xml - xslt - java --> HTML [ par HFanny ]
Bonjour à tous,Je voudrais savoir s'il est possible, à partir d'une jsp, de "construire" un document contenant à la fois du HTML pur, ainsi que du XML
fop installer librairie [ par KorsaKoff59 ]
Bonjour,Je voudrais generer des pdf avec un programme java sous eclipse.J'ai installé la librairie fop mais j'ai une erreur.Je vous montre le source :
html en java [ par monpseudonom ]
Salut à tous.J'utilise JGraph et j'ai un probleme au niveau de cette instruction:graph.getGraphLayoutCache().valueForCellChanged((DefaultGraphCell)sel
Livres en rapport
|
Derniers Blogs
UNE JOLIE-HORLOGE ET PAS QU'UN PEU !UNE JOLIE-HORLOGE ET PAS QU'UN PEU ! par neodante
Pour les possesseurs d'iPhone, ça y est Bijin Tokei - qui se traduit littéralement en Français par " Jolie Horloge " - est arrivé et GRATUITEMENT s'il vous plaît ! Après la version Tokyo, Hokkaido, night club, racing, Gal, "pour les mademoiselles'", . voi...
Cliquez pour lire la suite de l'article par neodante TECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICESTECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICES par ROMELARD Fabrice
Animé par: Gaetan Bouveret et Julien Chomarat Business Connectivity Services (BCS) est dans SharePoint 2010 la version 2 de Business Data Catalog (BDC dans SharePoint 2007). Il s'agit de la solution permettant de visualiser des données provenan...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice [DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE[DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE par orion
Comme de nombreux geek, je suis un grand amateur de série TV et je rate régulièrement des épisodes de mes séries préférés. Une solution s'offre à vous avec ce merveilleux site : Tv Gorge - www.tvgorge.com Moteur de recherche à l'appui, vous pouvez ...
Cliquez pour lire la suite de l'article par orion TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Vincent Bellet et Baptiste Giraudier La BI dans SharePoint 2010, Les nouveaux services d'application dans SP2010 et SQL Server Reporting services 2008 R2. La BI dans SharePoint est généralisée pour tous afin de permettre à tous les coll...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Logiciels
DB-MAIN (9.1.0)DB-MAIN (9.1.0)DB-MAIN is a data-modeling and data-architecture tool. It is designed to help developers and anal... Cliquez pour télécharger DB-MAIN Xilisoft DPG Convertisseur (5.1.37.0120)XILISOFT DPG CONVERTISSEUR (5.1.37.0120)Xilisoft DPG Convertisseur offre aux fans de Nintendo DS une bonne solution leur permettant de dé... Cliquez pour télécharger Xilisoft DPG Convertisseur GraphicsGale (2.01.01)GRAPHICSGALE (2.01.01)GraphicsGale est un logiciel de PixelArt avec de nombreuse fonctionnalités permettant de réalisé ... Cliquez pour télécharger GraphicsGale Architecte 3D (Platinum 2010)ARCHITECTE 3D (PLATINUM 2010)Architecte 3D Platinium vous permet de concevoir facilement les plans votre future maison, de l'é... Cliquez pour télécharger Architecte 3D TeamViewer 5 (TeamViewer 5)TEAMVIEWER 5 (TEAMVIEWER 5)Dépanner un ami,expliquer une manipulation devient un jeu d'enfant.
Prise en main d'un autre ord... Cliquez pour télécharger TeamViewer 5
|