begin process at 2012 02 13 11:43:06
  Trouver un code source :
 
dans
 
Accueil > Forum > 

JAVA / J2EE / J2ME

 > 

Système

 > 

API

 > 

Parser du HTML


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

Parser du HTML

samedi 1 décembre 2007 à 10:02:47 | Parser du HTML

JALEO WAHRANI

Bonjour à tous,
j'utilise actuellement htmlparser pour parser du HTML (logique !). Cependant je bute sur un problème car je voudrais ouvrir un fichier, supprimer certaines balises puis sauvegarder le résultat. Or, il y a 2 opérations que je n'arrive pas à faire:

  • retrouver toutes les balises que je veux supprimer
  • supprimer et sauvegarder
Lorsque je cherche les balises "script", le parser ne me trouve que les balises
<script ...> /* bla bla bla </script>
Les balises <script ... src=""></script> semblent ignorées

De plus, je ne sais comment supprimer les balises qui sont retrouvées et encore moins comment sauvegarder le fichier une fois les balises en question supprimées.

Merci d'avance
samedi 1 décembre 2007 à 10:35:02 | Re : Parser du HTML

gouessej

Récupère la liste des noeuds au moment où tu parses :

Parser parser = new Parser ("ta_page.html");
NodeList liste_de_noeuds = parser.parse (null);
NodeList mes_noeuds_script = liste_de_noeuds.extractAllNodesThatMatch (new TagNameFilter ("script"));

Ensuite, parcours ta liste en appliquant la méthode removeAll() et ça devrait suffire. J'espère que ça t'avance un peu.

TUER : http://membres.lycos.fr/javalution/tuer.php

yeah! vive java
vendredi 20 février 2009 à 16:50:41 | Re : Parser du HTML

oussamad

Bonjour.
Je utilise ?javax.swing.test.html.parser ? , comment extrait les informations d'un fichier html et stocker les informations dans fichier XML.

Merci d'avance.


Cette discussion est classée dans : fichier, html, parser, bla, balises


Répondre à ce message

Sujets en rapport avec ce message

Parser HTML [ par jeanphi6 ] Bonjour,  je voudrais parser un fichier HTML. Comme le HTML provient du meme langage que le XML, j'ai utiliser un parser SAX. Mais la page HTML doit ê Comment générer du html a partir d'un fichier xml et du java [ par shefiu ] Slt a tous !J'aimerais savoir comment je pourrais générer du html a partir d'un fichier xml et d'un code source java. Je sais qu'il est possible de fa extraction des données d'un fichier HTML et les remettre dans une base de données [ par kawtarinpt ] bonjour j'ai besoin dans mon application d'extraire des données d'un fichier HTML et les remettre dans une base de données Oracle. Alors, j'aimerais b Parser un fichier text en java (tokens) [ par theunknown0o ] Bonjour,j'aimerai avoir un code qui pourrait parser en java un fichier texte le texte: ligne 1==> ab=X cd=Y ef=Zj'aimerai avoir a la fin ke les valeur Récupérer données formulaire html [ par bidule7 ] Bonjour, voilà, j'ai créé un formulaire HTML avec Netbeans. Quand on le remplit, ça devrait créer un fichier XML rempli avec les valeurs entrées dans parseur xml [ par neg03 ] Bonjour, J'ai réalisé un parseur XML qui récupère certaines informations entre des balises et les insére dans une base de données. Mon problème est q JDOM [ par armand19841984 ] Salut,J'utilise Jdom dans le cadre d'un projet universitaire.Mon problème est que j'aarive à parser un fichier html en document Jdom et à faire des mo Manipulation des balises XML [ par ismailfk ] Bonjour,j'ai besoin de manipuler les balises dans un fichier xml. En effet, j'ai un fichier XML Alex 29 je veux éliminer la balise age sans supprimer recuperer une image integrer ds un fichier html [ par ammouna0707 ] comment obtenir le non ou l'adresse physique d'une image integrer dans un fichier html etant donné que j'ai cherger le fichier html dans jeditor et le Importation RTF ou HTML ligne à ligne [ par internetowl8000 ] Bonsoir,Je cherche à importer un fichier RTF ou HTML possiblement codé salement (créé par un export depuis word ou powerpoint). Seulement je ne veux p


Nos sponsors


Sondage...

CalendriCode

Février 2012
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
272829    

Consulter la suite du CalendriCode

Photothèque

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,530 sec (4)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales