Chapitre 26 : Publier en HTML


Dernière mise à jour  15 mars 2000 Auteur Gilles Maire
Serveur  http://www.ungi.com/htmlpub.htm Adresse Gilles.Maire@UNGI.com


 
 
 

Avant d'étudier comment faire un Web,  écrit en langage HTML nous allons présenter les différents procédés qu'il est possible de mettre en oeuvre pour atteindre ce but.

26.1 - Présentation HTML

Après avoir vu votre première page Web, vous avez découvert quelque chose de nouveau, bien plus sophistiqué que les pages Minitel. Ces pages Web sont d'accès libre, et dans chacune d'entre elles des références à d'autres pages Web vous permettent, au gré du choix de leur auteur, de découvrir de nouveaux horizons.

Vous avez pu découvrir trois grands types de page Web:

Les pages personnelles émanent d'individus qui communiquent des informations sur eux-mêmes, sur leurs passe temps, sur leur activité professionnelle.

Vous aussi, vous pouvez développer une page personnelle, avec un ou plusieurs des objectifs suivants:

Les pages HTML sont distribuées par un serveur qu'on appelle serveur HTTP selon le schéma présenté par la figure suivante

Nous allons présenter ici les différents moyens de production des pages HTML, laissant aux chapitres suivants le soin d'analyser les détails des principales implémentations.

Précisons que les pages HTML peuvent être générée manuellement au moyen d'éditeurs ou de façon dynamique par couplage avec des bases de données ou des CGI.

Dans la mesure, où l'on choisit la génération manuelle au moyen d'un éditeur, l'édition se fait au moyen d'un éditeur, et les pages HTML sont ensuite envoyées au serveurs HTTP généralement par une commande FTP.
 
 
 

La page Web sur un serveur HTTP

Le modèle des Web est un modèle client-serveur, c'est-à-dire une architecture dans laquelle un ensemble de logiciels, sur des matériels différents pourra se connecter à un service. Votre page devra obligatoirement être contrôlée par un serveur http(HyperText Transfert Protocol).

Trois choix s'offrent à vous:

Serveurs http publics

Vous pouvez faire héberger votre serveur http chez un professionnel ou dans une université intéressée par votre projet.

Généralement le professionnel désire réaliser lui même votre serveur Web et il vous offrira le service réalisation et hébergement.

Suivant la qualité du service fourni, la prestation peut aller de 500 F à 3000 F par mois pour l'hébergement. Pour la réalisation, tout dépend du niveau de complexité de votre serveur Web, des mécanismes mis en oeuvre, du couplage avec une base de données et plus généralement des développements informatiques qui peuvent résulter de votre cahier des charges.

En général les fournisseurs Internet incluent dans leur abonnement mensuel la possibilité pour chacun des utilisateurs de mettre sa page personnelle sur leur serveur.

Vous pouvez à ce titre vous référer au chapitre sur les fournisseurs en France.

Avoir un serveur http permanent

Faire son serveur http permanent est une solution peu onéreuse si vous possédez une ligne louée, mais qui est exclue si vous n'êtes pas prêt à investir 5000 F par mois pour l'opération. Ce budget de base de 60 000 F par an est exclus pour les petites entreprises sauf si elles utilisent la ligne Internet comme un moyen de communication. On citera les relations par courrier électronique avec un client, l'accès aux services News pour se tenir informé des innovations concernant un marché, l'accès au service telnet pour maintenir à distance les matériels informatiques d'un client.

Vous pouvez vous référer au chapitre sur les fournisseurs de lignes spécialisées en France.

Une fois la question de la ligne permanente résolue, vous devrez installer un serveur http sur un serveur (de type UNIX, Macintosh ou PC). Ceci pourra nécessiter une compilation du source ou juste une installation. Un serveur http est appelé httpd (http démon), en référence aux serveurs sur machine UNIX qui est basé sur un programme démon. Un programme démon est un programme qui fonctionne en permanence.

Un chapitre réservé aux serveurs http vous explicitera la mise en place d'un tel serveur.

Sur un serveur http intermittent

Sur votre PC ou votre Macintosh vous pouvez faire fonctionner votre serveur httpd le temps de vos connexions, ceci permet à vos amis de lire vos derniers romans, de voir votre photo depuis leur lecteur de Web.

Les logiciels utilisés seront les mêmes que ceux précédemment définis. On préférera utiliser un logiciel freeware aux fonctionnalités plus limitées mais suffisantes pour l'utilisation demandée.

Par contre, votre page Web changera d'adresse à chacune de vos connexions puisque généralement votre adresse TCP/IP (qui sera celle du serveur) changera à chacune de vos connexions.

Déclarer sa page Web

Quand vous aurez écrit votre page Web, et que vous l'aurez contrôlée, il vous faudra la déclarer afin que d'autres la lisent. Cette déclaration concerne uniquement l'indication de la localisation de votre page Web et non pas le transfert physique de votre serveur Web.

Cette déclaration ne peut se faire que si votre page Web n'est pas intermittente. Si elle est hébergée sur un serveur, quatre cas peuvent se présenter :

Vous pouvez bien évidemment retenir plusieurs choix parmi les quatre proposés.

Des points d'annonce

Cette liste donne des points de déclaration, moins connus mais parfois intéressants :

26.2 - Ecrire en HTML

Ecrire sa page Web, demande d'écrire dans un langage appelé le langage HTML. Ceci peut se faire de plusieurs façons: Avant de détailler les différents points, précisons que si vous voulez faire des choses assez fines, vous devez connaître le langage HTML. De plus sa connaissance vous permet de comprendre pas mal de subtilités au niveau des contraintes.

Regardons les produits dans nos deux environnements :
Sur PC windows

MacintoshSur Macintosh

26.3 - Autres moyens de production de documents HTML

Les pages HTML ne sont pas produites exclusivement par les éditeurs. Nousa allons présenter ici les moyens de production plus industriels.

Couplage bases de données

De Nestcape à Microsoft, toutes les sociétés qui diffusent de l?information en quantité sur Internet organisent leurs informations de façon structurée en base de données. Nous allons étudier comment cela peut se faire sur Intranet.

Il existe trois cas de figure où les informations distribuées par le Web ont intérêt à provenir d?une base de données.

On le comprend, il est plus simple d?utiliser les contrôles d?accès et les fonctions de tri d?un SGBD que de maintenir à plusieurs un site Web. Ces arguments sont renforcés par les avantages que l?on prête d?ordinaire aux SGBD : facilité de modélisation des données, requêtes d?accès modélisée, transaction supportée par le SGBD, gestion des autorisations, gestions des disques et des fichiers et environnement de développement de l?application.

Le dernier argument est primordial, car comme nous l?avons évoqué, les outils HTML n?en sont qu?à leur premières années d?expérience et les ateliers de développement d?application base de données ont été largement éprouvés.

Le chapitre sur les Bases de données en explicite les mécanismes de base.
 
 
 
 

Par programmes CGI

Les CGI, ces programmes qui s'exécutent sur des serveurs peuvent être lancés sur demande de l'utilisateur : Les CGI, peuvent exécuter des requêtes SQL, mais ceci reste à éviter car les serveurs HTTP sont dotés d'API bien plus efficaces. Il peuvent envoyer un courrier à un ensemble d'utilisateurs, gérer une liste de distribution, et s'interfacer plus généralement avec tous les programmes fonctionnant sur le serveur. Le passage d'un formulaire en commande UNIX, ou Windows étant trivial et ne demandant que quelques lignes de code, il est possible de lancer des programmes systèmes de façon conviviale.

Enfin il permettent l?exécution de requêtes présentées de façon graphique, par exemple le plan d'un étage permet de retrouver l'ensemble du personnels dans l'annuaire interrogé par le numéro de bureau, lui même calculé d'après les coordonnées de ce bureau. Ce type de requête n?est en effet pas disponible de façon standard sur les serveurs interfacés aux bases de données.

Les CGI sont explicités dans le chapitre sur PERL, le langage PERL étant le langage le plus adapté à la manipulation des fichiers textes que sont les fichiers HTML.

La reprise des documents existants

L'intérêt du Web est de permettre la diffusion sans frais d'édition de  nombreux types de documentations.Or il est de nombreux cas, où des documentations existent déjà dans l'entreprise et ou une publication sur le Web peut se faire par conversion.

Format papier

 Dans le cas où d'anciennes nomenclatures existent sous forme de document papier, il existe un certain nombre de produits permettant de scanner ces documents, de les archiver et de les mettre en ligne. Il existe deux produits permettant ce type d'approche, l'un, plus orienté saisie des documents, DocuWeb de Xerox avec un module d'acquisition puissant, l'autre, plus orienté  sur le format de sortie, Acrobat Capture d'Adobe.

DocuWeb est composé d'un scanner en entrée qui fonctionne à une vitesse de 20 pages par minutes. Ce scanner est piloté par un PC sous Windows qui permet de retoucher les images et fournis des pages au format TIFF qui sont ensuite converties en GIF pour être indexées par un système de base de données documentaire. Un driver HTML permet un accès par navigateur avec recherche sur critères et visualisation des pages sous la forme de GIF.

Acrobat Capture est une solution logicielle compatible avec les scanners norme TWAIN et ISIS qui donne un format de sortie en PDF . Cette solution peut être intégrée avec des produits comme Acrobat Catalog permettant une indexation et Acrobat Search permettant la recherche des documents.  Les fichiers PDF peuvent être publiés via le Web au moyen de Plug-Ins Nescape ou Internet Explorer.

HTMLisation

L'HTMLisation est la transformation de documents depuis un format de document donné vers le format HTML. Cette HTMLisation permet ainsi la publication de documents via un serveur HTTP. Notons certaines différences entre le format HTML et les possibilités offertes par les principaux  outils de traitement de texte présents ou de publication assistée par ordinateur : Le meilleurs convertisseur de document Word est le logiciel Word lui-même  qui intègre Word IA ( de base en version 7 et a insérer dans la version 6) et une extension de conversion Gif Extractor d?ImageStream.  Le premier de ces composants respecte les tailles de polices ainsi que leur nom, suivant la norme 3.2 de HTML (ce dernier point étant vrai uniquement en version Word 7).  Les tableaux, les numérotations de niveau 1, les bullets, les centrages ainsi que les  graissages sont respectés. Le deuxième des composants convertit toutes les images en GIF, les extraits dans des fichiers séparés. Dans ce cas l?image est centrée à gauche au bon emplacement dans le document, ne respectant pas sa position initiale. Dans la version antérieure Word 6, le logiciel Word IA qui doit être ajouté  pour obtenir des résultats similaires, est gratuit.

Notons, que deux Plug Ins identiques sous Excel en version 5 (Windows 95) et Power Point (windows 95) permettent de coder des documents Excel et PowerPoint en HTML.

La conversion de documents Excel se fait sous forme d?un tableau correspondant à la plage de cellules sélectionnées et elle se fait à l?aide d?un assistant.  Le code généré est en HTML pur et très bien enrichi. Par contre aucun graphisme ne subsiste. Le résultat est cependant exploitable sans retouche.

La conversion de documents Power Point se fait par menu et fournit un fichier HTML contenant du texte ainsi que des copies des transparents munis de boutons de navigation. Les pages correspondant aux diapositives sont reprise en image GIF ou JPEG, elles sont encapsulées dans un code HTML qui reproduit des boutons de navigation de la visionneuse PowerPoint. Le résultat est esthétique mais les fichiers images sont lourds à charger même sur un réseau à 64 Kb par seconde.

Les pages correspondant aux textes, ne contiennent que le contenu textuel des documents PowerPoint, sans aucune image.  Le résultat n?est pas esthétique mais les fichiers générés sont en revanche très compacts.

Reprise de documents HTML


Non ce n'est pas une boutade! Reprendre des documents existants en HTML n'est pas une chose aussi aisée qu'il y parait, en effet prenons l'exemple de la reprise de 200 documents HTML que l'on souhaite transformer en documents HTML dans la charte graphique d'une entreprise; voire  les transformer en XML.

La solution dans ces cas là doit être automatisée et il existe deux voies non forcément disjointes :

26.4 - Les images

Les images à insérer dans les pages HTML sont de deux sortes, les images GIF ou JPEG. Dans chacun de ces formats il existe un sous format permettant un affichage progressif de l'image, laissant la possibilité de ne pas charger l'intégralité de l'image si celle-ci ne présente pas d'intérêt.

En GIF, on distingue deux sous formats :

Les bibliothèques

Il existe des bibliothèques d'images GIF disponibles sur Internet. Elles sont parfois compressées, il est donc important avant de les charger sur votre système que vous ayez bien l'utilitaire de décompression idoine.

Nous vous donnons ici des pointeurs sur des bibliothèques :

donne une liste d'icones accessibles par thème et par classement alphabétique sur leur nom.

Images récupérées

Avec certains lecteurs de Web il est possible en cliquant sur une image de la sauver sur votre disque. Par ce procédé, vous pouvez récupérer une image GIF au hasard de vos promenades sur Internet.

Vous devez cependant vous assurer que l'image que vous récoltez n'est pas protégée par un copyright.

Logiciels d'images

A partir d'une image dans un format quelconque, vous pouvez effectuer une conversion vers une image au format GIF.

Il existe plusieurs logiciels gratuits ou peu onéreux pour réaliser ces conversions.

WindowsLview Pro V1.B

[Télécharger Windows 3]
[Télécharger Windows 95]
 

Freeware pour les particuliers

Shareware pour les professionnels

Prix : 30$
 
 

WindowsChargerPaint Shop Pro 5.1 (2,5 Mo)

Windows 95Charger Paint Shop Pro Windows 95 5.1 (2,5 Mo) Shareware : 500 F environ

Originalités :

MacintoshPhotoGif si vous disposez de PhotoShop 3.0 [Télécharger]

Macintoshclip to gif (freeware) dans le cas contraire [Télécharger]

Windows 95Microsoft fournit aussi son logiciel Microsoft Photo Editor. Dans la barre d'outils,  un bouton à cliquer permet de déposer sur l'image la couleur que l'on souhaite rendre transparenteraison précise. Ce logiciel Photo Editor se trouvedans le sous dossier Microsoft shared du dossier fichiers partagés dans 'program files' du disque dur.

Optimisation des images

La principale préoccupation concernant les images est d'optimiser leur taille afin de les rendre les plus légères possibles sans altérer de façon perspectible leur définition.

Il existe quelques bon logiciels générant un ensemble d'images  proposant de choisir l'optimisation souhaitée.

Citons Debabelizer qui est la référence en la matière mais reste un produit onéreux.
Le produit Web Graphix Optimizer [webopt.com] est un shareware qui est de très bonne facture donnant toutes les options nécessaires.

Pour ceux qui utilisent PhotoShop, le Plug Ins d'Ulead, SmartSaver est la réference.

Images fabriquées

La dernière méthode consiste à fabriquer vous-même votre image. Ceci peut se faire de deux façons :

Images animées

Le format Gif89a permet la concaténation de plusieurs images dans un seul et même fichier. Le résultat est la création d'une succession d'images donnant une impression d'animation.

 La page de référence à ce sujet est sur le serveur mindworkshop[www.mindworkshop.com/alchemy] et le logiciel gifconf.exe pour PC peut être chargé sur la page gifconf
[www.mindworkshop.com/alchemy/gifcon.html]

Le nouveau logiciel d'Ulead

 Les logiciels pour Macintosh sont également chargeables à cette même adresse.

 Une bibilothèque d'images animées parmi d'autres est la

Page d'Opsis
[www.mworld.fr/opsis].

 En plus, elle est en français!

26.5 - Nétiquette

Nétiquette sur les images

 Ne mettez pas dans vos pages des images de taille trop importante. Si vous le faites, mettez de petites images qui en cliquant dessus deviendront plus grosses. Rappelez-vous toujours que certains connectés utilisent des modems à basse vitesse.
Indiquez la taille des images lorsqu'elles font plus de 10 Ko de manière à donner au lecteur une idée de la taille du fichier qu'il chargera.

Les noms d'URL

Donnez des noms sans majuscule à vos adresses URL (c'est à dire aux noms de vos documents HTML). Certains utilisateurs novices ne sont pas familiers avec les noms et seront perdus s'ils doivent penser à respecter les noms en majuscules et en minuscules.

Essayer de donner des noms de service commençant par www. Appelez votre Web http://www.nom.org. Utiliser les possibilités de votre serveur http de mettre votre page principale comme page d'accueil pour que les connectés n'aient pas à entrer de nom de fichier.

Accès par les lecteurs de Web textuels

Pensez aux connectés qui désireront se connecter sans visualiser les images, ainsi mettez des légendes à côté de vos images. Utilisez l'option ALT dans les commandes IMG.

Protection de votre page

Protégez votre document HTML en incluant les symboles de Trademark ou de Copyright. Protégez vos écrits en déposant vos textes de temps en temps, sachez qu'une enveloppe timbrée que vous envoyez à un ami suffit légalement.

Donnez votre adresse Email en toutes lettres afin que les lecteurs intéressés puissent vous contacter pour vous poser d'éventuelles questions ou vous demander de corriger certaines inexactitudes dans votre page.

Indiquez l'adresse de votre page HTML car certains utilisateurs en auront peut-être une copie papier et souhaiteront se connecter à votre page.

 Donnez la date de la version actuelle et un numéro de version de votre page, ceci indiquera aux lecteurs si votre page comporte des nouveautés.

Respectez la loi de votre pays

En écrivant un Web, vous devez respecter les lois de droit d'auteur, vous n'avez pas le droit de publier des propos racistes, sexistes. Vous êtes tenu pour responsable des propos que vous pouvez tenir.

HautHautSuivantSommaireRechercheFenêtreGlossaireNouveauBientôtCourrierSouscriptionAideCopyright