Bienvenue sur PostGIS.fr

Bienvenue sur PostGIS.fr , le site de la communauté des utilisateurs francophones de PostGIS.

PostGIS ajoute le support d'objets géographique à la base de données PostgreSQL. En effet, PostGIS "spatialise" le serverur PostgreSQL, ce qui permet de l'utiliser comme une base de données SIG.

Maintenu à jour, en fonction de nos disponibilités et des diverses sorties des outils que nous testons, nous vous proposons l'ensemble de nos travaux publiés en langue française.

source: trunk/workshop-foss4g/introduction.rst @ 78

Revision 60, 20.7 KB checked in by thomasg, 13 years ago (diff)

Fix typos until loading_data.rst

RevLine 
[1]1.. _introduction:
2
[60]3Partie 1 : Introduction
[1]4************************
5
6Qu'est-ce qu'une base de données spatiales ?
7============================================
8
[42]9PostGIS est une base de données spatiale. Oracle Spatial et SQL Server 2008 sont aussi des bases de données spatiales. Mais qu'est-ce que cela signifie? Qu'est-ce qui différencie un serveur de base de données spatiales d'un serveur de base de données non spatiale ?
[1]10
11La réponse courte, est ...
12
[60]13**Les bases de données spatiales permettent le stockage et la manipulation des objets spatiaux comme les autres objets de la base de données.**
[1]14
[60]15Ce qui suit présente briÚvement l'évolution des bases de données spatiales, puis les liens
16entre les données spatiales et la base de données (types de données, index et fonctions).
[1]17
[60]18#. **Types de données spatiales** fait référence aux géométries de type point, ligne et polygone;
[37]19#. L'**indexation spatiale** est utilisée pour améliorer les performances d'exécution des opérations spatiales;
20#. Les **fonctions spatiales**, au sens :term:`SQL`, sont utilisées pour accéder à des propriétés ou à des relations spatiales.
[1]21
[60]22Utilisés de maniÚre combinée, les types de données spatiales, les index et les fonctions fournissent une structure flexible pour optimiser les performances et les analyses.
[1]23
24Au commencement
25----------------
26
[60]27Dans les premiÚres implémentations :term:`SIG`, toutes les données spatiales étaient stockées sous la forme de fichiers plats et certaines applications :term:`SIG` spécifiques étaient nécessaires pour les interpréter et les manipuler. Ces outils de gestion de premiÚre génération avaient été conçus pour répondre aux besoins des utilisateurs pour lesquels toutes les données étaient localisées au sein de leur agence. Ces outils propriétaires étaient des systÚmes specifiquement créés pour gérer les données spatiales.
[1]28
[60]29La seconde génération des systÚmes de gestion de données spatiales stockait certaines données dans une base de données relationelle (habituellement les "attributs" ou autres parties non spatiales) mais ne fournissaient pas encore la flexibilité offerte par une intégration complÚte des données spatiales.
[1]30
[60]31**Effectivement, les bases de données spatiales sont nées lorsque les gens ont commencé à considérer les objet spatiaux comme les autres objets d'une base de données .**
[1]32
[60]33Les bases de données spatiales intÚgrent les données spatiales sous forme d'objets de la base de données relationnelle. Le changement opéré passe d'une vision centrée sur le SIG à une vision centrée sur les bases de données.
[1]34
35.. image:: ./introduction/beginning.png
36
[60]37.. note:: Un systÚme de gestion de base de données peut être utilisé dans d'autres cadres que celui des SIG. Les bases de données spatiales sont utilisées dans divers domaines : l'anatomie humaine, les circuits intégrés de grandes envergures, les structures moléculaires, les champs electro-magnétiques et bien d'autres encore.
[1]38
39
[4]40Les types de données spatiales
41------------------------------
[1]42
[60]43Une base de données classique propose par exemple les types chaînes de caractÚres et date. Une base de données spatiales ajoute les types de données (spatiales) pour représenter les **entités géographiques**. Ces types de données spatiales permettent d'accéder à des propriétés de l'entité géographique comme ses contours ou sa dimension. Pour bien des aspects, les types de données spatiales peuvent être vus simplement comme des formes.
[1]44
45.. image:: ./introduction/hierarchy.png
46   :align: center
47
[60]48Les types de données spatiales sont organisés par une hiérarchie de type. Chaque sous-type hérite de la structure (les attributs) et du comportement (les méthodes et fonctions) de son type supérieur dans la hierarchie.
[1]49
50
[60]51Index spatiaux et étendue
[4]52---------------------------
[1]53
[60]54Une base de données ordinaire fournit des "méthodes d'accÚs" -- connues sous le nom d'**index** -- pour permettre un accÚs efficace et non séquentiel à un sous ensemble de données. L'indexation des types non géographiques (nombre, chaînes de caractÚres, dates) est habituellement faite à l'aide des index de type `arbres binaires <http://en.wikipedia.org/wiki/B-tree>`__. Un arbre binaire est un partitionnement des données utilisant l'ordre naturel pour stocker les données hiérarchiquement.
[1]55
[60]56L'ordre naturel des nombres, des chaînes de caractÚres et des dates est assez simple à déterminer -- chaque valeur est inférieure, plus grande ou égale à toutes les autres valeurs. Mais, étant donné que les polygones peuvent se chevaucher, peuvent être contenus dans un autre et sont représentés par un tableau en deux dimensions (ou plus), un arbre binaire ne convient pas pour indexer les valeurs. Les vraies bases de données spatiales fournissent un "index spatial" qui répond plutÎt à la question : "quel objet se trouve dans une étendue spécifique ?"
[1]57
[4]58Une **étendue** correspond au rectangle de plus petite taille capable de contenir un objet géographique.
[1]59
60.. image:: ./introduction/boundingbox.png
61   :align: center
62
[60]63Les étendues sont utilisées car répondre à la question : "est-ce que A se trouve à l'intérieur de B ? " est une opération coûteuse pour les polygones mais rapide dans le cas ou ce sont des rectangles. Même des polygones et des lignes complexes peuvent être représentés par une simple étendue.
[1]64
[45]65Les index spatiaux doivent réaliser leur ordonnancement rapidement afin d'être utiles. Donc au lieu de fournir des résultats exacts, comme le font les arbres binaires, les index spatiaux fournissent des résultats approximatifs. La question "quelles lignes sont à l'intérieur de ce polygone" sera interprétée par un index spatial comme : "quelles lignes ont une étendue qui est contenue dans l'étendue de ce polygone ?"
[1]66
[37]67Les incréments spatiaux réels mis en application par diverses bases de données varient considérablement.
[60]68Les index spatiaux actuellement utilisés par les différents systÚmes de gestion de bases de données varient aussi considérablement. L'implémentation la plus commune est l'`arbre R <http://en.wikipedia.org/wiki/R-tree>`_ (utilisé dans PostGIS), mais il existe aussi des implémentations de type `Quadtrees <http://en.wikipedia.org/wiki/Quadtree>`_, et des `index basés sur une grille <http://en.wikipedia.org/wiki/Grid_(spatial_index)>`_.
[1]69
[60]70Les fonctions spatiales
71-----------------------
[1]72
[60]73Pour manipuler les données lors d'une requête, une base de données classique fournit des **fonctions** comme la concaténation de chaînes de caractÚres, le calcul de la clef md5 d'une chaîne, la réalisation d'opérations mathématiques sur les nombres ou l'extraction d'informations spécifiques sur une date. Une base de données spatiales fournit un ensemble complet de fonctions pour analyser les composants géographiques, déterminer les relations spatiales et manipuler les objets géographiques. Ces fonctions spatiales sont utilisées comme des piÚces de Lego pour de nombreux projets SIG.
[1]74
[9]75La majorité des fonctions spatiales peuvent être regroupées dans l'une des cinq catégories suivantes :
[1]76
[60]77#. **Conversion**: fonctions qui *convertissent* les données géographiques dans un format externe.
78#. **Gestion**: fonctions qui permettent de *gérer* les informations relatives  aux tables spatiales et l'administration de PostGIS.
79#. **Récupération**: fonctions qui permettent de *récupérer* les propriétés et les mesures d'une géométrie.
80#. **Comparaison**: fonctions qui permettent de *comparer* deux géométries en respectant leurs relations spatiales.
81#. **Contruction**: fonctions qui permettent de *construire* de nouvelles géométries à partir d'autres.
[1]82
[60]83La liste des fonctions possibles est trÚs vaste, mais un ensemble commun à l'ensemble des implémentations est défini par la spécification term:`OGC` :term:`SFSQL`. Cet ensemble commun (avec d'autres fonctions supplémentaires) est implémenté dans PostGIS.
[1]84
85
[60]86Qu'est-ce que PostGIS ?
87=======================
[1]88
[60]89PostGIS confÚre au `systÚme de gestion de base de données PostgreSQL <http://www.postgresql.org/>`_ le statut de base de données spatiales en ajoutant les trois supports suivants : les types de données spatiales, les index et les fonctions. Étant donné qu'il est basé sur PostgreSQL, PostGIS bénéficie automatiquement des capacités orientées "entreprise" ainsi que le respect des standards de cette implémentation.
[1]90
[9]91Mais qu'est-ce que PostgreSQL ?
92-------------------------------
[1]93
[60]94PostgreSQL est un puissant systÚme de gestion de données relationnel à objets (SGBDRO). Il a été publié sous la licence de style BSD et est donc un logiciel libre. Comme avec beaucoup de logiciels libres, PostgreSQL n'est pas contrÎlé par une société unique mais par une communauté de développeurs et de sociétés qui le développe.
[1]95
[60]96PostgreSQL a été conçu depuis le début en conservant à l'esprit qu'il serait potentiellement nécessaire de l'étendre à l'aide d'extensions particuliÚres -- la possibilité d'ajouter de nouveaux types, des nouvelles fonctions et des méthodes d'accÚs à chaud. Grâce à cela, une extension de PostgreSQL peut être développée par une équipe de développement indépendante, bien que le lien soit trÚs fortement lié au coeur de la base de données PostgreSQL.
[1]97
[9]98Pourquoi choisir PostgreSQL ?
99~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
[1]100
[37]101Une question que se posent souvent les gens déja familiarisés avec les bases de données libres est : "Pourquoi PostGIS n'a pas été basé sur MySQL ?"
[1]102
[9]103PostgreSQL a:
[1]104
[60]105  * prouvé sa fiabilité et son respect de l'intégrité des données (propriétés ACID)
[9]106  * un support soigneux des standard SQL (respecte la norme SQL92)
107  * un support pour le développement d'extensions et de nouvelles fonctions
[60]108  * un modÚle de développement communautaire
[9]109  * pas de limite sur la taille des colonne (les tuples peuvent être "TOAST"és) pour supporter des objets géographiques
[60]110  * un structure d'index générique (GiST) permettant l'indexation à l'aide d'arbres R
111  * une facilité d'ajout de fonctions personalisées
[1]112
[60]113Tout ceci combiné, PostgreSQL permet un cheminement simple du développement nécessaire à l'ajout des types spatiaux. Dans le monde propriétaire, seul Illustra (maintenant Informix Universal Server) permet une extension aussi simple. Ceci n'est pas une coïncidence, Illustra est une version propriétaire modifiée du code original de PostgreSQL publié dans les années 1980.
[1]114
[60]115Puisque le cheminement du développement nécessaire à l'ajout de types à PostgreSQL est direct, il semblait naturel de commencer par là. Lorsque MySQL a publié des types de données spatiaux de base dans sa version 4.1, l'équipe de PostGIS a jeté un coup d'oeil dans leur code source et cela a confirmé le choix initial d'utiliser PostgreSQL. Puisque les objets géographiques de MySQL doivent être considérés comme un cas particulier de chaînes de caractÚres, le code de MySQL a été diffus dans l'intégralité du code de base. Le développement de PostGIS version 0.1 a pris un mois. Réaliser un projet "MyGIS" 0.1 aurait pris beaucoup plus de temps, c'est sans doute pourquoi il n'a jamais vu le jour.
[1]116
[37]117Pourquoi pas des fichiers Shapefile ?
[60]118-------------------------------------
[1]119
[60]120Les fichiers `shapefile <http://en.wikipedia.org/wiki/Shapefile>`_ (et les autres formats) ont été la maniÚre standard de stocker et d'interagir avec les données spatiales depuis l'origine des SIG. Néanmoins, ces fichiers "plats" ont les inconvénients suivants :
[1]121
[60]122* **Les fichier au formats SIG requiÚrent un logiciel spécifique pour les lire et les écrire.**  Le langage SQL est une abstraction de l'accÚs aléatoire aux données et à leur analyse. Sans cette abstraction, vous devrez développer l'accÚs et l'analyse par vos propre moyens.
123* **L'accÚs concurrent aux données peut parfois entraîner un stockage de données corrompues.** Alors qu'il est possible d'écrire du code supplémentaire afin de garantir la cohérence des données, une fois ce problÚme solutionné et celui de la performance associée, vous aurez re-écrit la partie la plus importante d'un systÚme de base de données. Pourquoi ne pas simplement utiliser une base de données standard dans ce cas ?
124* **Les questions compliquées nécessitent des logiciels compliqués pour y répondre.** Les question intéressantes et compliquées (jointures spatiales, aggrégations, etc) qui sont exprimables en une ligne de SQL grâce à la base de données, nécessitent une centaine de lignes de code spécifiques pour y répondre dans le cas de fichiers.
[1]125
[60]126La plupart des utilisateurs de PostGIS ont mis en place des systÚmes où diverses applications sont susceptibles d'accéder aux données, et donc d'avoir les méthodes d'accÚs SQL standard, qui simplifient le déploiement et le développement. Certains utilisateurs travaillent avec de grands jeux de données sous forme de fichiers, qui peuvent être segmentés en plusieurs fichiers, mais dans une base de données ces données peuvent être stockées dans une seule grande table.
[1]127
[60]128En résumé, la combinaison du support de l'accÚs concurrent, des requêtes complexes spécifiques et de la performance sur de grands jeux de données différencient les bases de données spatiales des systÚmes utilisant des fichiers.
[1]129
[37]130Un bref historique de PostGIS
[9]131------------------------------
[1]132
[60]133En mai 2001, la société `Refractions Research <http://www.refractions.net/>`_  publie la premiÚre version de PostGIS. PostGIS 0.1 fournissait les objets, les index et des fonctions utiles. Le résultat était une base de données permettant le stockage et l'accÚs mais pas encore l'analyse.
[1]134
[37]135Comme le nombre de fonctions augmentait, le besoin d'un principe d'organisation devint clair. La spécification "Simple Features for SQL" (:term:`SFSQL`) publiée par l'Open Geospatial Consortium fournit une telle structure avec des indications pour le nommage des fonctions et les pré-requis.
[1]136
[60]137Avec le support dans PostGIS de simples fonctions d'analyses et de jointures spatiales,
[9]138`Mapserver <http://mapserver.org/>`_ devint la premiÚre application externe permettant de visualiser les données de la base de données.
[1]139
[60]140Au cours de ces derniÚres années, le nombre de fonctions fournies par PostGIS grandissait, mais leur puissance restait limitée. La plupart des fonctions intéressantes (ex : ST_Intersects(), ST_Buffer(), ST_Union()) étaient difficiles à implémenter. Les écrire en repartant du début promettait des années de travail.
[1]141
[37]142Heureusement un second projet, nommé "Geometry Engine, Open Source" ou `GEOS <http://trac.osgeo.org/geos>`_ vit le jour. Cette librairie fournit l'ensemble des algorithmes nécessaires à l'implémentation de la spécification :term:`SFSQL` . En se liant à GEOS, PostGIS fournit alors le support complet de la :term:`SFSQL` depuis la version 0.8.
[9]143
[60]144Alors que les capacités de PostGIS grandissaient, un autre problÚme fit surface : la représentation utilisée pour stocker les géométries n'était pas assez efficace. Pour de petits objets comme les points ou de courtes lignes, les métadonnées dans la représentation occupaient plus de 300% supplémentaires. Pour des raisons de performances, il fut nécessaire de faire faire un régime à la représentation. En réduisant l'entête des métadonnées et les dimensions requises, l'espace supplémentaire fut réduit drastiquement. Dans PostGIS 1.0, cette nouvelle représentation plus rapide et plus légÚre devint la représentation par défaut.
[1]145
[60]146Les mises à jour récentes de PostGIS ont permis d'étendre la compatibilité avec les standards, d'ajouter les géométries courbes et les signatures de fonctions spécifiées dans la norme ISO :term:`SQL/MM`. Dans un soucis de performance, PostGIS 1.4 a aussi augmenté considérablement la rapidité d'exécution des fonctions de tests sur les géométries.
[1]147
[60]148Qui utilise PostGIS ?
149---------------------
[1]150
[60]151Pour une liste complÚte des cas d'utilisation, consultez la page web : `Cas d'utilisations de PostGIS (en anglais) <http://www.postgis.org/documentation/casestudies/>`_.
[1]152
[60]153Institut Géographique National, France
[1]154~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
155
[60]156L'IGN utilise PostGIS pour stocker des cartes topographiques de grande résolution de la France : la "BDUni". La BDUni a plus de 100 millions d'entités, et est maintenue par une équipe de 100 personnes qui vérifie les observations et ajoute quotidiennement de nouvelles données à la base. L'installation de l'IGN utilise le systÚme transactionnel de la base de données pour assurer la consistance durant les phases de mises à jour et utilise un `serveur de warm-standby par transfert de journaux <http://docs.postgresql.fr/9.1/warm-standby.html>`_ afin de conserver un état cohérent en cas de défaillance du systÚme.
[1]157
158GlobeXplorer
159~~~~~~~~~~~~
160
[60]161GlobeXplorer est un service web fournissant un accÚs en ligne à une imagerie satellite et photos aériennes de plusieurs petabytes. GlobeXplorer utilise PostGIS pour gérer les métadonnées associées avec le catalogue d'images. Les requêtes pour accéder aux images recherchent d'abord dans le catalogue PostGIS pour récupérer la localisation des images demandées, puis récupÚrent ces images et les retournent au client. Lors du proccessus de mise en place de leur systÚme, GlobeXplorer a essayé d'autres systÚmes de base de données spatiales mais a conservé PostGIS à cause de la combinaison du prix et de la performance qu'il offre.
[1]162
[45]163Quest-ce qu'une application qui supporte PostGIS ?
[60]164--------------------------------------------------
[1]165
[60]166PostGIS est devenu une base de données spatiale communément utilisée, et le nombre d'applications tierces qui supportent le stockage ou la récupération des données n'a cessé d'augmenter. `Les application qui supportent PostGIS <http://trac.osgeo.org/postgis/wiki/UsersWikiToolsSupportPostgis>`_  contiennent à la fois des applications libres et des application propriétaires tournant sur un serveur ou localement depuis votre bureau.
[1]167
[10]168La table suivante propose une liste des logiciels qui tirent profit de PostGIS :
[1]169
170+-------------------------------------------------+----------------------------------------------+
[12]171| Libre/Gratuit                                   | Fermé/Propriétaire                           |
[1]172+=================================================+==============================================+
[60]173|                                                 |                                              |
174| * Chargement/Extraction                         | * Chargement/Extraction                      |
175|                                                 |                                              |
176|   * Shp2Pgsql                                   |   * Safe FME Desktop Translator/Converter    |
177|   * ogr2ogr                                     |                                              |
178|   * Dxf2PostGIS                                 |                                              |
179|                                                 | * Basé sur le web                            |
180| * Basé sur le web                               |                                              |
181|                                                 |   * Ionic Red Spider (now ERDAS)             |
182|   * Mapserver                                   |   * Cadcorp GeognoSIS                        |
183|   * GeoServer (Java-based WFS / WMS -server )   |   * Iwan Mapserver                           |
184|   * SharpMap SDK - for ASP.NET 2.0              |   * MapDotNet Server                         |
185|   * MapGuide Open Source (using FDO)            |   * MapGuide Enterprise (using FDO)          |
186|                                                 |   * ESRI ArcGIS Server 9.3+                  |
187| * Logiciels bureautiques                        |                                              |
188|                                                 | * Logiciels bureautiques                     |
189|   * uDig                                        |                                              |
190|   * QGIS                                        |   * Cadcorp SIS                              |
191|   * mezoGIS                                     |   * Microimages TNTmips GIS                  |
192|   * OpenJUMP                                    |   * ESRI ArcGIS 9.3+                         |
193|   * OpenEV                                      |   * Manifold                                 |
194|   * SharpMap SDK for Microsoft.NET 2.0          |   * GeoConcept                               |
195|   * ZigGIS for ArcGIS/ArcObjects.NET            |   * MapInfo (v10)                            |
196|   * GvSIG                                       |   * AutoCAD Map 3D (using FDO)               |
197|   * GRASS                                       |                                              |
198|                                                 |                                              |
[1]199+-------------------------------------------------+----------------------------------------------+
200
Note: See TracBrowser for help on using the repository browser.