Citations de commentaires et photos [ABANDON]

Problèmes, bugs et difficultés rencontrés sur le site.
Avatar du membre
Dominique
Messages : 3705
Enregistré le : 08 avr. 2006, 21:58

Citations de commentaires et photos [ABANDON]

Message par Dominique »

Bonjour,

Je (webmestre de chemineur.fr) ai pris l’initiative d’afficher sur mon site http://chemineur.fr des extraits des informations présentes sur les fiches de refuges.info ainsi que quelques commentaires et photographies.
Suivant la licence de refuges.info, j’accompagne ces citations d’une mention de copyright et d’un lien vers la fiche d’origine de refuges.info
Exemple : http://chemineur.fr/point/wri1647

Dans le but d’éviter de charger inutilement refuges.info,
* Les informations sont extraite en une fois et mises en cache au moyen :
- d’une exportation CSV (interface public) pour les informations sur les points
- d’une requête (page PHP crée spécifiquement dans ce but) pour les commentaires
* Les photographies sont extraites lors de leur premier affichage et stockées en cache pour tout réaffichage ultérieur.
Les caches sont vidés à intervalles réguliers (1 fois par mois environ ou à chaque besoin de resynchroniser)

Si cette initiative ne vous convienait pas, n’hésitez pas à m’en faire part, j’effectuerais toute modification ou retrait demandés

Cordialement
Modifié en dernier par Dominique le 02 mai 2012, 16:59, modifié 1 fois.
Avatar du membre
sly
Messages : 5041
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Message par sly »

Je n'y vois aucun inconvénients, je dirais même plus que je n'y vois que des avantages.

Coté technique :
Je trouve qu'il manque a l'exportation actuelle cette possibilité d'exporter photos et commentaires.
La raison principale est que je ne me suis jamais penché dessus, mais l'envie y est.
Dire : "les données de refuges.info peuvent être librement réutilisées" est un peu ridicule s'il n'existe pas de moyen de les récupérer.

Après, de façon technique, comment faire est un problème, puisqu'il n'est pas forcément aisé d'exporter 2.7 Go de photos. Et je doute que nous trouvions un format adapté déjà existant pour faire ça, reste donc à inventer le notre.
La syntaxe §§info1§§info2§§.... n'est pas forcément la plus jolie qui soit ;-) surtout si se balade le caractère § quelque part dans un commentaire, mais bon, si ça répond au besoin après tout pourquoi pas.

Un jour peut-être je ferais un joli export avec les points, les commentaires, les auteurs, dans un très bel arbre xml
Avatar du membre
Dominique
Messages : 3705
Enregistré le : 08 avr. 2006, 21:58

Message par Dominique »

sly a écrit :Un jour peut-être je ferais un joli export avec les points, les commentaires, les auteurs, dans un très bel arbre xml
Une des solutions est d’encoder la page point pour que les données qu’elle contient soient faciles à extraire.
J'avais fait il y a quelque temps des expérimentations à base de microformats (les pages de Chemineur sont au format vcard).
J'avais même écrit un point2.php sur WRI qui affichait les points avec les balises qui vont bien.
Il existe des librairies spécialisées dans l'extraction du format Vcard mais Vcard n'est pas assez standardisé dés qu'on s'éloigne des 2 ou 3 infos de base (nom, géolocalisation, ...), il faut bricoler la librairie et le résultat n'a pas à été plus performant qu'un simple extracteur de html paramétrable (ce qu'utilisent les fonctions agrégation de Drupal par exemple)
Et puis de toutes façon, ce n'est utilisable que sur un site ayant décidé d'implémenter Vcard
Avatar du membre
sly
Messages : 5041
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Message par sly »

Dominique a écrit : Une des solutions est d’encoder la page point pour que les données qu’elle contient soient faciles à extraire.
Je sens là une forme de bidouillage, pour moi HTML a avant tout un but de présentation de l'information, pas tant de partage de l'information. Si quelqu'un veut tout récupérer ça l'oblige à demander l'une après l'autre chaque page du site pour en récupérer les informations. Alors que l'exportation actuelle, par exemple, permet de récupérer toute la base d'un coup, ce qui, avouons le, et tout de même plus pratique !

Certes, j'en conviens, ça oblige à faire deux programmes (présentation et exportation) au lieu d'un, mais il doivent être plus simple et flexibles à faire
Avatar du membre
Dominique
Messages : 3705
Enregistré le : 08 avr. 2006, 21:58

Message par Dominique »

sly a écrit :Je sens là une forme de bidouillage
Heu non, c'était une idée tirée du "Web sémantique":
- les pages actuelles sont construites pour pouvoir êtres lues par des humains, pas par un programme
- l'idée du web sémantique est de séparer le producteur d'info (WRI) de sa présentation (un site portail ou fédérateur). Dans ce sens, le portail doit savoir interpréter la page de son producteur d'info.
C'était la théorie, mais comme rien n'est vraiment normalisé et que l'idée n'a pas eu beaucoup de succès, quelques essais m'ont convaincus qu'il n'était pas plus facile d'extraire de l'info d'une page incorporant des balises Vcards que ne n'importe laquelle, aussi mal foutu soit elle.
Le but est d'aller chercher en temps réel les infos sur le site producteur (lorsqu'on visualise un point sur le portail par exemple). Ainsi, l'info est toujours valide sans nécessiter de remoulinage périodique.
Je suis en train de faire quelques expériences mais, pour l'instant, je tâtonne un peu.
Avatar du membre
sly
Messages : 5041
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Message par sly »

Dominique a écrit : - l'idée du web sémantique est de séparer le producteur d'info (WRI) de sa présentation (un site portail ou fédérateur). Dans ce sens, le portail doit savoir interpréter la page de son producteur d'info.
Oui mais dans notre cas wri est le producteur et le présentateur de l'information, donc le concept est là mais traité en interne.

On a la chaine production -> stockage -> extraction -> présentation directement sur wri

Le composant "extraction" c'est grosso modo la fonction interne qui s'appelle recherche_point() (ou nom approchant) il ne reste donc plus qu'a lui brancher le composant présentation (c'est la page point.php) et ceux d'exportation (resterait juste à faire celui qui exporte photos et commentaires et le tour est joué, ce que tu as déjà plus ou moins fais dans une version home-made)

Je ne vois donc pas d'intérêt à dénaturer le composant présentation pour en faire un mutant présentation/exportation

comme c'est d'ailleurs fais sur wri ou sur les blogs avec le système RSS
Le but est d'aller chercher en temps réel les infos sur le site producteur (lorsqu'on visualise un point sur le portail par exemple). Ainsi, l'info est toujours valide sans nécessiter de remoulinage périodique.
Je suis en train de faire quelques expériences mais, pour l'instant, je tâtonne un peu.
C'est déjà ce que tu as fais avec OpenLayers qui est un client de présentation, qui pourrait tout aussi bien être sur wri que sur chemineur.fr, la seule chose qu'il pourrait manquer encore une fois ce sont les photos et commentaires
Avatar du membre
Dominique
Messages : 3705
Enregistré le : 08 avr. 2006, 21:58

Message par Dominique »

sly a écrit :Oui mais dans notre cas wri est le producteur et le présentateur de l'information, donc le concept est là mais traité en interne.
Ben oui, au niveau 1 ça n'a pas de sens
sly a écrit :Je ne vois donc pas d'intérêt à dénaturer le composant présentation pour en faire un mutant présentation/exportation
Le Vcard ne dénature rien. Au contraire, il structure l'info (en fait il s'appuie sur CSS pour séparer info & présentation)
sly a écrit :la seule chose qu'il pourrait manquer encore une fois ce sont les photos et commentaires
Oui, c'est ça : un site qui affiche sur la même page toutes les photos et commentaires disponibles sur un certain nombre de sites de montagne.
Un bref essai sur Chemineur nous a convaincu que le résultat est très bordélique. Je creuse quand même l'idée, mais je tâtonne un peu.
Invité

Message par Invité »

Dominique a écrit : Un bref essai sur Chemineur nous a convaincu que le résultat est très bordélique...
Sauf à consacrer un temps fou pour corriger, compléter, affiner ou supprimer les approximations, bourdes, bêtises, etc. qui représentent 50% du contenu des sites "spécialisés" (type c2c et consorts), les autres étant carrément à fuir : internet c'est parfois le meilleur, pour la tendance "perfectionniste" (WRI, chemineur... mais si, mais si !) mais le plus souvent le pire. Je reste donc sceptique sur la validité globale du concept d'agglomération (portail) : c'est un peu comme faire une transfusion de sang infecté dans un organisme sain... : faut mettre le récepteur en permanence sous antibiotiques !