OpenData.qc

jeudi 29 août 2013

Les données KML de la Ville de Québec disponible en format RDF

Pour la durée du hackathon je rends disponible un service SPARQL qui expose tous les fichiers KML de la Ville de Québec qui proviennent de leur site :

http://donnees.ville.quebec.qc.ca/catalogue.aspx

Le SPARQL endpoint utilise le triplestore Virtuoso, un logiciel libre disponible ici http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VOSDownload.

Les données peuvent être consultés en mode HTML via le lien suivant http://virtuoso-7.bio2rdf.org/fct mais surtout on peut y soumettre des requêtes SPARQL via http://virtuoso-7.bio2rdf.org/sparql.

Enfin pour les hackers les données extraites via SPARQL sont disponibles en format texte, XML ou JSON. A vous de choisir selon vos préférences.

Bonne compétition à tous.

mercredi 28 août 2013

En route vers le pique-nique numérique

Enfin un hackathon sur les données ouvertes à Québec, la compétition est lancée.

http://piquenique.quebecnumerique.com

Bonne chance aux hackers qui y participeront. j'y serai.

samedi 25 février 2012

My Hacking Health Project

I got into the Oscar team Clinic in a box and we will create a semantic interface for mobile to create a light mobile app to get to :

Oscar patient list
Drug list from DPD
Drug interactions for a specific patient.

Nicolas works on it.

vendredi 24 février 2012

Drug Product Database in a Virtuoso triplestore to play with at Hacking Health

I will be bringing the Canadian Drug Product Database to the Hacking Health Hackhaton to play with in RDF format and store in a Virtuoso triplestore. The same technology used to publish Wikipedia according to the Semantic Web standard, the software used by DBpedia project.

So here is the facet browser

http://ec2-67-202-32-189.compute-1.amazonaws.com/fct/

Do a "aspirin" text search.

And here is the SPARQL endpoint.

http://ec2-67-202-32-189.compute-1.amazonaws.com/sparql

Try those two SPARQL queries to discover the structure of the database.

# predicates by type

select ?t ?p count(*)
where { graph <http://dpd.bio2rdf.org> {
?s a ?t .
?s ?p ?o .
}}

#relations between types

select ?t1 ?p1 ?t2 count(*)
where { graph <http://dpd.bio2rdf.org> {
?s1 a ?t1 .
?s1 ?p1 ?s2 .
?s2 a ?t2 .
}}

Have fun

I will be glad to meet programmer to help me but that important database into nurse's and doctor's Android phone and iPhone.

See you in Montreal tonight.

mercredi 22 février 2012

Donnez-nous des données, on va les libérer...

http://docs.google.com/present/edit?id=0AcbMcen77GzHZGNrcnhtYjJfMzBmZjlxem5kag

ou comment passer du mode web 1.0 au web 3.0, c'est-à-dire de

Drug Product Database Online Query

vers un

DPD SPARQL endpoint

mardi 1 février 2011

Invitation aux webmestres du gouvernement du Québec à participer à l'OpenCampQc du 16 février prochain à Québec

Cher collègues webmestres de la fonction publique québécoise, j'ai eu le plaisir en avril 2002 d'organiser avec Benoît Girard une activité WebMaestro sur les logiciels libres, à cette occasion Apache, Tomcat et PHP étaient au programme. Que de chemin parcouru depuis dix ans. Les logiciels libres étaient encore suspects, c'est vrai souvenez-vous. C'était à cette époque la transition entre le web 1.0 et celle du web 2.0 plus dynamique. Nous voilà maintenant au seuil du web 3.o : le web sémantique qui a fait l'objet d'une première activité WebMaestro en 2009 et une seconde en novembre dernier.

C'est en tant que spécialiste du web sémantique et enthousiaste du mouvement pour les données ouvertes (opendata) que j'ai accepté de me joindre au comité organisateur de la première édition de l'OpenCampQc. C'est à ce titre que je vous invite à venir discuter selon la formule d'un BarCamp, le mercredi 16 février à 13h00 à l'auditorium de l'ENAP des enjeux d'affaires et des aspects technologiques concernant l'adoption des logiciels libres et la promotion de l'accès libre aux données dans la fonction publique québécoise.

Pour initier la discussion et mettre en lumière quelques concepts que l'assemblée serait susceptible de vouloir aborder, je publierai sur mon blogue http://opendataqc.blogspot.com d'ici le 16 février, quelques notes et réflexions pour ceux qui voudrait s'approprier les enjeux des données ouvertes et s'initier à la magie du web sémantique.

L'inscription à l'OpenCampQc est gratuite, toutefois il est nécessaire de s'inscrire via le lien suivant OpenCampQc. Faites vite les places sont limitées.

Nous vous attendons en grand nombre pour réclamer, à la manière de l'inventeur du web Tim Berner Lee lors de sa fameuse conférence au TED :

Donnez-nous des données !

Pourquoi mon blogue pour promouvoir l'OpenData au Québec ?

Je m'intéresse au phénomène de l'Internet depuis 1995.

Plus récemment c'est à travers un projet de maîtrise en bioinformatique initié en 2005, que j'ai eu l'occasion de mettre en pratique le modèle du web sémantique. Le site Bio2RDF.org est un projet d'intégration de données scientifiques dans le domaine de la génomique qui a obtenu une importante visibilité car il a répondu dès 2007 à un besoin réel de la communauté scientifique : illustrer comment le web sémantique et ses technologies RDF et SPARQL peuvent être utiles. L'objectif du projet en soi était simple, il s'agissait de convertir des dizaines de bases de données publiques au format RDF, d'où le nom du projet : base de données BIOlogiques, converties (2) au format RDF. Les quatre règles de base des données en réseau (linked data) énoncées par Tim Berner Lee ont systématiquement été mise en pratique. Ce fût un des éléments clé du succès de ce projet. En tout, C'est 42 bases de données qui ont été ainsi converties et mises à la disposition des scientifiques sous la forme d'un point de service SPARQL. La technologie Virtuoso, un triplestore sous licence GPL a ainsi servi à publier plus de 2 milliards de triplets provenant de domaines aussi diversifiés que la structure 3D des protéines, les maladies génétiques et la littérature scientifique bio-médicale. En 2009, à l'occasion d'un premier recensement de la planète RDF, le projet Bio2RDF représentait 40 % des triplets disponibles, il s'agit de la partie rose au bas de la carte. Ce projet est hébergé ici à Québec, sur le boulevard Laurier.

Avec la montée en force du web sémantique depuis la dernière année, illustrée par son adoption par les gouvernements Anglais et Américain, j'espère humblement pouvoir faire profiter les internautes de mon expérience du web sémantique en partageant avec eux mes découvertes et mes réflexions dans ce domaine porteur d'avenir et de liberté, celui des données ouvertes disponibles sur la toile (open data) et libre d'y circuler sans contrainte.