Accueil » Formation » Séminaire 2016 : Qu’apportent les données massives (big data) à la géographie ?

Séminaire 2016 : Qu’apportent les données massives (big data) à la géographie ?

Untitledcnrslogo_coul_bleu_rvb_300labexdiderot_vensgcarthageo

Labex DYNAMITE, groupe de travail Réseaux et Territoires

Masters Carthagéo et GéoPrisme (Universités Paris 1, Paris Diderot, ENSG)

Séminaire de Recherche 16, 17 et 18 février 2016

Organisé par Denise Pumain et Antonine Ribardière (Université Paris 1)

 Lieu : Institut de Géographie, 191 rue Saint-Jacques, Paris 5e

Depuis quelques années ont fait irruption des données numérisées sous des formes massives, qui ouvrent de nouvelles voies à l’investigation scientifique. On ne saurait donner une définition bien délimitée à ces « big data », qu’elles soient issues de capteurs disséminés dans l’environnement, des multiples usages de l’Internet ou d’objets connectés mobiles. Il est plus important d’en bien connaître les modalités d’élaboration pour en comprendre les significations et les utilisations possibles.

De plus, les quantités d’information sont telles que des méthodes adaptées sont nécessaires et désormais disponibles pour extraire (« moissonner ») ces données, pour les traiter (analyses statistiques multivariées, analyses des réseaux avec la théorie des graphes, analyses des contenus sémantiques etc.), pour en visualiser les grandes structures ou pour faire comprendre les résultats de leurs traitements. Non seulement ces données exigent de nouvelles méthodes informatisées (algorithmes adaptés), mais pour certains auteurs elles conduisent aussi à transformer les bases épistémologiques du travail scientifique, en apportant un substitut à la démarche classique des enquêtes et des expériences : la masse des informations compenserait en quelque sorte leurs imperfections, et leur finesse de résolution (en général il s’agit d’informations à un échelon « individuel ») permettrait de réviser les fondements de certaines théories construites pour d’autres niveaux d’observation. Quoi qu’il en soit, les géographes sont fortement concernés par ces innovations, dans la mesure où une fraction importante de ces informations est géolocalisée, ce qui conduit à de nouvelles formes de diffusion des concepts et des méthodes géographiques et cartographiques dans la société. Les présentations de ce séminaire apporteront une diversité d’exemples de données massives et de leurs utilisations.

 

 

Mardi 16 février : salle 402

 

14-15h  Isabelle Thomas (Professeur, Université Catholique de Louvain)

 

Big data et géographie urbaine : premiers résultats sur Bruxelles

 

La géographie a toujours utilisé de grandes bases de données mais les nouvelles technologies (ICT) ouvrent aujourd’hui de nouvelles possibilités très tentantes. Avec l’exemple de Bruxelles (projet de recherche en cours), nous allons essayer de montrer les forces et les faiblesses de ces nouvelles bases de données et les défis méthodologiques qu’elles engendrent.   Tweets et appels téléphoniques seront les principales sources d’illustration pour comprendre les limites et la composition de l’aire métropolitaine bruxelloise.

 

Lecture : Adnan M., Lansley G., Longley P. A. 2014, A geodemographic analysis of the ethnicity and identity of Twitter users in Greater London, Geocomputation.org

Bibliographie: Adnan M. Longley P.A. 2013, Analysis of Twitter usage in London, Paris and New York city. AGILE, International Conference on Geographical Information Systems, Leuven.

 

15h-16h  Céline Rozenblat (Professeur, Université de Lausanne)

 

Approches multiplexes des systèmes de villes dans les réseaux d’entreprises multinationales

 

La conférence revisitera les bases conceptuelles et méthodologiques des approches par les réseaux, utilisées depuis une vingtaine d’années pour étudier les processus spatiaux qui lient les villes et les entreprises multinationales, et qui sont couramment mobilisées dans la littérature des « villes globales ». L’objectif est d’expliciter à chaque étape les choix opérés, qui demeurent souvent implicites, et leurs implications dans les résultats. Partant d’approches multi-niveaux et multidimensionnelles de la relation ville-entreprises, on examinera les liens intrinsèques entre les concepts mobilisés et les constructions empiriques de réseaux. Deux niveaux d’hypothèses sont identifiés : les hypothèses faites sur les réseaux eux-mêmes qui conditionnent les définitions des interactions ; celles faites sur les dimensions des objets construits. Dans cette perspective d’implémentation de la théorie de l’acteur-réseau, l’article propose des pistes de recherche fondées sur l’approche « multiplexe » des réseaux.

 

Lecture : Rozenblat C. 2015, Approches multiplexes des systèmes de villes dans les réseaux d’entreprises. Revue d’Economie Régionale et Urbaine, 3, 393-424.

 

16h-17h : questions et discussion

 

 

Mercredi 17 février : petit amphithéâtre

 

14h30-15h30 Juste Raimbault (doctorant UMR Géographie-cités)

 

Bibliométrie indirecte par analyse de réseaux complexes.

 

Nous proposons d’étudier l’influence d’une revue scientifique (Cybergéo) par une analyse de réseaux complexes, notamment le réseau de citations entre publications, ainsi que le réseau sémantique du contenu des titres et résumés. Nous présentons tout d’abord la construction du jeu de données, ne pouvant être obtenu par des moyens « classiques » (les bases de données propriétaires n’ayant pas référencé la revue), qui a été effectuée indirectement par ouverture de données semi-ouvertes (google scholar dont les limitations doivent être contournées). L’analyse topologique du réseau de citations permet de donner une première estimation de l’importance de la revue (Shibata et al., 2008). Nous construisons ensuite un réseau sémantique reproduisant l’horizon des disciplines dans lesquelles s’inscrit la revue, selon (Chavalarias & Cointet, 2013), dont l’analyse diachronique permet d’estimer une mesure de performance de la revue en termes d’innovation scientifique. Enfin, le croisement entre les deux réseaux est une piste pour obtenir des résultats plus fins au second ordre, comme des mesures d’interdisciplinarité des contributeurs à la revue (Iacovacci et al., 2015).

 

 

Lecture :

Chavalarias, D., & Cointet, J. P. (2013). Phylomemetic patterns in science evolution—the rise and fall of scientific fields. PloS one8(2), e54847.

Bibliographie

Méthode intéressante mais papier peu attrayant : Shibata, N., Kajikawa, Y., Takeda, Y., & Matsushima, K. (2008). Detecting emerging research fronts based on topological measures in citation networks of scientific publications. Technovation28(11), 758-775.

Papier très intéressant mais sûrement un peu rude : Iacovacci, J., Wu, Z., & Bianconi, G. (2015). Mesoscopic Structures Reveal the Network Between the Layers of Multiplex Datasets. arXiv preprint arXiv:1505.03824.

 

 

15h30-16h30 Pierre-Olivier Chasset (ingénieur en transport, doctorant UMR Géographie-cités)

 

Exploration d’un large corpus textuel – 20 années de publications dans Cybergeo

 

Notre recherche vise à identifier des régularités dans le corpus des publications de Cybergeo. Ce corpus est constitué de 1241 documents composés de cinq millions de mots. Pour ce séminaire, nous présenterons la démarche scientifique adoptée par des exemples concrets. Nous effectuerons tout d’abord une analyse exploratoire. Celle-ci nous permettra d’identifier certaines régularités. Sur la base de cette connaissance, nous formulerons des hypothèses qui serons testés sur notre corpus.

 

Lecture :

Chavalarias, D., & Cointet, J. P. (2013). Phylomemetic patterns in science evolution—the rise and fall of scientific fields. PloS one8(2), e54847.

 

16h30-17h30 : questions et discussion

 

 

Jeudi 18 février : salle 402

 

14-15h César Ducruet (chercheur CNRS à l’UMR Géographie-cités

 

La spatialité des réseaux maritimes

 

Seul réseau de transport global avec l’aérien, le mode maritime est l’un des plus anciens vecteurs d’interaction. Or malgré les travaux pionniers de géographes tels qu’André Siegfried (1942) ou encore Edward Ullman (1949), la cartographie des flux maritimes mondiaux reste très récente, permise par la mobilisation de données nouvelles (radars AIS, satellites) ou anciennes (corpus d’archives, digital humanities). La formalisation de ces flux en un réseau constitué de nœuds (ports) et de liens (routes) a finalement fait peu d’émules depuis les thèses de Ross Robinson (1968) sur le Canada et d’Olivier Joly (1999) sur le réseau conteneurisé mondial, avant un regain d’intérêt dans les années récentes sous l’égide des réseaux dits complexes et via l’analyse croissante par les physiciens des réseaux spatiaux. Cette présentation fournit un bref rappel de ces tendances et propose une analyse nouvelle du réseau maritime mondial sous trois angles différents : (1) l’évolution de la structure topologique du réseau depuis la fin du 19ème siècle, (2) sa structure fondamentalement multiplexe basée sur l’articulation de circulations différenciées selon cinq types de flottes, et (3) l’influence de la hiérarchie urbaine mondiale sur la répartition des flux et la centralité des ports entre 1950 et 1990. Les données de la Lloyd’s List sur la navigation quotidienne des navires marchands sont ainsi un bon exemple de big data au service d’une meilleure compréhension des réseaux, de la mondialisation, et des villes en géographie.

 

Lectures :

Kaluza P., Kölzsch A., Gastner M.T., Blasius B. 2010, The complex network of global cargo ship movements. Journal of the Royal Society Interface, 7, doi: 10.1098 /rsif.2009.0495

Le Guyader D. Brosset D. Gourmelon F. 2011, Exploitation de données AIS pour la cartographie du transport maritime. Mappemonde, 104,

http://mappemonde.mgm.fr/num32/articles/art11405.html

 

15-16h Hadrien Commenges (Maître de Conférences à l’Université Paris 1)

 

Smart city et big data : questionner l’efficacité sociale de la technologie

 

Les travaux sur le gouvernement des villes mettent en avant plusieurs caractéristiques qui font des territoires urbains un lieu d’analyse privilégié des instruments d’action publique : l’extension et la complexification de l’espace urbain entraîne une fragmentation des systèmes décisionnels ; l’espace urbain fait l’objet d’une recrudescence d’injonctions à la rationalisation et à l’optimisation des services et des équipements collectifs, en particulier des réseaux techniques (transport, alimentation en eau, assainissement). Un discours émerge depuis une dizaine d’années: une science des villes, s’appuyant sur les big data, pourrait permettre de construire des smart cities. L’efficacité sociale de la technologie est souvent postulée, rarement questionnée. Cette présentation entend la questionner à partir d’exemples variés pris dans les domaines des transports et de l’assainissement.

 

Lectures :

Cukier K., Mayer-Schönberger V. 2013, Mise en données du monde, le déluge numérique. Le Monde Diplomatique, juillet.

Graham M. Shelton T. 2013, Geography and the future of big data, big data and the future of geography. Dialogues in Human Geography, 3(3), 255-261.

 

16h-17h : questions et discussion

 

Advertisements

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :