Vous êtes 38.103.63.56(Login)

overcrowded / Sujet Post Doc Lannion

carte des liens de la page courante SujetPostDocLannion Actualite ChristophePrieur MySQL

Sujet Post Doc Lannion

From: BOTHOREL Cecile RD-TECH-LAN <cecile.bothorel@orange-ft.com>
Sujet de post-doc :

Analyse locale des réseaux (ego-nets) : détection, analyse et utilisation de facettes.
Utilisation des facettes à un niveau global du réseau pour la propagation ciblée (recommandation contextuelle)
Mots-clés : social media, flux contextuels, graph et text-mining, facettes, personnalisation, recommandation
Contexte :

Dans le cadre des réseaux sociaux, comme par exemple un ensemble de personnes communiquant par email, on s'intéresse au réseau tel que perçu par un individu (l'ego-net). Un individu échange des emails avec plusieurs groupes de personnes : amis, collègues, famille etc... Cet individu ne se présente pas de la même façon dans toutes ses interactions. La question de l'identité sociale est loin d'être triviale. Les travaux de Danah Boyd [danah] ont introduit la notion de "facette" dans les réseaux sociaux. La modélisation des individus par un profil unique et immuable pose depuis longtemps problème dans les systèmes de recommandation et débouche sur la problématique de la gestion d'identité contextuelle. L'analyse des usages et en particulier de traces ouvrent des perspectives quant à la découverte de contexte d'activités . En particulier, l'analyse de traces d'interactions tels que les emails nous paraît intéressante car les facettes, souvent implicites, se matérialisent à la fois dans le contenu des échanges mais également dans le choix des interlocuteurs.
L'ensemble des facettes peut être fixé à l'avance (taxonomie type carnet d'adresse, ou encore des tags types del.ic.ious), chaque utilisateur typant alors ses liens (ou contacts) en choisissant parmi les étiquettes possibles (famille, boulot, connaissance, ou toute autre thématique, etc.).
L'autre possibilité consiste à détecter de façon automatique les facettes, en fonction par exemple du langage, des thèmes utilisés dans les échanges, ou bien encore les interlocuteurs. C'est cette deuxième approche que nous retenons ici.
A l'échelle du réseau (global), sans facettes, nous pouvons opérer des calculs de communautés (clustering), qui peuvent s'avérer suffisants pour la description ou la visualisation d'écosystèmes. Dans une perspective d'utilisation pour la recommandation par exemple, ou plus généralement le propagation sélective de flux, on s'attachera à qualifier les liens de manière plus fine, ce qui revient potentiellement définir des communautés contextuelles, et plus proches de la réalité, en se basant sur les facettes de chacun des individus. Dans ce cas, une communauté regroupe des individus liés par des relations impliquant des facettes compatibles. Ainsi, en plus de la découverte de facettes, il s'agira de déterminer des outils de mesure d'adéquation entre facettes et des méthodes de propogation de flux ciblés exploitant ces facettes.

Travail à réaliser :

Le post-doc devra tout d'abord mettre en oeuvre des techniques permettant d'extraire les facettes à partir d'exemples d'ego-net (clustering de graphe, graphmining + text-mining). Il faudra ensuite analyser ces facettes, par exemple pour déterminer les facettes proches ou compatibles, pour un même individu. Il s'agira ensuite de passer à l'échelle du réseau et de concevoir des outils d'utilisation de facettes. Il pourra être utile de mettre en place de nouvelles mesures (type centralité [brandes], coefficient de clustering), adaptées à la manipulation de réseaux sociaux avec facettes.
Les facettes pourront ensuite être utilisées par exemple pour déterminer des communautés, ou afin de réaliser des recherches ciblées dans un réseau social ou propager de manière sélective des contenus, les facettes servant alors à élaguer les recherches ou mieux répoartir les flux (le contraire du broadcast). Il s'agira ici d'un travail algorithmique visant à enrichir les outils d'analyse de réseaux sociaux, en accentuant la recherche sur la performance et le passage à l'échelle pour des réseaux de grande taille.
Ces différentes tâches impliquent une recherche bibliographique dans le domaine des mesures de type réseau social et du clustering de graphe, l'invention de méthodes adaptées aux problèmes à traiter, ainsi qu'une validation pratique et théorique (implementation, mise en oeuvre et comparaison à l'existant) des méthodes développées.

Cadre de travail :

Le travail sera réalisé en se basant sur la bibliothèque JAVA de l'équipe (JAIL), qui propose un certain nombre d'outils de gestion et de manipulation de graphes, en particulier dans le cas des réseaux sociaux. Les méthodes développées devront s'intégrer dans cette bibliothèque. Nous disposons de données réelles.
Durée : 1 an, reconductible éventuellement 6 mois.
Situation : France Telecom R&D, Av. Pierre Marzin, 22300 Lannion, Bretagne.

Compétences requises/souhaitées :

* Théoriques :
  • Méthodes de clustering (en général), clustering de graphe en particulier.
  • Théorie des graphes, Réseau sociaux
  • Text-mining
* Pratique :
  • Programmation JAVA
  • XML, GML
  • BDD (MySQL? par exemple)

Bibliographie :

[danah] http://www.danah.org/
[brandes] A Faster Algorithm for Betweenness Centrality. Journal of Mathematical Sociology, 25(2):163-177, 2001

Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]