Vous êtes 38.107.191.103(Login)

overcrowded / Autograph C R Wikipedia061006

carte des liens de la page courante AutographCRWikipedia061006 AutographCRWikipedia BarCamp

Autograph C R Wikipedia061006

Réunion Wikipédia du 6 octobre 2006


Retour vers CR réunions Wikipédia

Présents : Pascal Pons, Nicolas Pissard, Julien Levrel, Nicolas Auray, Martine Huraut-Plantet, Benoit Habert, Céline Poudat, Jean-Daniel Fekete, Christophe Prieur, Dominique Cardon, Glenn Rolland.

Prochaine réunion Wikipédia le 20 octobre 2006

Pascal Pons : base de données
Julien Levrel : traitement de la base
Nicolas Auray : "forme amplifiée de rassemblement médiée par les TICS"
Jean-Daniel Fekete : Voir la structure globale de Wikipédia, trouver des zones imprévues
Glenn Rolland : Karma Initiative (né dans le BarCamp) – mesurer la qualité des contributions…

Points sur les différents travaux lancés sur Wikipédia
Julien Levrel présente son travail à partir des vandalismes.
Il y a eu des nettoyages d’historique pour des violations de copyright…
Pour certains articles, l’historique est mauvais parce qu’il a été nettoyé…

Comment caractériser le vandalisme ?
Dans la base de Pascal, on utilise une révocation qui identifie le vandalisme qui est juste avant…
Comment distinguer du vandalisme d’une guerre d’édition ?
Identifier des articles dans lequel le taux de révocation est supérieur au taux d’édition… Qualifier les types d’interventions éditoriales sur le texte ? (corpus étiqueté des interventions éditoriales) Construire à la main des propriétés des interventions éditoriales. Et ensuite regarder avec le LIMSI comment trouver des heuristique automatique pour caractériser sur l’ensemble du corpus les types d’intervention éditoriale.
Wikipédia a développé une propre typologie des vandalismes.
Jean-Daniel : essayer d’avoir une carte de Wikipédia et être en mesure d’allumer des zones d’incertitudes (vandalisme)
Indicateur d’événement surprenant : vandalisme ou détournement, intervention des marques pour « influencer » les articles qui les concerne.
Comment caractériser l’évolution d’un article normal (mode de vie classique) et utiliser cette base pour rechercher les anormalités et les comportements atypiques ?

Céline : à l’ENST essaye de rajouter des descripteurs dans la base.
Ajout d’une table article : toutes les informations sur l’article
Benoît : faire une typologie des types de pages.
Julien a construit des représentations de l’évolution des pages Wikipedia (il met ses statistiques et graphique sur le wiki).
Utilisateurs de Wikipédia réclamait des indicateurs de niveau de « stress » des articles.
Travailler à fusionner les deux bases, celle de Pascal et celle de Benoît…
Pascal parse la Wikipédia US…
Déposer en pre-print les résultats avant de les publier sur le site.
Se mettre dans un espace privé les résultats…

Aspects réseaux sociaux : profils utilisateurs
Glen et Christophe : approche utilisateur
Graphe contributeurs/articles (graphe d’Elie) : Problème des anonymes
Graphe hypertexte des pages entre elles
Regarder les contributeurs qui contribuent à des pages très reliés entre elle. Identifier des profils spécialisés et distribués.
Jean-Daniel : faire une AFC sur les connexions pour trouver les contributeurs/Pages. Faire apparaître les gens qui ont contribué aux mêmes types de pages
Contributeurs identifiés : 20 000 contributeurs sur 500 000 articles. Puis utiliser les catégories…
Faire une AFC en pondérant par des attributs : le nombre de contribution, nombre de caractère dans la version finale, la catégorie des pages…
Faire apparaître des paquets plus ou moins nets de zones de densité contributeurs/articles.
L’AFC va permettre d’identifier plutôt les zones thématiques.
Pour les profils, faire plutôt du bloc Modelling.

Jean-Daniel : Décrire la manière dont a produit le résultat en décrivant les procédures que l’on fait : méthodiser les procédures
Julien développe une approche locale (à partir d’individus interviewer) des profils d’édition.

Autre projet : fichier d’identification des communautés de Pascal.
Benoît : on commence à avoir beaucoup de graphe non commenté. Il faut arrêter d’accumuler des résultats sans les commenter. Il faut développer de l’interprétation. Tout le monde doit ajouter des interprétations : sociologues, linguistes, visualisateurs.
Faire la description statistique de base de Wikipédia.
Combien de contributeurs, quel volume, etc.
Tâche d’analyse générique et spécifique : quelles sont les tâches que l’on voudrait voir mettre en place pour l’ensemble des réseaux sociaux (combien de composantes connexes ? etc.) et ensuite voir les questions spécifiques.
Dire telle analyse est toujours utile pour les réseaux sociaux et définir les choses spécifiques…

Caractériser les tâches importantes pour l’analyse des réseaux sociaux (Jean-Daniel)
Partir des tâches d’analyse plutôt que les indicateurs :
- Tache de bas niveau : indicateur connexité, centralité
- Tâche de moyens niveaux : cliques
- Tache haut niveau : communautés
Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]