|
|
Evénement
Big Picture Projets en accès direct
| Autograph C R Wikipedia061006Réunion Wikipédia du 6 octobre 2006Retour vers CR réunions Wikipédia Présents : Pascal Pons, Nicolas Pissard, Julien Levrel, Nicolas Auray, Martine Huraut-Plantet, Benoit Habert, Céline Poudat, Jean-Daniel Fekete, Christophe Prieur, Dominique Cardon, Glenn Rolland. Prochaine réunion Wikipédia le 20 octobre 2006 Pascal Pons : base de données Julien Levrel : traitement de la base Nicolas Auray : "forme amplifiée de rassemblement médiée par les TICS" Jean-Daniel Fekete : Voir la structure globale de Wikipédia, trouver des zones imprévues Glenn Rolland : Karma Initiative (né dans le BarCamp) – mesurer la qualité des contributions… Points sur les différents travaux lancés sur Wikipédia Julien Levrel présente son travail à partir des vandalismes. Il y a eu des nettoyages d’historique pour des violations de copyright… Pour certains articles, l’historique est mauvais parce qu’il a été nettoyé… Comment caractériser le vandalisme ? Dans la base de Pascal, on utilise une révocation qui identifie le vandalisme qui est juste avant… Comment distinguer du vandalisme d’une guerre d’édition ? Identifier des articles dans lequel le taux de révocation est supérieur au taux d’édition… Qualifier les types d’interventions éditoriales sur le texte ? (corpus étiqueté des interventions éditoriales) Construire à la main des propriétés des interventions éditoriales. Et ensuite regarder avec le LIMSI comment trouver des heuristique automatique pour caractériser sur l’ensemble du corpus les types d’intervention éditoriale. Wikipédia a développé une propre typologie des vandalismes. Jean-Daniel : essayer d’avoir une carte de Wikipédia et être en mesure d’allumer des zones d’incertitudes (vandalisme) Indicateur d’événement surprenant : vandalisme ou détournement, intervention des marques pour « influencer » les articles qui les concerne. Comment caractériser l’évolution d’un article normal (mode de vie classique) et utiliser cette base pour rechercher les anormalités et les comportements atypiques ? Céline : à l’ENST essaye de rajouter des descripteurs dans la base. Ajout d’une table article : toutes les informations sur l’article Benoît : faire une typologie des types de pages. Julien a construit des représentations de l’évolution des pages Wikipedia (il met ses statistiques et graphique sur le wiki). Utilisateurs de Wikipédia réclamait des indicateurs de niveau de « stress » des articles. Travailler à fusionner les deux bases, celle de Pascal et celle de Benoît… Pascal parse la Wikipédia US… Déposer en pre-print les résultats avant de les publier sur le site. Se mettre dans un espace privé les résultats… Aspects réseaux sociaux : profils utilisateurs Glen et Christophe : approche utilisateur Graphe contributeurs/articles (graphe d’Elie) : Problème des anonymes Graphe hypertexte des pages entre elles Regarder les contributeurs qui contribuent à des pages très reliés entre elle. Identifier des profils spécialisés et distribués. Jean-Daniel : faire une AFC sur les connexions pour trouver les contributeurs/Pages. Faire apparaître les gens qui ont contribué aux mêmes types de pages Contributeurs identifiés : 20 000 contributeurs sur 500 000 articles. Puis utiliser les catégories… Faire une AFC en pondérant par des attributs : le nombre de contribution, nombre de caractère dans la version finale, la catégorie des pages… Faire apparaître des paquets plus ou moins nets de zones de densité contributeurs/articles. L’AFC va permettre d’identifier plutôt les zones thématiques. Pour les profils, faire plutôt du bloc Modelling. Jean-Daniel : Décrire la manière dont a produit le résultat en décrivant les procédures que l’on fait : méthodiser les procédures Julien développe une approche locale (à partir d’individus interviewer) des profils d’édition. Autre projet : fichier d’identification des communautés de Pascal. Benoît : on commence à avoir beaucoup de graphe non commenté. Il faut arrêter d’accumuler des résultats sans les commenter. Il faut développer de l’interprétation. Tout le monde doit ajouter des interprétations : sociologues, linguistes, visualisateurs. Faire la description statistique de base de Wikipédia. Combien de contributeurs, quel volume, etc. Tâche d’analyse générique et spécifique : quelles sont les tâches que l’on voudrait voir mettre en place pour l’ensemble des réseaux sociaux (combien de composantes connexes ? etc.) et ensuite voir les questions spécifiques. Dire telle analyse est toujours utile pour les réseaux sociaux et définir les choses spécifiques… Caractériser les tâches importantes pour l’analyse des réseaux sociaux (Jean-Daniel) Partir des tâches d’analyse plutôt que les indicateurs : - Tache de bas niveau : indicateur connexité, centralité - Tâche de moyens niveaux : cliques - Tache haut niveau : communautés
Il n'y a pas de commentaire sur cette page.
[Afficher commentaires/formulaire]
|