Vous êtes 38.103.63.56(Login)

overcrowded / Article I C W S M Discussion

carte des liens de la page courante ArticleICWSMDiscussion CatherineMunro JeffreyAllen1975 Maveric149 Physchim62

Article I C W S M Discussion

Contexte des regroupements


IP

Techniquement, les IP recouvrent les contributeurs qui ne s'identifient pas sur le site lors de leur contribution. Il peut s'agir soit d'un oubli (de la part d'un inscrit) ou d'une personne ne possédant pas un compte.

Concernant les personnes non inscrites, l'IP peut représenter plusieurs choses. Soit l'adresse IP allouée par le fournisseur d'accès de l'internaute est stable et il peut, dès lors, s'agir de deux sortes de personnes :

- un particulier (ou un foyer si il possède un routeur)
- un domaine IP d'une personne morale (entreprise, rectorat, institution, ...)

Si l'IP est dynamique et allouée à différentes personnes se connectant à Internet, il est difficile de remonter au-delà sans l'aide des FAI et une procédure judiciaire (seule possibilité légale d'ouverture de la base de données des fournisseurs) malgré les nombreux utilitaires disponibles en ligne pour localiser une région d'émission ou le fournisseur de l'IP.

Ces incertitudes jouent un rôle majeur dans la politique et la gestion de l'accessibilité en écriture aux IP au sein du projet Wikipedia. Le droit d'écriture des non inscrits est, en effet, une des originalités de Wikipedia. La grande majorité des sites à vocation participative utilise l'inscription, ses étapes, formulaires et pré-requis comme autant de barrières à l'entrée. Ces étapes peuvent être accompagnées de demandes plus ou moins restrictives ; Agoravox demande le vrai nom, Ohmynews demande un fax de la pièce d'identité et, en option, les coordonnées bancaires de l'internaute.

En cas de vandalisme par un non inscrit, la procédure classique revient à bloquer l'adresse IP pour un temps, voire indéfiniment. Récemment, l'usage régulier de la procédure a entraîné le blocage temporaire du Quatar révélant des inégalités cachées dans l'accès à Internet. Le Quatar ne possède qu'un fournisseur d'accès et en bloquant l'adresse IP responsable d'un flot de vandalismes, c'est la population de tout un pays qui a été victime de cette mesure de protection. A échelle plus réduite mais regroupant un nombre conséquent de participant, les IP provenant des parcs informatiques des rectorats et des universités posent un dilemme similaire. A travers cet exemple, deux logiques inextricables sont révélées :

- le besoin du projet de se protéger occasionnellement d'actes de vandalisme
- autoriser le maximum de personnes à venir éditer Wikipedia

Certaines études qualitatives mettent en avant d’autres tensions dans la manière d’aborder les non inscrits.

Ainsi pour FORTE, BRYAN et BRUCKMAN, « Another convention that is understood by Wikipedians but not by novices is that anonymous contributions are inhenrently suspect, so new comers are encouraged to register and get usernames and to always sign their contributions to discussions ».

On peut, certes, critiquer le fait que l’on peut contribuer sous IP tout en sachant que ses contributions seront considérées comme suspectes au premier abord par les wikipédiens et, plus particulièrement, par les patrouilleurs ( ceux qui oeuvrent au travers des Modifications Récentes). Mais l’essentiel est de noter que les inscrits, dans leurs pratiques, surveillent systématiquement ce que les IP ajoutent car il peut y avoir tout et n’importe quoi.

L’absence de la contrainte de l’inscription joue comme une incitation à participer pour les passants. Les novices ayant répondus aux entretiens mettent en avant un fort attachement aux contenus relatifs à leurs domaines de connaissance, alors que les wikipédiens (inscrits engagés) s’identifient plus au projet en général qu’à leurs domaines de connaissance. Cette transformation dans l’engagement est notée par les auteurs : « They identify the site, not as a random collection of articles, but as a community of co-authors who play distinct roles and have distinct talents as they build a resource. ». D’où la nécessité de s’inscrire pour s’attribuer ses actes, signer ses commentaires, se construire une identité par ses engagements et appartenir à une communauté de co-auteurs qui se reconnaissent comme tels.

Pour ANTHONY, SMITH et WILLIAMSON, les anonymes et les inscrits ont des pratiques très différenciées. D’une manière générale, les inscrits participent plus aux contenus que les anonymes, mais les anonymes font des contributions qui résistent plus longtemps et donc (selon leur méthodo) des contributions de meilleures qualités. La qualité des anonymes participant de manière épistolaire est plus grande (résistent mieux, plus longtemps), le contraire est vrai pour les inscrits (meilleure qualité plus ils ont de contributions). On a donc deux groupes à chaque extrémité de la population qui font des contributions de qualité, deux groupes aux logiques fort différentes. Plus la contribution est courte en termes de caractères plus elle résiste (les fautes d’orthographe par exemple).

Les auteurs font jouer les variables : parmi ceux qui ont moins de 5 éditions, les anonymes ont des contributions de meilleure qualité que les inscrits. Parmi ceux qui ont plus de 5 éditions, les contributions des inscrits ont une meilleure qualité que les anonymes.

Les bons samaritains sont les oubliés des théories mettant en avant des mécanismes motivationnels tels que la réputation et l’appartenance à un groupe (identité de groupe). Bien qu’elles demeurent efficaces, elles n’épuisent pas la grande hétérogénéité des pratiques et motivations. Limites dues, pour les auteurs, à un problème de corpus (on a peu souvent toutes les contributions).

Les anonymes (anons) mis en politique

Suite à l’ affaire Seigenthaler, le 5 décembre 2006 a été mise en place une restriction sur le projet anglophone ; les anons (ou adresses IP) ne peuvent plus créer des articles. Toutefois, il leur est toujours possible de modifier des articles existants.

L’affaire Seigenthaler est principalement due, selon Jimmy Wales, à la création de l’article par une IP mais aussi par son manque d’interconnexion avec les autres articles encyclopédiques. Ainsi, la biographie de Seigenthaler était dans un angle mort du projet.

If we diagnose what went wrong in the Seigenthaler case, this seems like
a very opportune place to try a small change of policy.

1. First, the Seigenthaler article was created by an anon.

2. Then, a patroller simply corrected a spelling error and wikified the
entry a bit, but did not recognize the spurious claim. This was a
regrettable error, but one which we can understand in retrospect as
being a byproduct of the sheer volume of work.

3. Because the entry was never well-linked from related articles, the
subject-area sorts who would have spotted the dubious claim likely never
saw it.


Cette décision de bloquer la création d’articles aux IP a été prise par Jimmy Wales et implémentée rapidement par Brion Vibber, le coordinateur technique du projet. La réaction des wikipédiens ne s’est pas fait attendre, notamment par la liste de discussion.

Quelques discussions (//Some restrictions may apply// sur ce sujet ont eu lieu un an auparavant (juin 2004) sans aboutir à des mesures de restrictions.

2 fils de discussions sont liés à la mesure de restriction : Anons banned from creating articles et Experiment on new pages. A 13h34 le 5 décembre, un contributeur découvre la nouvelle dans une dépêche d’agence et s’insurge que les contributeurs en soient les derniers informés.

A 13h35, Jimmy Wales publie la nouvelle et ses excuses parce qu’il ne pensait pas que l’implémentation technique allait être aussi rapidement prête. Cette décision est présentée comme une expérimentation.

Certains contributeurs sont foncièrement contre :

I totally disagree with this.
Disabling the creation of pages by anonymous contributors will not
solve the problems of "nonsense pages" ; those pages will only be more
difficult to track and to delete if they are created by registered
users. The fact that some of the vandals will be annoyed by the need
of creating an account and simply wander away is negligible compared
to the increase of the workload created by this. And here, I'm only
talking about the bad things ; we will also loose a lot of good new
pages.

Simply, the fact is you're not looking at the right place. This is a
problem we cannot solve locally ; by doing this, you are only trying
to settle the symptoms instead of going directly to the reason of the
problem. We should inform people ; we should warn them about the
danger of writing lies.
Solensean


D’autres sont plus mesurés et conçoivent que la meilleure chose à faire est d’expérimenter, de tenter de nouvelles choses et d’en mesurer les effets pour savoir si telle ou telle décision reste légitime. Certains proposent mêmes des systèmes de réputation (comme sur eBay) pour les contributeurs et les articles, mais sont vites récusés :

The problem with this is figuring out how to do it in a way that doesn't
lead to game playing, karma whoring, etc. Any automated tool would
embody some a priori assumptions that might not match the rich fabric of
our actual experience.
--Jimbo


Mais des critiques générales subsistent :

Whereas I expect "experiment" to mean "I'm making a change and I don't
know what will happen, but I've put in place mechanisms to measure as
many of its effects as I can, so that I will be able to determine
whether it is good or not."
My suggestion is also based in a little appreciation for the
immutability of human nature, which suggests that all institutions
institutionalize, that is, tend towards restrictiveness, hierarchy,
and centralization of control. Steps in that direction are rarely
reversed. This is a small step, but its direction is clear.


Une autre critique concernant l’adéquation de la solution avec le problème mentionné est soulevée. Au-delà de l’inadéquation d’une solution technique vis-à-vis d’un problème social, comportemental, culturel, d’éducation, etc., c’est la mesure de l’efficacité de la mesure qui est au centre de la critique. Sur quoi se baser pour affirmer que l’expérimentation a réussi ou échoué ? (6 décembre)

But there does not appear to be any actual criteria under which it can
be judged to fail. The only way it will be rescinded, basically, is if
Jimbo changes his mind about it being a good idea, because there's no
way he can be proven wrong about it being a good idea. No one has even
informally defined what it would mean for it to be "successful", much
less suggested how to measure that.
One possible criterion: The overall number of bad edits on Wikipedia
(counting new page creation and edits to existing pages) decreases.
Another one: The overall number of bad edits on Wikipedia not caught
within [x] hours (again counting both) decreases.
Is anyone prepared to measure either of these, or some other useful
statistic?
-Mark


La réponse vient de Jimmy Wales un jour plus tard, statistiques à l’appui :

Those two are, quite obviously, difficult to measure. Indeed, it is very hard to come up with appropriate simple metrics, and so I think
what we need to do instead is take a holistic approach. We have a rough
idea of the tradeoffs here, and we can see if things are working out the
way we expect.

" * As a new page patroller, the new system does seem to be working.
It's pleasant to be spending more time fixing useful articles, and less
time getting rid of newbie tests. Kappa 15:25, 6 December 2005 (UTC)"

That's a valid voice. But only one. What problems are we seeing?


Netoholic gathered some first-pass statistics:
Before After
New pages 2050 1622
Article deletions 1309 929
New users 3241 6370 (!)
The increase in number of users seems out of proportion; he theorizes
that this has more to do with our massive press coverage than anything
else. It'll like some more time to really assess this.
--Jimbo


Il ajoute, le même jour : I bet it is a permanent policy change because (a) it seems to be working quite well and (b) it is consistent with our commitment to remain open. L’expérimentation est donc, selon Wales, validée et confirmée. Toutefois, d’autres contributeurs soulèvent le besoin d’avoir des statistiques comparatives sur le moyen et long terme, remettant la validation de Wales au niveau de l’hypothèse :

Since practical reasons prevent us from doing that, we'll have to
compare statistics to the last few month. We should also take opinions
(yes!) from the "new pages patrol" people into account, wether the
creation of junk pages has dropped noticably.
Ultimately, to see if reality matches your hypothesis, you'll have to
apply the conditions of that hypothesis to reality and see if it matches
the expected outcome. That's what we are doing. If the results do not
match our expectations, thus proving our theory wrong, we'll take the
changes back; I have no doubt about this.
Magnus


Maveric149?, l’un des plus gros contributeurs au projet, soulève également que ces chiffres peuvent ne montrer qu’un déplacement du problème de l’incertitude des IPs vers les nouveaux inscrits.

We also have to measure whether or not the problem has just shifted from anons to new users (really, anons who’s only motivation to create an account was being prevented from creating a new page). If that is the case, then we may need to extend the experiment to newly created user accounts as well.
-- mav


+ de 184 mails en décembre 2005, Jimmy Wales a également participé à une session IRC de deux heures dédiées à ce problème.

Au fur et à mesure des discussions, elles se déplacent du pourquoi et de la légitimité vers le comment et les aménagements de l’espace éditorial afin de prendre en compte cette mesure :

User Creation Log : liste automatiquement et chronologiquement les nouveaux comptes utilisateurs créés. Utile pour les Wikipediens qui accueillent les nouveaux.

Welcoming Committee :
La page qui recense les outils, modèles et bonnes manières pour accueillir les nouveaux arrivants (messages modèles à insérer dans les pages de discussion des utilisateurs – chaque message est signé par le Wikipédien qui accueille).

Adopt-a-user : Des vieux utilisateurs peuvent adopter des jeunes et inexpérimentés utilisateurs afin de les suivre dans leurs écrits et engagements, à comprendre le fonctionnement du projet et se faire une idée de ce qu’il s’y déroule.

New User Log : page sur laquelle les nouveaux arrivants sont invités à poster un commentaire sur leurs intérêts à participer, domaines de connaissance. On trouve souvent des commentaires qui mettent en avant un engagement sous IP limité qui pousse à l’inscription.

Article for creation : autoriser les non inscrits ou les nouveaux arrivants à demander la création d’un article. Ils sont dès lors suivis par des Wikipediens expérimentés dans leurs écrits.


Requested Article : Recenser les articles demandés (à travers les liens rouges et les demandes des utilisateurs). Objectif : créer des articles utiles qui viennent compléter des manques affichés dans les autres articles encyclopédiques.


En août 2006, la discussion est timidement relancée concernant la mesure des effets à moyen terme et finalement revenir sur la question de la légitimité du blocage des IP. Avec le temps, d’autres processus ont été mis en place notamment ceux portant sur des situations plutôt que sur des individus ou regroupements d’individus. Par situation, il faut entendre des conflits, des vandalismes répétés, du spam ou encore une actualité récente qui génère beaucoup de trafic et d’éditions sur une thématique spécifique. Les mesures restrictives sont portées au cas par cas plutôt que sur une population générale et ciblent dorénavant les articles plutôt que les contributeurs : semi-protection (vandalisme, trafic) ou protection des articles (conflit, prise de décision).

En semi-protection, les articles ne peuvent être édités que par les inscrits de plus de 4 jours, en protection, personne ne peut modifier les contenus de l’article tant que la situation n’a pas évolué (consensus par discussion, prise de décision).

Mais le blocage des IP à la création des articles est toujours de rigueur, ce qui gêne certains contributeurs qui y voient toujours une remise en cause l’un des principes fondateurs du projet, voire la marque de fabrique de Wikipedia ; l’ouverture généralisée.

Yeah, he [Jimmy Wales] said it doesn't seem to be working, and it's not open. So
when is this policy change going to be reverted?--Wikilegal


A ce moment sont récupérées dans les discours, les études réalisées par Aaron Schwarz et par IBM concernant l’history flow. Le souci est de trouver des métriques permettant de rendre compte de l’efficacité de la mesure, du moins d’isoler ses effets des autres design communautaires.

I wish Aaronsw had been a little more open about his metholodigy in his results.
While working a bots for automated vandalism I found pure diffwords to
be a poor metric of whats actually changed because confused new users
often manage to insert big gobs of crud that get reverted.
A similar test to this which used the IBM history flow tool to
attribute all the text in the most recent version of an article to its
orignal author did not find simmlar results. This might be because
copyediting can cause the history flow tool to misattribute, or it
might be indicitaive of a systematic flaw in Aaronsw's reseach.
In any case, if were going to do studies which sample only a handfull
of articles, it would likely be better to do manual analysis... It
wouldn't take long to step through 400 diffs given the right user
interface

If we do decide to turn it off, perhaps we should decide ahead of time what
statistics we'd like to watch, and collect them for a month or two ahead of
time. Things like current rate of new article creation, rate of speedy
deletes, average number of people doing new pages patrol per day,
stress-level of new pages patrollers.... ;)
If we do that this time, we'll have some real figures to go by to judge
what the difference is with anon page creation off and on.
Catherine


Enfin, le Signpost, organe d’information interne au Wikipedia anglophone, revient sur cet épisode en faisant un compte-rendu des échanges mails :

One step taken in the aftermath, on December 5, was removing the ability of unregistered editors to create new encyclopedia articles, such as had been done in Seigenthaler's case. This was characterized as an experiment but has remained in place since that time, although it is unclear how successful this was. The issue was recently raised again on the English Wikipedia mailing list, and Wales stated his opinion that the experiment "did not achieve the intended effect." He suggested that the restriction should be changed when the planned feature to flag "stable" or "non-vandalized" versions of articles is available.

En complément de cet épisode, les discussions sur la liste de l’//Association for Internet Researchers// qui se sont déroulées en décembre 2005 sont aussi éclairantes. Les partis prenantes des discussions sont, entre autres, Barry Wellman, Karl R. Lakhani, Danah Boyd et Jimmy Wales (averti par Danah Boyd de cette discussion).

Bien que les discussions tournent autour de la fiabilité des contenus de Wikipedia et de leurs usages dans les travaux universitaires des étudiants, elles se situent au cœur de l’affaire Seigenthaler qui a eu un large retentissement.


L’étude d’Aaron Schwartz

Un compte-rendu est déjà disponible sur le wiki. Qui écrit Wikipedia ? Est-ce, comme l’avance Jimmy Wales, un groupe de contributeurs de confiance proche de Wales ou une multitude de petites mains et principalement, dans l’argumentaire de Aaron Schwartz, des IP et petits contributeurs ?

Aaron a mis à jour son étude de l’article d’Alan Alda. Il a lancé un script sur 200 articles pour savoir qui a écrit quoi sur chacun.

The first it found was Alkane, a long technical article about acyclic saturated hydrocarbons that it said was largely written by Physchim62?. (…) Physchim62? had indeed contributed most of the article, but according to the edit comments, it was by translating the German version! I don't have the German data, but presumably it was written in the same incremental way as most of the articles in my study. (…)
The next serious case was Characters in Atlas Shrugged, which the script said was written by CatherineMunro?. Again, it seemed plausible that one person could have written all those character bios. But again, an investigation into the actual edit history found that Munro hadn't written them, instead she'd copied them from a bunch of subpages, merging them into one bigger page. (…)

Currently, the Anchorage, Alaska page has a tag noting that "The current version of the article or section reads like an advertisement." A bit of Googling revealed why: JeffreyAllen1975?'s contributions had been copied-and-pasted from other websites, like the Anchorage Chamber of Commerce ("Anchorage's public school system is ranked among the best in the nation. ... The district's average SAT and ACT College entrance exam scores are consistently above the national average and Advanced Placement courses are offered at each of the district's larger high schools.").


Aaron conclue que l’exploration des processus d’écriture des articles révèle beaucoup plus qu’une organisation traditionnelle autour de contributeurs de confiance, notamment des cas de traduction, de réorganisation des écrits et de plagiats réalisés par des petits contributeurs.
Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]