|
GEREC-F DEMOLI |
Dans un nombre de plus en plus grand de domaines du savoir se mettent en place des sites de référence qui rendent disponibles, en version électronique, soit des versions pré-publication d'articles ou de communication scientifique (sites de « preprints »), soit des fac-similés d'articles publiés dans des conférences ou des revues archivées.
Linguistique informatique : Le site d' « electronic preprint archives », http://arXiv.org, autrefois maintenu par le LANL, aujourd'hui par l'université Cornell, aux États-Unis, contient une proportion de plus en plus grande des articles significatifs publiés sous forme électronique dans une série de sciences exactes (mathématiques, physique, informatique ...) Il contient entre autres une section pour la linguistique informatique et la linguistique formelle : « The computation and language e-print archive » (http://arxiv.org/list/cs.CL/recent). C'est un point de passage obligé pour la recherche d'articles scientifiques dans cette branche des sciences du langage.
Le site http://arXiv.org, très riche pour ce qui concerne les sciences exactes, contient assez peu de choses sur les sciences humaines, sauf certaines branches que le souci de modélisation formelle rapproche des sciences exactes (comme la linguistique informatique, mentionnée ci-dessus).
De la même manière, c'est encore l'une des branches les plus « informatisées » des recherches en littérature qui s'est dotée d'un site web de « preprints » : les Computing and the Humanities Working Papers (CHWP). Ce site regroupe des articles consacrés à l'utilisation d'outils informatiques pour faire de la recherche en lettres ou en philologie.
Un site (déjà mentionné dans la section sur les sites de référence, §2.2 ci-dessus), Semantics Archive (http://www.semanticsarchive.net/), stocke les articles de sémantique linguistique (plutôt orientée sémantique formelle) que les auteurs veulent bien lui communiquer ;
En syntaxe, il existe plusieurs sites d'archivage, répartis par école linguistique. L'école chomskyenne est représentée par le site des AMSA (Arizona Minimalist Syntax Archives) (http://minimalism.linguistics.arizona.edu/AMSA/archives.html) ; et les linguistes travaillant dans le cadre des grammaires d'unification trouveront un portail d'entrée donnant accès à un ensemble de travaux récents sur le formalisme HPSG à l'adresse http://lingo.stanford.edu, maintenue par l'université de Stanford.
Il existe également un site de pre-prints en sciences cognitives : http://cogprints.ecs.soton.ac.uk, qui couvre différentes disciplines appartenant à ce champ : psychologie, neuroscience, linguistique, informatique, philosophie, biologie.
Depuis quelques années, ont été également mis à la disposition des utilisateurs d'internet des systèmes utilisant des procédés d'ingénierie de la connaissance pour construire automatiquement des bibliographies électroniques.
Le principe de ces systèmes est de recueillir autant de références bibliographiques que possibles (en assurant en même temps leur sérieux et leur fiabilité), en analysant automatiquement les articles eux-mêmes ; ainsi, si un article A cite un article B, le système va rechercher également l'article B, et ainsi de suite.
L'un des intérêts de ces sites, outre celui de retrouver des références bibliographiques exactes, est de chercher à repérer qui cite qui, c'est-à-dire de reconstituer le treillis de citations croisées d'un pan de la littérature scientifique.
Ce treillis peut être très riche d'enseignements :
d'une part, on y repère rapidement les ouvrages fondamentaux pour un certain domaine et une certaine thématique : ce sont ceux que (presque) tout le monde après eux cite, pour s'en inspirer ou pour les critiquer ;
d'autre part, on y distingue les courants de pensée et les écoles scientifiques : ce sont les zones du treillis qui ont une grande connexité interne et une connexité faible avec le reste.
En outre, lorsque les moteurs de recherche internes de ces systèmes détectent que l'article recherché est également disponible sous une forme électronique, dans un format ou un autre (HTML, PostScript, PDF ...), quelque part sur internet, ils l'archivent et le mettent à la disposition des utilisateurs (sauf cas de clause de non-diffusion). Ceci est extrêmement pratique pour retrouver le texte intégral d'un article qui peut être par ailleurs situé sur n'importe quel site, à l'origine (un site de pre-prints, un site de revue électronique, un site de conférence, la page personnelle de l'auteur ...)
Voici deux sites bien connus de ce type :
Le Digital Bibliography and Library Project (DBLP, accessible sur : http://dblp.uni-trier.de/ ou http://www.informatik.uni-trier.de/~ley/db/index.html), maintenu par l'Université de Trèves, en Allemagne, est limité au domaine de l'informatique. Il ne va donc concerner, parmi les étudiants en lettres ou en sciences humaines, que ceux qui ont affaire à une spécialité peu ou prou « informatisée » ou « formalisée » (linguistique formelle, linguistique informatique ...)
La base de données CiteSeer (http://citeseer.ist.psu.edu/) a elle aussi une prédominance dans le champ des sciences exactes, mais c'est plus pour des raisons contingentes (parce qu'il existe une tradition plus longue d'utilisation des outils électroniques dans ce domaine). CiteSeer offre un formulaire de recherche permettant de chercher non pas une référence, mais les articles citant cette référence : ce type de recherche permet donc de mesurer directement l'impact (le nombre de citations ultérieures) d'un article ou d'un ouvrage.
Certains sites offrent des portails généralistes référençant plusieurs sites de documentation électronique. En général, en y butinant un peu, on trouve facilement les ressources concernant le domaine qui nous intéresse plus particulièrement. Une recherche d'information consciencieuse doit nécessairement comprendre un passage par ces sites-portail :
L'annuaire Google des archives de publications scientifiques en libre accès : http://directory.google.com/Top/Science/Publications/Archives/Free_Access_Online_Archives/ ;
La page « Open Access » de l'Institut de l'Information Scientifique et Technique du CNRS (INIST) : http://www.inist.fr/openaccess ;
Le catalogue de ressources de l'INASP (International Network for the Availability of Scientific Publications) : http://www.inasp.info/peri/free.html ;
Le site du projet « SHERPA » (Securing a Hybrid Environment for Research Preservation and Access), déjà cité ci-dessus (§1.4) : http://www.sherpa.ac.uk.
Contact : |
Pascal Vaillant |
( ) |