Information 20 december 1999
Bits og bytes i Babelstårnet
Fremtidens videnskabelige informationer burde være frit
tilgængelige for alle gennem Internettet. Men foreløbig
spænder gamle vaner og økonomiske interesser ben for
udviklingen
Internet
Af PETER HYLDGÅRD og ROBIN ENGELHARDT

Siden den bibelske beretning om vores forfædres bygning af
Babelstårnet for nå Gud, har menneskeheden stræbt efter at samle
dets kundskaber og mangfoldigheder i blot et enkelt storværk af
altomfattende viden, et Opus Magnus, som vi alle kan være fælles
om at eje og bygge videre på. Og siden sprogets opståen, skriftens
udvikling og trykkekunstens indmarch har man aldrig været tættere
på målet, end det er tilfældet i dag. I nutidens hypermediale
netværkssamfund er der nemlig ikke længere nogen principielle
hindringer i vejen for at skabe den optimale situation: Alverdens
encyklopædiske og videnskabelige viden, indbyrdes forbundet og
gjort frit tilgængelig på Internettet. Alle videnskabelige
publikationer, hvad enten det er foreløbige preprints eller kritisk
bedømte (i fagjargon kaldt peer-review) og accepterede artikler,
ville kunne nås med blot nogle få klik med musen.
Forlagenes modstand
Men det ser ud til, at det ikke kun er Gud, der modsætter sig dette
menneskets ideal. Også forlagsbranchen har noget i klemme. For at
betegne udviklingen med en anden bibelsk lignelse kunne man sige,
at bogbranchen lige nu er i gang med at opbygge Jerikos mure på
ny:
Ved et møde i Frankfurt i oktober måned blev repræsentanter for
en række store forlag enige om at opbygge en netstruktur af links
til hinandens hjemmesider gennem referencelisterne på deres
offentliggjorte artikler. På den måde vil man skabe et internt net af
mere end tre millioner krydsrefererende artikler, der dog stadig
ejes og forvaltes af forlagene. Indtægterne gennem
online-abonnementer vil dermed stadig kunne bibeholdes i form af
samlede pakkeløsninger, "pay per view" eller lignende
arrangementer.
De, som ikke har råd til at betale, spærres udenfor Jerikos mure.
Blandt dem tæller typisk videnskabelige institutioner i u-landene,
der ikke har midlerne til de dyre abonnementer (og slet ikke til
egne biblioteker), små og halvstore private foretagender, medier,
institutioner og lignende, som kun selektivt har brug for
videnskabeligt baggrundsmateriale, samt alle fattige enkeltpersoner,
der af private eller professionelle årsager måtte have brug for
adgang til primærlitteraturen. Med det nye initiativ vil forlagene
således udbygge det vidensgab, der allerede eksisterer mellem i- og
u-lande.
Men også den almindelige danske forsker har problemer.
Forskningsinstitutionerne må betale i dyre domme for
abonnementer på både elektroniske og trykte tidsskrifter (se boks),
og bibliotekerne har for længst givet tabt i en budgetundergravende
urskov af tidsskrifter og blade. Af de over 20.000 internationale
fagblade (peer-reviewed) er det kun et fåtal, bibliotekerne har
fysisk adgang til. Ikke sjældent sker det, at forskeren derfor selv må
ringe til forfatteren eller udgiveren i Langbortistan for at få tilsendt
en vigtig artikel.
Frie initiativer
Forlagenes udspil er kommet i huj og hast for at modgå en række
uafhængige initiativer, der i videnskabens interesse havde tænkt sig
at gøre primærlitteraturen frit tilgængelig for alle.
Blandt de største initiativer på nettet finder man PubMed Central
(PMC), som styres af det amerikanske National Institute of Health
(NIH). Hvis tidsplanen holder, åbner PubMed Central til januar med
gratis adgang til artikler fra et par håndfulde anerkendte
videnskabelige tidsskrifter indenfor biologi, landbrugsvidenskab og
medicin, deriblandt giganten Proceedings of the National Academy
of Sciences (PNAS).
NIH samarbejder blandt andet med European Molecular Biology
Organization (EMBO) om at udvide antallet af tidsskrifter i
databasen. Blandt andet står det ansete British Medical Journal
(BMJ) klar til at blive indlemmet i PubMed Central. Ifølge
redaktøren Richard Smith ligger der helt uselviske motiver bag:
"PMC tvinger os til at spørge os selv: Er det vores mission at tjene
en masse penge (...), eller er vi der for at drive videnskaben og
medicinen fremad?" forklarede han i 'konkurrenten' Nature.
De professionelle forlæggere svarer, at det er et
naivt synspunkt, og at myndighederne (NIH) ikke bør blande sig på
det videnskabelige udgiver-marked. De frygter, at det ikke længere
vil være muligt at drive tidsskrifterne, når indholdet foræres væk.
Modargumentet fra 'gratisterne' er, at der scores alt for store
avancer i øjeblikket, og at delfunktioner som selve
peer-review-processen udemærket i fremtiden kan foretages via
andre kanaler, mens der ikke bør tjenes penge på selve udgivelsen
og dermed tilgængeligheden af informationerne.
Som en konsekvens deraf indrømmer man på PubMed Central da
også, at det i fremtiden kan være nødvendigt at køre de udgifter,
der trods alt er ved at udgive de elektroniske tidsskrifter over på
forfatterne i stedet for læserne - en praksis der allerede finder sted
hos en lang række trykte niche-tidsskrifter, der ikke kan finansieres
udelukkende ved salget.
Indtil videre bliver løsningen hos PMC, at tidsskrifter som PNAS
venter en måned med at gøre deres artikler frit tilgængelige på
nettet, og dermed bevarer noget af incitamentet for læserne til at
abonnere på den trykte udgave.
Hvad med kvaliteten?
Et andet debatpunkt på den elektroniske dagsorden er kvaliteten af
det materiale, som udbydes af de forskellige tjenester.
I de første udkast til det halvfilantropiske projekt, PMC, var det
planen, at der også skulle indgå preprints. Men for at få PNAS med
på vognen har NIH været nødt til at skille dem fra i en selvstændig
tjeneste, da man på det hæderkronede tidsskrift var bange for, at
blive "smudset til" ved at optræde side om side med preprints -
videnskabens grå litteratur.
Selvom ønskerne om at gøre de videnskabelige artikler frit
tilgængelige på Internettet generelt har stor sympati blandt
græsrødderne på universiteterne, deles denne bekymring af en lang
række menige forskere: Hvad vil der ske med kvaliteten? Hvad med
bevaringen? Vil de elektroniske artikler ikke være sårbare overfor
pludselige katastrofer eller nye medier? Hvad med plagiater?
Modargumentet blandt eksperter i den elektroniske
informationsteknologi er, at kvalitetskontrollen er
medie-uafhængig. Peer review-processen kan implementeres i
luften lige så godt som på landjorden. Også spørgsmålet om
krediteringen og copyrights er medieuafhængig, og angsten for
plagiater mere end opvejes af evnen til at spore dem.
Men af gammel vane foretrækker de fleste stadig papiret. Et
medium, som er svært at producere, svært at distribuere, svært at
arkivere og svært at kopiere.
De subversive
Men så længe omstruktureringen af publikationsprocessen afhænger
af hele kollektivet af institutionelle og internationale initiativer, er
der stadig en god bid vej til målet. Men ifølge Steven Hanard fra
Southampton University i UK findes der allerede nu en ganske
udbredt udvej for de progressive forfattere. Metoden er dog lettere
subversiv, og mange fagblade truer da også deres bidragsyder med
både stok og bål for at undgå dette: I al sin enkelthed går ideen ud
på, at forskerne fortsætter med at offentliggøre deres arbejder i
deres foretrukne blade, som de plejer. Men derudover arkiveres
artiklerne elektronisk som preprints på deres egen hjemmeside, frit
tilgængelige for alle. Læserne på Internettet vil hurtigt finde ud af
at bruge informationerne på den rette måde.
En centraliseret variant af den idé findes allerede siden august 1991
på http://arXiv. org, som er et gratis arkiv oprettet af Paul
Ginsparg, der efterhånden har vokset sig så stor, at mange fysikere
og matematikere efterhånden bruger den som primærkilde til nye
artikler.
Fremtiden
Ifølge idealet er det, man i fremtiden sandsynligvis skal betales for,
ikke den rå Corpus Magnus af data, men derimod den overlejrede
strukturering og fortolkninger af hele denne viden. Symbolanalysen
vil blive den centrale og bekostelige service til dem, som ikke gider
eller kan gøre hele arbejdet selv - hvilket i praksis vil sige alle de
almindelige brugere.
Som ideal kunne man ifølge Ginsparg forestille sig en datastruktur
på Internettet, der lejrede flere niveauer af bearbejdning oven på
hinanden, lidt ligesom man nu er begyndt på at gøre på f.eks.
Danmarks Radios hjemmeside, hvor man både kan få de
bearbejdede indslag, men også (hvis man graver lidt dybere) de
bagvedliggende råbånd af interviews og baggrundsmateriale.
Gennemsigtigheden af udvalgsprocessen vil dermed øges
betragteligt. Med hensyn til de videnskabelige artikler, vil enhver
form for information ifølge Ginsparg kunne lægges hen over
rå-arkiverne og bestyres af en tredje part. For eksempel kunne
arkiverne opdeles i sektorer, klassificeret ved hjælp af kriterier så
som almen vigtighed, forskningskvalitet, specificitet, osv., og
enhver artikel kunne løbende skifte klassificering alt efter
yderligere informationer og forskning, siger Ginsparg.
Læseren kunne udnytte et interface af et sæt anbefalede "essentielle
læsninger" for et givent emne for en given tid. Man kunne også
tilføje opfølgende informationer, som placerer artiklen X i forhold
til artiklerne Y og Z (med hyperlinks), der førte til udviklingen af
artikel A og B (nye hyperlinks), osv.
Litteraturen i Internettet behøver altså ikke at være lige så statisk
som dets gamle papirbaserede forgænger. Bit-versionen kan
forblive lige så flydende som forskningen selv.
Uanset om det bliver de gratis initiativer som PubMed Central eller
forlæggerne, der vinder kampen om de videnskabelige
informationer på Internettet, så er det sikkert at "Babelstårnet"
bliver bygget. For hvem gider betale for og vente på trykte udgaver
af tidsskrifter, når de kan nås med et enkelt museklik eller to
hjemme fra pc'en? Spørgsmålet bliver blot, om vi alle lukkes ind,
eller om udsigten over menneskenes samlede viden bliver
forbeholdt det mindretal, der har råd til at betale entreen.
Fakta - Parterne
*PubMed Central: Gratis og globalt frit tilgængeligt elektronisk
arkiv for primærlitteratur indenfor medicin, biologi og
landbrugsvidenskab. Basen vil indeholde både peer-review artikler
og preprints med en tydelig skelnen mellem dem. Et halvt dusin
anerkendte tidsskrifter, såsom Proceedings of the National Academy
of Sciences (PNAS) og Molecular Biology of the Cell har valgt at
bidrage med deres indhold. PubMed Central er etableret af det
amerikanske National Institute of Health (NIH) og samarbejder med
European Molecular Biology Organization (EMBO), og deres
tilsvarende tjeneste, E-Biosci. Starter januar 2000. Foreløbig
adresse for PubMed: http://www.ncbi.nlm.nih.gov/
PubMed/
*Forlæggerne: Forlagenes kommercielle alternativ har endnu ikke
noget navn, men ideen går ud på at koble artikelreferencerne på
hjemmesiderne hos de respektive publikationer, således at der
opstår et enormt net af krydsreferencer (vha. hyperlinks).
Sammenslutningen består af en lang række af de største
videnskabelige forlæggere: American Association for the
Advancement of Science (AAAS, med bl.a. Science), Academic
Press, American Institute of Physics, Association for Computing
Machinery, Blackwell Science, Elsevier
Science, Inst. Of Electrical and Electronics Engineers, John Wiley
& Sons, Kluwer Academic Publishers, Nature, Oxford University
Press og Springer Verlag.
*HighWire: Tidsskriftbase fra biblioteket i Stanford, USA, som
indeholder henvisninger til en masse (p.t. 162) mindre amerikanske
biomedicinske tidsskrifter, der hver især er lagt ud på www, og
hvor en del kan benyttes gratis. Adgang til over en halv million
abstracts og over 100.000 artikler i fuld længde (full-text). Adresse:
http://highwire.stanford.edu
*ArXiv.org: Gratis og globalt frit tilgængeligt elektronisk arkiv for
primærlitteratur indenfor fysik og matematik. Artiklerne er
preprints og peer-reviewed, og lagt ud primært af forfatterne selv.
Over 100.000 full-text-artikler. Finansieret af det amerikanske
National Science Foundation, NSF. Adresse: http://arXiv.org eller
http://xxx.lanl.gov
*ADS: Abstract-databaser for astrofysik, finansieret af NASA.
Over 1,5 millioner abstracts fra tidsskrifter og andre videnskabelige
kilder som konferencer og ph.d.-afhandlinger. Desuden over
100.000 full-text-artikler. Adresse: http://adswww.harvard.edu
*Andre arkiver: En liste over de største full-text-arkiver med
naturvidenskabeligt materiale på Internettet findes hos HighWire.
Adresse: http://highwire.standford.edu/lists/ largest.dtl
Fakta - DADS
*På forskningsbibliotekerne rundt omkring i den vestlige verden er
man godt i gang med at omstille sig til den snarlige revolution:
Traditionelle funktioner som udlån og registrering beskæres, mens
der oprustes inden for databearbejdning. Hovedopgaven for
fremtidens bibliotek bliver således ikke at stille data til rådighed,
men at sortere i dem for brugeren.
I Danmark er mange forskningsbiblioteker gået sammen om at
abonnere på de elektroniske versioner af en række fagblade for at
minimere omkostningerne. Danmarks Tekniske Videnscenter og
Bibliotek styrer det såkaldte DADS-system, der indeholder adgang
til mange on-line-artikler (fra begge 'lejre' i det ovenstående). Fra
de deltagende biblioteker er der adgang til abstracts eller
full-text-artikler fra cirka 1.700 tidsskrifter fra forlagene Academic
Press, Elsevier, Kluwer, Springer, MCB og SIAM. Selvom
adgangen til artiklerne og dermed også administrationen er blevet
nemmere, har det ikke betydet lavere priser. Selvom bibliotekerne
allerede abonnerer på den trykte udgave af et tidsskrift, skal de
betale ekstra for den elektroniske version. Samtidig følger der med
mange af pakkerne tidsskrifter, som ligger langt uden for de enkelte
bibliotekers fagområder, og som er uden værdi for lånerne.
Tilbage til indholdsfortegnelsen