For utvikling av bibliotekdata og sosial teknologiTanker & nyheterAllmenningOm oss

Velkommen til laboratoriet! Tanker & nyheter:

Podeprosjektet

Podes logoI løpet av Biblioteklaboratoriets levetid har noen prosjekter knyttet til laboratoriet kommet og gått. Et av disse er Pode.

Pode har sitt utspring i vinnerbidraget i klassen ”Beste mashup-idé” fra Biblioteklaboratoriets konkurranse høsten 2007. Ideen ble i etterkant foredlet frem til en prosjektsøknad og delfinansiert av ABM-utvikling. Prosjektorganisasjonen er plassert på Deichmanske bibliotek. Biblioteklaboratoriet er referansegruppe for prosjektet.

Podeprosjektet utforsker hvilken tilgang bibliotekene har til egne katalogdata. Det ser på tilgangen til bibliotekenes bibliografiske data og mulighetene norske bibliotek har til å lage tjenester på toppen av disse for å presentere bibliotekkatalogen på nye - og kanskje mer spennende måter.

Det overordnede målet med Pode er å tilrettelegge for en bedre brukeropplevelse i bibliotekenes katalog på nett. Dette gjøres ved å gi brukerne relevant informasjon og merverdi gjennom å koble sammen data i egen bibliotekkatalog, samt å koble til relevant innhold fra andre kilder.

Prosjektet er nå inne i tredje fase og har Linked data og semantisk web som fokusområde. To norske forfattere og hele den flerspråklige faglitteratursamlingen ved Deichman skal konverteres til RDF og det skal lages tjenester på toppen av disse dataene. Du kan følge prosjektet fortløpende på Podes blogg

I fase 1 og 2 ble tilgjengeligheten til dataene undersøkt via de biblioteksspesifike protokollene z39.50 og SRU. Det ble laget to mashuper; Reiseplanleggeren og Musikkmashupen. De fleste norske bibliotek har z39.50-protokoll, men slett ikke alle. Den litt nyere protokollen SRU ble også prøvd ut, men siden det ikke er noen norske biblioteksystem som har denne protokollen, ble Koha installert.

I Koha er det svært enkelt å legge til innhold fra andre kilder på en ryddig måte. Dette er gjort synlig ved at Musikkmashupen og lenker til fulltekstartikler i JournalTOC har blitt integrert i Koha i såkalte "mashins".

For å jobbe med presentasjon av bibliotekkatalogen som helhet ble det fritt tilgjengelige indekserings og søkegrensesnittet VuFind installert.

Dagens bibliotekkataloger inneholder ingen relasjoner mellom forfatter, verk og ulike utgaver. Det er ikke rom for det i MARC-formatet. Som svar på den vanlige verdens relasjonsdatabaseteori har IFLA laget en konseptuell modell for bibliografiske data, den såkalte FRBR-modellen. Denne har Pode testet ut i samarbeid med Trond Aalberg ved NTNU som har laget et verktøy for å FRBRisere MARC-data etter et sett regler vi kan være med på å sette opp. Målet har vært å redusere trefflistene brukeren får ved å søke på en forfatter.

Arbeidet med mashupene, Koha, VuFind og FRBRisering har avdekket flere utfordringer knyttet til de bibliografiske dataene. Endringer i katalogiseringspraksis opp i gjennom årene, diskutabel kvalitet på inndaterte data fra de gamle katalogkortene, ulik tolkning av katalogiseringsreglene fra person til person og fra tiår til tiår - alt dette er med på å gjøre oppslag og søkeresultater i norske bibliotekkataloger svært varierende - både internt i en katalog og selvfølgelig også på tvers av de ulike bibliotekkatalogene.

Podeprosjektet har støtte fra ABM-utvikling ut 2010.

Ressurser
Kommentarer (1)  Permalink

Kravspesifikasjon 2.0

Omtrentlig 10 år etter at bibliotek.dk og bibliotek.se ble etablert i våre naboland ser det endelig ut til det skal lanseres en sentralisert tjeneste mot Norges bibliotekkataloger. ABM-utvikling og Nasjonalbibliotekets prosjekt Biblioteksøk er inne i sin andre fase - utviklingen av en pilot - som etter planen skal munne ut i en tredje fase og arbeid med en 1. lansering i 2010. Rapporten fra den første fasen som ble avsluttet i sommer er spennende lesning, kanskje særlig vedleggene som blant annet angir et sett av funksjonelle og tekniske kravspesifikasjoner. Spesifikasjonene tar innover seg og krever mye av den moderne funksjonaliteten som allerede eksisterer i samsøktjenester som bibliotek.dk og Worldcat, i et biblioteksystem som Koha og i søkesystemer som VuFind og Summa. Sistnevnte system, hvis kildekode nylig er tilgjengeliggjort, vurderes også som teknisk plattform for Biblioteksøk. Det lover bra!

Samtidig er det naturlig nok en del funksjonalitet og tekniske løsninger som ikke nevnes i disse spesifikasjonene, og en del av den planlagte funksjonaliteten har like naturlig fått en lav prioritet. Prosjektet skal tross alt gjennomføres og må prioritere. Det betyr allikevel ikke at brukere og bibliotekarer som har nedlagt adskillig tid både på utsiden og innsiden av dagens kataloger ikke bør ønske seg full pakke. I alle fall bør vi formidle i klare ordelag hva det er vi ønsker oss basert på egne og lange erfaringer; funksjoner som kanskje ikke inngår i Biblioteksøks kravspesifikasjon eller funksjoner fra denne som vi vil understreke at er viktige å få på plass så fort som mulig. Eller kanskje funksjoner vi ønsker oss i  eksisterende biblioteksystemer.

I rapportens hoveddel påpekes det da også at Biblioteksøk er avhengig av å etablere en god dialog med beslutningstakere ute i bibliotekene. Det ønsker vi nå å bidra til i Biblioteklaboratoriet ved å utarbeide en slags kravspesifikasjon 2.0, et sett av brukergenererte krav og ønsker. Vi har opprettet en side i allmenning (wikien) vår hvor alle er velkomne til å dele sine erfaringer med dagens kataloger i form av å uttrykke krav og ønsker for en fremtidig katalog. Slik håper vi ikke bare å bidra til å gi Biblioteksøk, men også de tradisjonelle systemleverandørene en pekepinn på hvor landet bør ligge.

Dette er dermed en oppfordring til å ta en tur til allmenningen for å bidra til en bred og generell kravspesifikasjon til en moderne bibliotekkatalog.
Kommentarer (0)  Permalink

Koha 3.0.0! På norsk!!

1. påskedag kunne lanseringsansvarlig Joshua Ferraro stolt annonsere at beta-versjonen av det fri programvarebaserte biblioteksystemet Koha 3.0.0 var tilgjenglig for nedlastning. Det var en beskjed mange har ventet lenge på. Undertegnede har lurt på hvordan alle de nye funksjonene, og ikke minst integrasjonen av søkesystemet Zebra fra danske Indexdata, fungerer i praksis. Andre har ventet på konteksten til sine egne oversettelser.

Thomas Gramstad og Axel Bojer som for tiden jobber med en bokmålsoversettelse av den nye Koha-versjonen og Unni Knutsen og Marit Kristine Ådland som jobber med en tilsvarende oversettelse til nynorsk tilhører de sistnevnte av forventningsfulle fri programvare- og biblioteksystementusiaster. Biblioteklaboratoriet benyttet sjansen til en liten samtale om det pågående oversettelsesarbeidet når denne gjengen var samlet til et språkvaskmøte på Høgskolen i Oslo.


F.v. Axel Bojer, Thomas Gramstad, Unni Knutsen og
Marit Kristine Ådland at work

Hvor langt er dere kommet? Er det lenge før vi får tilgang på Koha i norske språkdrakter?


A.B.: Vi er ferdige med den første grunnoversettelsen, og holder på med en siste vask som vi håper på å komme langt med i dag. Grunnoversettelsen vil komme med i den nye og stabile 3.0-versjonen, men vi er usikre på om vi rekker å få med den vaskede versjonen.

U.K.: Programvaren utvikler seg jo kontinuerlig, og ulike brukere vil benytte seg av ulike deler av programmet. Slik sett er oversettelsen et pågående arbeid som også de som installerer og bruker Koha vil ta del i.

Hva er de største utfordringene?

U.K.: Vi har foreløpig jobbet litt sånn i løse lufta, uten tilgang på den aktuelle 3.0.0-versjonen da denne har vært under utvikling samtidig som vi har oversatt. Vi har med andre ord oversatt strenger av tekst, som vi til dels ikke har kjent konteksten til. Nå som beta-versjon har kommet blir det en del av vaskejobben å sjekke om vi har truffet i forhold til faktisk bruk av de oversatte strengene.

A.B.: Å oversette fra engelsk til norsk innebærer også en del problemstillinger knyttet til tolkningen av tvetydige engelske ord, som i mange tilfeller kan være både substantiv og verb, altså bety både en aktivitet eller en gjenstand.

U.K.: Begrepet issue, som er en gjenganger i Koha, kan for eksempel vise til både et hefte, et utlån eller en utgave.

Dere har jo litt ulik bakgrunn. Noen av dere er datafolk, mens andre har bibliotekfaglig bakgrunn. Jeg antar at denne rollebesetningen er heldig i forhold til å løse slike oversettelsesmessige problemstillinger?

A.B.: Jeg er jo datamann med oversettelseserfaring fra blant annet OpenOffice og kan bidra med det jeg kan om oversettelse av programvare og en teknisk begrepssfære. Det heter for eksempel e-post og ikke e-mail …

U.K.: Når vi jobber med den nynorske versjonen, baserer vi oss først og fremst på den engelske originalen, men skjelner samtidig til bokmålsarbeidet. Slik kvalitetssjekker vi hverandres oversettelser. Vi bibliotekarer har jo stort sett greie på den bibliotekfaglige begrepssfæren, og kan korrigere i forhold til det.

A.B.: Det er uansett sunt med ferske øyne i oversettelsesarbeidet, man blir fort blind, og det er ikke alltid at det er det man tenker at står skrevet som faktisk gjør det.

Hvor mange strenger har dere oversatt?

A:B.: Publikumskatalogen (OPAC`en) består av 1000 strenger og internsystemet av 6400 strenger. Av disse er 800 knyttet til UNIMARC-formatet som vi ikke har oversatt da UNIMARC ikke er en benyttet standard i Norge, og dessuten fordi mange av dem foreligger på fransk.

M.K.Å.: En streng kan være på alt fra ett ord til en forklaringstekst over flere setninger.

Hvilket inntrykk har dere fått av den nye Koha-versjonen?

U.K.: Etter at vi fikk beta-versjonen har jeg jobba litt med systempreferansene og fått litt innblikk i den nye funksjonaliteten. Det virker på meg som om Koha nå har veldig mye av det vi etterlyser i norske kataloger; blant annet en FRBR-aktig presentasjonsmulighet, emnesky, relevansrangering av trefflister, "2.0"-sentrering rundt brukeren som aktivt kan utvikle søkene sine og administrere sine egne lån, samt støtte for z39.50-, SRU- og OAI-PMH-protokollene. Det virker i det hele tatt veldig lovende og skal bli spennende å utforske videre.

På den norske Koha-lista har det vært litt diskusjon om hva som skal til for at Koha kan bli tatt i bruk i Norge, noen hevder blant annet at det må på plass en form for teknisk kompetanse og infrastruktur. Er det slike baktanker dere har når dere nå oversetter Koha?

A.B.: For min del handler det først og fremst om å sørge for åpenhet og frihet ved å muliggjøre bruk av fri programvare. De praktiske følgende innebærer jo også at mindre institusjoner, som skoler, som har bruk for et biblioteksystem nå kan få et rimelig tilbud. De som tar i bruk fri programvare med tilgjengelig kildekode er heller ikke prisgitt en leverandørs nykker, men står fritt til å utvikle selv eller å få andre til å gjøre det, og da samtidig som man deler sine egne bearbeidelser og forbedringer med andre. Samarbeid er til det beste for oss alle.

T.G.: Koha gir lokalt selvstyre fordi bibliotekarene selv kan endre og tilpasse programvaren (eller få noen til å gjøre det) som man ønsker. Den friheten mangler i produsenteid programvare. Bibliotekene og fri programvare har samme kjerneverdier og målsetninger. Det er derfor en naturlig match.

U.K.: Det handler også om interessen for en god sluttbrukerløsning. Med den nye versjonen av Koha kan det virke som om vi får en langt bedre løsning enn det som per dags dato foreligger i Norge.


Koha og mulighetsbetingelsene for Koha i Norge diskuteres som nevnt over på den norske Koha-epostlista. Hvis du ikke allerede er medlem av denne lista kan du melde deg på her.

EDIT, 28. juni: 6. juni ble det avholdt et KOHA-seminar på Sjøkrigsskolen i Bergen. Her ga Magnus Enger en generell introduksjon til KOHA, og Unni Knutsen presenterte arbeidet med oversettelsen.
Beslektede poster:
Manifest
En åpen husholdning
Kommentarer (0)  Permalink

Nytt tidsskrift for biblioteklaboranter

Code4Lib Journal er ute med sin aller første utgave, og her burde det være en del interessant stoff for biblioteklaboratoriets deltakere:

Kommentarer (0)  Permalink

Hvem eier katalogpostene?

I diskusjonen om Web og Bibliotek 2.0 er datadeling et viktig tema. (For egen del synes jeg dette er mye mer spennende enn blogging.) Biblioteksektoren har på mange måter vært i front her med Z39.50-protokollen som har en historie tilbake fra før World Wide Web ble introdusert.

Kort fortalt er Z39.50 en protokoll som beskriver hvordan klientdatamaskiner kan hente katalogposter fra en hvilken som helst tjenerdatamaskin som tilbyr slike data. Den typiske bruken av Z39.50 er ved fellessøk mot ulike biblioteksystemer. I Norge har vi NorZIG, som står for Norsk Z39.50 Interessegruppe, som sørger for at de norske biblioteksystemene kan levere bibliografiske poster noenlunde ensartet.

Dette er ikke det eneste bruksområdet for Z39.50. Protokollen kan også brukes for å «kopikatalogisere», eller «stjæle poster» som Unni Knutsen skriver om i sin masteroppgave Ut og stjæle poster? (PDF). Dette er rasjonelt for den som katalogiserer, men er lite benyttet i Norge i dag, først og fremst på grunn av manglende støtte i norske biblioteksystemer. I Mikromarc 3 og Koha er dette standardmåten for katalogisering, men i norsk sammenheng har vi en konflikt mellom teknologiske muligheter og eierskapet til katalogpostene. Mange bibliotek abonnerer på Bibbi-poster fra Biblioteksentralen, som på den ene siden sikrer kvalitet på postene, men på den annen side hindrer kopiering. Dette er så vidt jeg vet årsaken til at Tønsberg og Nøtterøy bibliotek ikke tilbyr MARC-visning av katalogposter. Vi kommer ikke langt med Bibliotek 2.0-tjenester med slik skjuling av katalogpostene. Etter min mening bør produksjon av kvalitetsposter være en nasjonal oppgave, og disse postene skal kunne flyte fritt inn og ut av webløsninger, uansett om det er offentlige eller kommersielle tjenester. Kan noen snart ta tak i dette problemet? ABM-utvikling?

Z39.50 er som nevnt en gammel protokoll som ikke lenger er «state of the art» i forhold til hvordan webteknologien har utviklet seg. Z39.50 er rett og slett lite «mashup-vennlig», for å sitere Ole Husby fra Bibsys på Kunnskapsorganisasjon 2.0-konferansen tidligere i år. I dag er det utveksling av XML-data via web services som gjelder. I biblioteksektoren kan Z39.50 erstattes med SRU (Search/Retrieval via URL), som nettopp har disse egenskapene. SRU drøftes på alle møter i NorZIG, men ingen norske biblioteksystemer har støtte for denne protokollen per i dag. Min oppfordring er at bibliotekene må begynne å etterspørre SRU, slik at vi kan få fortgang i implementeringen. Dette vil gjøre det mye enklere også for amatørprogrammerere å lage tjenester som tar i bruk bibliografiske poster. Jeg kan ikke garantere at vi får en oppblomstring av innovative bibliotektjenester, men det åpner i det minste opp «katalogsiloene» for andre.

På masterstudiet ved bibliotekutdanningen har studenter laget mashups av bibliografiske poster fra Library of Congress via SRU-protokollen og data fra Amazon. Neste år vil vi gjerne hente data fra norske bibliotekkataloger!
Kommentarer (8)  Permalink
Next1-10/126

2007-11-08 13.46

Powered by Flux CMS