Information retrieval: onderzoek zoekfuncties Office 365 en Google Docs

Tijdens mijn laatste vak aan de UvA heb ik samen met Peter Becker en Jacqueline Schaap gewerkt aan een verplicht onderdeel: een onderzoek gericht op zoeksoftware. We hebben gekozen om dit onderzoek uit te voeren naar twee bestaande zoeksystemen: de zoekfunctie van Office 365 van Microsoft en die van Google Docs.

De achterliggende gedachte bij deze keuze is het feit dat veel organisaties er voor kiezen om één van beide omgevingen te gebruiken ten behoeve van het eigen documentbeheer (een deel van de enterprise content). In beide omgevingen bestaan mogelijkheden om documenten te ordenen via een mappenstructuur, maar beide leveranciers claimen ook dat de kwaliteit van de zoekmachine een dergelijke werkwijze overbodig maakt. Wij waren dan ook geïnteresseerd in de scores van de beide zoekmachines ten aanzien van recall, precision en relevance ranking.

Als leidraad voor dit onderzoek hebben we gebruik gemaakt van een handzaam artikel van Tague-Sutcliffe uit 1992 waarin 10 stappen worden beschreven voor het opzetten van een information retrieval test. We hebben in beide systemen gewerkt met een testcollectie van 300 identieke documenten en 30 queries (20 known item queries en 10 subject search queries). Volgende metingen zijn uitgevoerd:

 • Bij een known-item query is er sprake van één relevant document als goede treffer. De criteria ten aanzien van het zoekresultaat waren dan ook: staat het document bij de eerste 10 resultaten en zo ja, op welke plaats?
  • Daartoe is de Mean Reciprocal Rank (MRR) gehanteerd. (Croft, 2010, p.323): als het document op rank 1 stond kreeg het de waarde 1/1= 1. Stond het op 2, dan de waarde ½=0,5 enzovoort. Per zoekmachine zijn 20 queries uitgevoerd, waarna de gemiddelde score is bepaald.
 • Bij de subject queries was vooraf bepaald welke documenten als relevante treffers (altijd meer dan 1) moesten worden teruggegeven door het systeem. Om te bepalen in hoeverre dat het geval was (recall) en op welke plaats in de ranking (precision) zijn de volgende meetmethoden gehanteerd:
  • Mean Average Precision (MAP) (Croft, 2010, p.317): kort gezegd geeft deze methode antwoord op de vraag: hoeveel relevants vind je in de top 10 en hoe hoog staan ze dan? De nadruk ligt hierbij op de precisie.
  • Zelf geformuleerde Raw score, geïnspireerd op Stenmark (2004): hoeveel van de relevante documenten vind je in de top 10? Hierbij ligt de nadruk op de recall.
  • 1/r weight en 1/SQRT(r) weight (Stenmark, 2004). Ook hierbij ligt de nadruk op de recall: relevante documenten die buiten de top 10 vallen, beïnvloeden de score negatief.
  • Om het onderscheid tussen de twee omgevingen te verfijnen, hebben we de Document Cut-off Value (DCV) toegepast. Ook deze methode is afkomstig uit Stenmark (2004) en wordt uitgebreider aangehaald door Hull (1993). De nadruk ligt op de precisie. We hebben metingen gedaan bij  6, 7,  8, 9 en 10 documenten. Bij de methode Stenmark/Hull wordt de cut-off value toegepast op de raw precision. Dat hebben wij ook gedaan, daarnaast hebben we de DCV toegepast op de MAP metingen.

Bij de subject search queries hebben we gekozen om ook de Raw score, de 1/r weight, de 1/SQRT weight toe te passen omdat bij deze metingen de nadruk ligt op de recall en ze daardoor een goede aanvulling zijn op de MAP. De DCV geeft daarnaast ook nog een verfijning op de MAP, beide leggen namelijk de nadruk op de precisie.

Geen echte winnaar maar Office 365 scoort beter bij known items

Office 365 soort bij de Mean Reciprocal Rank beduidend beter (MRR: 0,86) dan Google Docs (MRR: 0,62). Dat is in eerste instantie af te lezen aan de MRR in totaal, maar vermeld moet ook worden dat deze score niet wordt veroorzaakt door één of twee uitschieters: bij zes van de twintig queries scoorde Office lager dan Google, in de overige gevallen scoorde Office hoger of gelijk.

Bij de Mean Average Precision scoort Google beter (MAP: 0,71) dan Office (MAP: 0,69), hoewel het verschil gering te noemen is. Dat komt ook terug in de verdeling van de scores: in de helft van de tien queries scoorde Google hoger, in de andere helft Office.

De raw score (volgens eigen methode) gaf het volgende beeld:

Ook hier, waar de nadruk ligt op de recall, is Google Docs de winnaar. Vijfmaal scoort Google Docs hoger dan Office, driemaal scoren ze gelijk en tweemaal is de hogere score voor Office.

Hoewel de curve bij de 1/SQRT(r) weight vlakker is, komt bij zowel de 1/r weight als de 1/SQRT(r) weight precies hetzelfde beeld naar voren: Google Docs wint met een verwaarloosbaar verschil:

Opvallend is wel dat de verschillen bij sommige queries vrij groot zijn: de ene keer scoort Google veel beter, de andere keer Office. Een duidelijke lijn valt daar niet in te ontdekken.

De laatste meting was die waarbij we cut-off values (DCV) hebben bepaald op 6, 7, 8, 9 en 10 treffers.

Conclusie: Bovenin de ranking (cut-off 6 en 7) wint Office, naarmate de de cut-off hoger ligt (8,  9 en 10), scoort Google gemiddeld  beter. De verschillen zijn echter klein.

Het is interessant deze waarden te vergelijken met de MAP: scoort één van beide zoekmachines beduidend hoger als de DCV lager ligt dan 10? Bij deze berekening scoort Office .365 op alle niveaus beter dan Google Docs.

Dat is dus een verschil ten aanzien van de DCV bij de raw-score.

Op basis van ons onderzoek kan in ieder geval worden vastgesteld dat geen van beide zoekmachines als echte winnaar kan worden aangewezen omdat die beduidend beter scoort dan zijn tegenhanger. Ook in absolute zin zijn de scores niet indrukwekkend: een organisatie die grote hoeveelheden content wil opslaan in Google Docs of Office 365 doet er dan ook verstandig aan om niet uitsluitend te vertrouwen op de aangeboden zoekmachines.

Als we een winnaar zouden moeten aanwijzen, dan zou dat Office 365 zijn omdat die bij de known items duidelijk als beste scoort, niet alleen bij de totalen, maar in de meeste gevallen ook per query. In een enterprise omgeving doen known-item searches er vaak toe: men is op zoek naar een bepaald document en wil het snel hebben. Daarnaast scoort Office 365 beter bij een lage cut-off value.

Bekijk het volledige rapport voor alle volledige tabellen, een uitgebreide toelichting van de meetmethoden, een overzicht van de queries die we hebben gebruikt en onze kritische opmerkingen / lessons learned ten aanzien van het onderzoek.

Advertenties

Caution: ‘plagiaat’ in progress!

De laatste tijd heeft auteursrechten mijn aandacht gekregen. Sinds eind vorig jaar maak ik deel uit van de SURF club Auteursrechten Informatiepunten HBO. Hoe we dat ‘informatiepunt’ concreet gaan inrichten op De Haagse Hogeschool moet ik de komende maanden nog gaan uitwerken, maar de eerste wapenfeiten hebben al plaats gevonden. Zo heb ik in december samen met een collega de volgende presentatie over plagiaat gegeven aan een groep docenten.

Voor de presentatie heb ik gebruik gemaakt van het rapport: ‘Geoorloofd hergebruik; De juridische aspecten van plagiaat in het hoger onderwijs en Leefregels voor geoorloofd hergebruik van materiaal’ van SURF en het filmpje ‘Wanneer pleeg ik plagiaat‘ van de Open Universiteit.

Begin januari heb ik om mijn kennis over auteursrechten op te frissen de cursus ‘Auteursrecht voor onderwijsmediatheken en wetenschappelijke bibliotheken‘ van de GO opleidingen gevolgd.

En niet veel later kwam ik een berichtje tegen op ScienceGuide over de top 10 plagiaatplekken.

Soms gebruiken studenten ongeoorloofd het werk van anderen als zij iets publiceren. Welke bronnen gebruiken ze daarvoor het meest? iParadigms, marktleider in de markt van anti-plagiaat software, keek tussen juni 2010 en juni 2011 naar 33,5 miljoen papers en geeft antwoord op deze vraag.

De analyse van de papers toont aan dat Wikipedia de nummer 1 bron is waarmee universitaire studenten plagiaat plegen. 10,74% van alle gevallen van plagiaat kan worden toegeschreven aan deze open source encyclopedie site.

Top 10 plagiaatbronnen

 1. Wikipedia: 10,74%
 2. Yahoo! Answers: 3,90%
 3. SlideShare: 3,87%
 4. Answers.com: 3,57%
 5. Oppapers.com: 3,11%
 6. Coursehero: 3,01%
 7. Scribd: 2,95%
 8. Justanswer.com: 1,60%
 9. eNotes: 1,58%
 10. Amazon: 1,21%

Wanneer de bronnen worden verdeeld in categorieën blijken echter sociale netwerken en content-sharing sites als Facebook, MySpaces, Scribd en Slideshare de meest gebruikte categorie van bronnen te zijn bij plagiaatgevallen.

Tenslotte bevat het rapport 3 stappen die docenten kunnen doorlopen om plagiaat te voorkomen bij hun studenten:

 1. Maak opdrachten plagiaat-proof door een onderwerp te kiezen dat een geïndividualiseerde aanpak vereist en betrekking heeft op persoonlijke ervaring of actuele gebeurtenissen. Plagiaat plegen is daarnaast moeilijker wanneer studenten verplicht zijn om hun werk in verschillende stadia van het schrijfproces in te dienen: concepten, herziende versies en reflecties.
 2. Geef studenten instructies over de regels rond plagiaat en hoe ze werk van anderen geoorloofd kunnen gebruiken door middel van citeren.
 3. Controleer op een formele manier en geef studenten inzicht in de beoordeling van hun werk.

Dit berichtje heeft ook een plek gekregen op onze bibliotheekwebsite. En komende week gaat de club Auteursrechten Informatiepunten HBO weer de koppen bijeensteken bij SURF. Wordt dus vervolgd…

Wat doen studenten nu echt in de bibliotheek?

In april heb ik ons onderzoek geïntroduceerd, daarna heb ik jullie verteld over hoe John Mackenzie Owen ons heeft begeleid in het onderzoek en heb ik de presentatie getoond die we hebben gegeven tijdens zijn afscheid. En dan is het nu tenslotte tijd voor alle resultaten.

Wat doen studenten in de bibliotheken van het hoger onderwijs?

Het simpele antwoord op deze vraag luidt: studeren!

Daarnaast heeft ons onderzoek, dat plaats vond in zeven universiteits- en hogeschoolbibliotheken en waarbij in totaal van 780 studenten (510 universitair en 270 HBO) gegevens zijn verzameld, volgende conclusies opgeleverd:

 • De meeste gebruikers bezoeken de bibliotheek een of meer keren per week, en blijven per keer twee uur of meer studeren.
 • De belangrijkste redenen om in de bibliotheek te studeren zijn de beschikbaarheid van een rustige studeerplek, en in het HBO ook de mogelijkheid om met anderen samen te werken.
 • De beschikbaarheid van de fysieke collectie is in het algemeen niet de reden waarom studenten studeren in de bibliotheek.
 • Vrijwel alle studenten gebruiken in de bibliotheek een pc of laptop, voor een verscheidenheid aan activiteiten.
 • De behoefte aan ondersteuning door bibliotheekpersoneel is zeer gering.

Studiezalen vervullen een belangrijke functie en voorzien in een evidente behoefte. Maar juist als je bovenstaande conclusies bekijkt zou je kunnen concluderen dat het heel goed mogelijk is om de studieruimte los te koppelen van de overige bibliotheekfuncties. Of toch niet? Ons onderzoek laat ook zien dat tijdens het studeren de studenten toch ook gebruik maken (al vormt het maar een klein onderdeel van het totaal aan activiteiten) van boeken, tijdschriften en andere faciliteiten. De Google-generatie weet de papieren informatie dus nog wel te vinden. Zolang dat gebruik er is, is het verstandig de werkplekken in de bibliotheek zelf te houden. De ondersteuning kan immers niet dichter bij de student worden gebracht. Bibliotheek en studieruimte vullen elkaar aan.

Bepaal zelf je eigen visie (bibliotheek en studieruimte loskoppelen of elkaar juist laten aanvullen) door ons hele onderzoeksrapport te lezen. Geen zin/tijd om de ruim 30 pagina’s door te spitten, lees dan mijn 4 pagina’s tellende samenvatting gepubliceerd in het decembernummer van de InformatieProfessional:

Het was een interessant onderzoek om te doen en ook een uitdaging door de prikkels die John ons gaf – rechtstreeks tijdens de colleges en onrechtstreeks door zijn artikel over de overbodige bibliotheek. Is de bibliotheek overbodig voor de student? De student maakt het niet uit waar hij zit, zolang hij maar de faciliteiten heeft om te studeren (en één van die faciliteiten is de collectie van de bibliotheek). Ons onderzoek laat daarin geen opmerkelijke dingen zien. De student gaat mee met zijn tijd: plaats- en tijdonafhankelijk kunnen werken wordt een algemeen goed. En als bibliotheek moeten we ons richten op de vraag: hoe krijgen we onze collectie van betrouwbare, relevante informatiebronnen bij de student? Het wereldwijde web zorgt ervoor dat we die zowel bij de student in de bibliotheek als buiten de bibliotheek kunnen krijgen. Zorgen goed met studenten gevulde bibliotheken (en de daaruit voortvloeiende positieve statistieken) er dan weer voor dat we onze ‘geldschieters’ (nu nog) kunnen overtuigen van ons nut, dan moeten we het vooral niet nalaten om de studieruimten de bibliotheek te laten aanvullen! Daarentegen moeten we ons ervan bewust zijn dat werkplekken dan misschien ervoor zorgen dat studenten naar de bibliotheek komen, het betekent zeker niet dat ze dan automatisch gebruik maken van de collectie!

Het moet wel ergens over gaan

Op 10 november nam prof. dr. John Mackenzie Owen afscheid van de Universiteit van Amsterdam.

Wat doen studenten nu eigenlijk in de bibliotheek?

Peter Becker en ik hadden de eer om in het aan het afscheidscollege voorafgaand symposium ‘Wat doen die boeken in de bibliotheek’ een presentatie te geven waarin we verteld hebben over ons in het voorjaar uitgevoerde onderzoek. In mijn vorige blogposts hierover lees je meer over dit onderzoek:

Hieronder onze presentatie:

Wat doen studenten nu eigenlijk in de bibliotheek? on Prezi

In het decembernummer van de InformatieProfessional zal een samenvatting van ons rapport te lezen zijn met een link naar de URL waar je het hele rapport kunt downloaden.

Na onze presentatie volgden nog 2 andere presentaties en een panel.

Wat hebben we nu nog aan trefwoorden?

Allereerst gaf Henk Voorbij een antwoord op de vraag ‘Wat hebben we nu nog aan trefwoorden?’ Voorbij stelt vast dat het gebruik van trefwoorden zeer laag is en kijkt daarbij naar een aantal p’s:

 • Hebben we trefwoorden wel nodig –> p van product
 • Zijn we in het bezit van de vaardigheden die we nodig hebben bij het zoeken met trefwoorden –> p van promotie
 • Hoe wordt het zoeken met trefwoorden gepresenteerd in de systemen –> p van prijs

En dat laatste is nou net 1 van de problemen:

 1. Het zoeken met trefwoorden wordt in de meeste systemen niet goed geprofileerd. Een uitzondering hierop is de Aquabrowser waarbij je links een trefwoordencloud hebt met daarbij thesaurustermen in opgenomen en je aan de rechterkant je zoekresultaten kunt verfijnen a.h.v trefwoorden.
 2. Meestal worden er te globale trefwoorden gebruikt waardoor het probleem ruis dat door trefwoorden juist moet worden opgelost niet wordt voorkomen.
 3. Trefwoorden hebben dus niet genoeg meerwaarde voor de gebruiker van zoeksystemen.

Wat doen die archieven bij informatiewetenschap?

Theo Thomassen schetste de geschiedenis van de opleiding archiefwetenschap aan de Universiteit van Amsterdam. En ging daarbij vooral in op de samenwerking met de opleiding Culturele Informatiewetenschap en de organisatorische rompslomp die herpositioneringen met zich mee namen.

Archiefwetenschap is een autonoom onderdeel geworden van de informatiewetenschappen en had deze herpositionering nodig omdat het geen relatie meer kende met geschiedkunde (waar het voorheen onder viel) maar dichter naar de informatiedisciplines was toegegroeid. Het was nodig om onderwijs en onderzoek samen te gaan ontwikkelen met de Culturele Informatiewetenschap om zo een community van onderzoekers te creëren. De positie van Archiefwetenschap en Culturele Informatiewetenschap onder de Geesteswetenschappen is duidelijk: archiefwetenschap en informatiewetenschap gaat niet alleen over informatie maar vooral ook over mensen.

John Mackenzie Owen heeft een groot aandeel gehad in deze processen door de opleidingen vanbinnen uit te ontwikkelen en te reageren op van buiten uit aangedreven herpositioneringen.

Hoe organiseren we de wetenschappelijke informatievoorziening en zijn universiteitsbibliothecarissen nu ijsboeren of kalkoenen?

In het panel zaten volgende deelnemers:

 • Leo Plugge (SURF)
  Plugge gaf aan dat de vraag die we ons moeten stellen is ‘Hoe organiseren we de wetenschappelijke informatievoorziening?’ en refereerde naar uitspraken die SURF heeft gedaan in 1991 (WTR trendrapport) en 1995 (De grensverleggende bibliotheek) waarbij werd aangegeven dat UB’s en HBO bibliotheken niet mochten achterlopen op de ontwikkelingen, ze hun toegevoegde waarde moesten duidelijk maken, anders zouden ze de boekmusea van de 21ste eeuw worden en dat er één Virtuele Wetenschappelijke Bibliotheek moest komen (hé waar hebben we dat meer gehoord 😉 ?). Anno 2011 hebben we DANS, NARCIS, de HBO Kennisbanken mooie bibliotheekgebouwen maar nog steeds geen nationale virtuele bibliotheek maar wel 14 verschillende UB portalen (die allemaal een doorgeefluik vormen naar dezelfde informatieportalen van uitgevers). Dus is het volgende een voorspelling of al uitgekomen?:

  The academic library has died. Despite early diagnosis, audacious denial in the face of its increasingly severe symptoms led to its deterioration and demise. The academic library died alone, largely neglected and forgotten by a world that once revered it as the heart of the university.
  (Academic Library Autopsy Report, 2050 door Brian T. Sullivan)

 • Nol Verhagen (UBA)
  Verhagen refereert naar het artikel ‘Bijna uitgeleend‘ van NRC waarbij universiteitsbibliotheken worden vergeleken met ijsboeren. Het gaat erom of we paradigmaverschuivingen overleven: van handschrift naar boek, van unicum naar massaproduct, van analoog naar digitaal, van afnemen naar producent en van boekentoren naar learning centre. Maar Verhagen zegt dat we echt niet hebben lopen slapen, bewijzen volgende ontwikkelingen: van kaartcatalogus naar OPAC, van print-only naar e-only, van small deal naar big deal, van stand alone naar consortium en van NCC naar Worldcat.
 • Kurt de Belder (UB Leiden)
  Ook Kurt de Belder refereerde naar hetzelfde artikel uit NRC maar vroeg zich niet af of we ijsboeren zijn maar: ‘ Zijn we de kalkoen of hebben we een plek aan de tafel tijdens het kerstdiner’. Hij geeft voorbeelden waarom het laatste het geval is: de UB statistieken geven aan:  drukker dan ooit – langer open dan ooit – hogere uitleencijfers – meer zoekacties in de catalogus –  meer zoekacties in databases – meer downloads artikelen, profilering van de wetenschappelijke informatievoorzieningen: Virtual Learning Environments – omvorming van de archieffunctie van de universiteit, profilering als partner in onderzoek: gecertificeerde informatie / informatie op maat – Virtual Research Environments – datalabs – systemen in de cloud – auteursrechteninformatiepunt – impact analyses & advies – informatie voor visitaties – ondersteuning e-research via data curation en text & datering, en profilering als partner in onderwijs: digitale en fysieke faciliteiten – gecertificeerde informatie – virtuele informatiebalies – repositories – digitale informatievaardigheden cursussen.
 • Hans van Velzen (OBA)
  Ook bij de Openbare Bibliotheek van Amsterdam zijn veel studenten te vinden. Van Velzen constateert dat er veranderingen plaats vinden in aanbod / zoeken / gebruik, namelijk van doelgericht naar ongericht. De gewenste wachttijd is maar 10 seconden. Hij benoemt volgende nieuwe functies voor de openbare bibliotheek: studiehuis (werkplekken, vooral in de vakanties), gids in medialand (23 dingen, digitale maand), ontmoetingsplek (bibliotheek is meest bezochte culturele voorziening), integratie en participatie (bibliotheek draagt bij aan culturele participatie en wordt bezocht door alle culturen, dus goed voor de integratie). Het boek is nog steeds belangrijk, maar niet meer uitsluitend. Een hybride bibliotheek is de oplossing.

Alhoewel Nol Verhagen en Kurt de Belder mooie voorbeelden gaven over het beleid en de voorzieningen van de universiteitsbibliotheek vond ik de boodschap van Leo Plugge een krachtige. Er is dan wel een consortium maar mijn onderbuikgevoel zegt dat we nog meer uit samenwerking kunnen halen. Ondanks dat een onderbuikgevoel meestal niet op feiten is gebaseerd (sorry John) ben ik bevooroordeeld door ons onderzoek waarin ik persoonlijk neig naar visie 1 (maar ook dat is waarschijnlijk gebaseerd op een onderbuikgevoel om de cirkel maar rond te maken).

Tenslotte enkele reacties van publiek/panel:

 • Uiteindelijk maakt het niet uit of de studenten weten dat al deze mooie voorzieningen/faciliteiten/dienstverlening door de bibliotheek worden aangeboden.
 • De gebruikerscijfers zeggen genoeg en worden steeds belangrijker in de besluitvorming.
 • We gaan teveel uit van de klassieke bibliotheek.
 • We (de universiteitsbibliotheken) zijn en onderdeel van een instelling en we moeten gezamenlijk met deze instelling beleid voeren gericht op het ondersteunen van onderwijs en onderzoek.

Afscheidscollege John Mackenzie Owen: het moet wel ergens over gaan!

In de namiddag was het dan zover. John Mackenzie Owen begon zijn afscheidscollege met het afleggen van zijn toga. Hij behandelde daarna 3 onderwerpen: (1) de invloed van technologie op onze maatschappij en de informatievoorziening, (2) de geesteswetenschap en (3) wat informatiewetenschap te bieden heeft.

In juni 1983 voorspelde Mackenzie Owen het technologisch einde van de bibliotheek. Hij claimt dan nu ook – gebaseerd op zijn bevinden toen en wat we nu weten – het intellectuele eigendom van de iPad (Way to Go John!). Maar hij kon toentertijd niet bevroeden hoe groot de impact zou zijn van de technologische ontwikkelingen specifiek op het gebied van verbindingen (het wereldwijde web). De doorslaggevende ontwikkeling was dan ook de verandering die in het gedrag van de gebruikers heeft plaats gevonden. De vanzelfsprekendheid waarmee gebruikers omgaan met de technologische ontwikkelen en de vaardigheid waarmee ze deze technologische ontwikkelingen hanteren zijn verbluffend!

IS er sprake van technologisch determinisme? Technologie krijgt antropologische vormen… maar de waarheid ligt altijd in het midden: technologie is geen tovenaarsleerling en geen actor of agent… maar wel een verleider: het is moeilijk de mogelijkheden van de technologie te weerstaan en we nemen het over zoals het ons wordt aangeboden (door diegene die er geld mee verdienen). Anderzijds oefent de samenleving wel degelijk invloed op de technologische ontwikkelingen.

Mackenzie Owen vindt dat hij gelijk heeft gekregen met zijn voorspelling in 1983: de wetenschappelijke bibliotheken van toen bestaan niet meer. We hebben maar weinig waarde weten toe te voegen als je ons vergelijkt met wetenschappelijke uitgevers. Oorspronkelijke functies zoals ontsluiten en bewaren hebben plaats gemaakt voor licentiebeheer en authenticatie.

Maar… welke uitspraken mag je nou doen als wetenschapper? De basiseigenschap voor wetenschap is volgens John dat het wel ergens moet over gaan. “Het weten” (vermeerderen van de kennis van de wereld) gaat altijd aan “het begrijpen” (vermeerderen van het begrip van de wereld) vooraf. Wetenschap is geen literatuur, dus zeggen wat je er van vindt (zoals in de literatuur gebeurt) is geen taak van de wetenschap. Bij geesteswetenschap gaat het om producten van de geest en om de wereld zoals ie is, daarom moet geesteswetenschap altijd empirisch (gebaseerd op feiten en data) zijn. Mackenzie Owen houdt dus een pleidooi voor: met de beide voeten op de grond, minder onderzoeker meer onderzoek en dat de geesteswetenschap een bijdrage moet leveren aan maatschappelijke problemen.

Mackenzie Owen noemt de sluiting van het Tropenmuseum in een tijd van oplevend nationalisme meer dan symbolisch omdat het museum juist informatie bevat over de periodes dat Nederlanders allochtonen waren in verre werelddelen. Hij pleit er dan ook voor om informatiesystemen meer aan onderzoek te onderwerpen en vooral de rol die informatiesystemen spelen: hoe er gebruik van wordt gemaakt en hoe informatie gemanipuleerd wordt. Hij besluit zijn afscheidscollege met 2 uitspraken, de eerste is van Thomas Jefferson: “…wherever the people are well informed they can be trusted with their own government…”

En zoals ik hem ken als echt docent geeft John nog 1 laatste advies: “There are no promises, but the world is waiting for you to go out and explore […] build, therefore, your own world” (Ralph Waldo Emerson) … “maar hou je wel aan de feiten” (John Mackenzie Owen)!

Míjn voorspelling (zie laatste zin van artikel uit IP 2011 nr. 9) is ook uitgekomen: het was een bescheiden provocerend afscheidscollege! Bedankt John voor al je inspiratie!

Docent John Mackenzie Owen hamert op feiten

In een vorig blogbericht heb ik ons onderzoek al geïntroduceerd dat we hebben uitgevoerd tijdens de integratiemodule Culturele Informatiewetenschap. De aanleiding vormde het artikel ‘De Nederlandse Bibliotheek voor het Onderwijs’ (InformatieProfessional nr 4 2011) van John Mackenzie Owen, onze docent. Het was een van de laatste vakken die John doceerde aan de masteropleiding van de UvA voor hij met emeritaat zou gaan. Dit feit stond centraal in het septembernummer van de InformatieProfessional. Hierin staat een interview met John waarin hij terugblikt op veertig jaar informatievak (p. 14, interviewer: Jenny Mateboer).  Hij voorspelde in 1983 al het ‘technologisch einde van de bibliotheek’ en stelt nu vast dat door de verdwijning van het document de rol van documentleverancier van de bibliotheken nu echt ten einde loopt. Daarnaast schrijft hij zelf over hoe het allemaal begon ergens in 1972 (p. 18). Iets over zaalvullende bakbeesten en groene schermen. Ten slotte reageert Bas Savenije op verzoek van John zelf in dit nummer op Mackenzies pleidooi voor één bibliotheek voor het onderwijs (p. 22). Differentiatie: ja graag! En zelf mocht ik in dit nummer iets vertellen over hoe het er in de laatste colleges van John aan toe ging en hoe hij zijn studenten stuurt en enthousiasmeert (p. 20).

Klik op de afbeelding om het artikel te downloaden

John Mackenzie Owen neemt aanstaande donderdag, 10 november, definitief afscheid. Zijn openbare afscheidscollege vindt om 15 uur plaats in de Aula van de Universiteit van Amsterdam (Singel 411).

In 1983 voorspelde John Mackenzie Owen dat door ontwikkelingen op het gebied van de informatietechnologie de wetenschappelijke bibliotheken overbodig zouden worden. Sindsdien heeft de technologie zich nog veel verder ontwikkeld dan we toen konden vermoeden. Toch bestaan die wetenschappelijke bibliotheken nog. Mackenzie Owen probeert dit tijdens zijn oratie te verklaren. Daarbij stelt hij onder meer het onderwerp ‘technologisch determinisme’ aan de orde. Ook behandelt hij  de vraag in hoeverre het wetenschappelijk verantwoord is om voorspellingen te doen op basis van de eigenschappen van technologie. Vervolgens plaatst Mackenzie Owen deze vraag in een breder context, en kijkt hij kritisch naar de aard en maatschappelijke relevantie van het onderzoek in de geesteswetenschappen. Hij betoogt dat de geesteswetenschappen methodologisch veelal slecht ontwikkeld zijn doordat ze zijn blijven steken in een negentiende-eeuwse romantische opvatting over ‘interpreteren’ als tegenhanger van het natuurwetenschappelijke ‘verklaren’. Mackenzie Owen houdt een pleidooi voor een sterkere empirische fundering van het onderzoek in de geesteswetenschappen. Hij pleit voor minder gefilosofeer en meer aandacht voor concrete data en ‘real-life’ problemen. Tenslotte komt de vraag aan de orde in welke mate de culturele informatiewetenschap aan die eisen voldoet.

Voorafgaand vindt het symposium ‘Wat doen die boeken in de bibliotheek?’ plaats met presentaties en een panel. Medestudent Peter Becker en ik zullen in één van de presentaties de resultaten van ons onderzoek bekend maken. Deze resultaten zullen ook in het decembernummer van de InformatieProfessional te lezen zijn.