Automatisch Blackboard content metadateren
Door de DU is een verkenning gedaan van het automatisch metadateren (auteurs Kees Pannekeet, Allard Strijker, Francis Brouns en Wim van der Vegt). In deze verkenning beschrijven ze proof-of-concept hoe ze met een applicatie een willekeurige Blackboard systeem automatisch kunnen metadateren.
Uitgangspunt hierbij was de door Leuven ontwikkelde applicatie SAmgI (Simple Automatic Metadata Generation Interface) voor het automatisch genereren van metadata. Door de Open Universiteit is er een tool (Blackboard Crawler) ontwikkeld waarmee je leermiddelen kan extraheren uit Blackboard zonder installatie van nieuwe onderdelen. De crawler haalt alle bestanden waar deze toegang tot heeft uit Blackboard en stuurt deze naar SAmgI en deze genereert daar de metadata bij.
De kwaliteit van de metadata is jammergenoeg van lage kwaliteit vanwege een aantal redenen:
- de metadata wordt bepaald op basis van de kenmerken van een bestand, zoals bijvoorbeelde properties van een Word-bestand. De kenmerken zijn vaak echter zeer slecht ingevuld; dat is natuurlijk niet raar als je bedenkt waarom we dit gingen doen (mensen willen geen metadata invullen).
- De metadata wordt volgens mij maar zeer beperkt bepaald op basis de inhoud van een bestand, zoals keyword bepaling aan de hand van hoe vaak een bepaald woord voorkomt e.d.
- er wordt niet gekeken naar de context van het bestand, dus in welke course hij zit (en dus welke kenmerken deze course heeft), wat de folder naam is waar het bestand in staat.
Mijn conclusie als ik dit zo lees, is dat de kwaliteit niet veel hoger is dan met Google en dat is toch enigszins teleurstellend.
No feedback yet
Form is loading...