Aduna seminar Exploring Enterprise Information
Gisteren was ik bij het Seminar Exploring Enterprise Information van Aduna. Aduna houdt zich sinds 1997 bezig met het ontwikkelen van software voor medata-gebaseerde search en retrieval. Sinds enige tijd heeft Everett (aka Webflex) een belang hierin en Fred Hendriks van Everett is nu hard bezig om Aduna goed in de markt te plaatsen. En terecht, want ze hebben echt mooie software en de experts op het gebied van RDF.
Na een korte introductie van Fred Hendriks ging de CTO Jeroen Wester in op waar Aduna zich mee bezighoudt. Als eerste ging hij in de op de beperkingen van Google. Deze is alleen nuttig als het resultaat dat je zoekt ook daadwerkelijk bovenaan komt; de kunst van Google is natuurlijk dat dit vaak voorkomt, waardoor het wordt gebruikt.
Aduna houdt zich bezig met Advanced Search Technology. Gartner en Forrester geven in hun market trends aan dat de vraag hiernaar zal toenemen. AST is meer dan fulltext search:
- Over verschillende bronnnen heen
- Categorisatie en clustering
- fact en entity extraction
- informatie presentatie (bijvoorbeeld met visualisatie)
Het zal vooral toenemen omdat er een tendens is naar heterogeniteit binnen organisaties:
- Sterke groei van het aantal systemen
- het aantal vormen waarin informatie voorkomt is divers
- diversificatie binnen de organisatie zelf
Een van de producten die Aduna heeft is AutoFocus. Dit is een desktop search programma met een visualisatie van je zoekopdrachten. Je kan hierbij zoeken in allerlei verschillende bronnen, zoals mailbox, netwerkschijven, websites, intranet e.d.
(Deze tool is meer een soort marketingtool, vergelijkbaar met Google Desktop Search)
Enterprise Metadata
Voor de echte enterprise oplossingen hebben ze het product Spectacle met op de achtergrond Sesame en Aperture. Dit is gebaseerd op facetnavigatie (toevallig schrijft duimdog hierover gisteren). Een aantal links naar voorbeelden waar Spectacle is toegepast: glas, aardewerk en Aduna website.
Creating a Search Infrastructure
De twede presentatie werd verzorgd door Peter Valkenburg, CTO van Everett. Hij ging in op het inpassen van deze technology binnen een Service Orientated Architectuur. Volgens hem wordt zoeken steeds meer infrastructureel probleem. Wat het hierbij lastig maakt is dat je verschillende type gebruikers moet kunnen faciliteren, van iemand die geen inhoudelijk expert en ook geen zoekexpert tot inhoudelijke zoekexpert. Bij de bibliotheken zitten bijvoorbeeld vaak mensen die alles van zoek afweten, maar weinig van de inhoud. Terwijl een onderzoeker inhoudelijk er alles vanaf weet, maar niet veel weet van geavanceerd zoeken. De zoekarchitectuur moet deze soorten processen kunnen facililiteren. Waar moet je hierbij op letten:
- voor wie doe het het?
- Welke processen zijn er?
- Welke bronnen wil je ontsluiten?
- Wele zoekcapaciteiten moeten we aanbieden
Belangrijke opmerking die hij hierbij maakt is dat Enterprise Search een programma is (wat bestaat uit meerdere projecten) en niet een enkel project is.
Reference Network Architecture (RNA-project)
Na de pauze ging Hans Nederbragt van Trezorix in het op het RNA-project waarin een groot aantal partijen (publiek en privaat) samenwerken op het vindbaarmaken van ons cultureel erfgoed. Leuke voorbeelden die hij liet zien, is de website www.soortenregister.nl en borgen in groningen. Bij deze projecten maken ze gebruik van verschillende referentiestructuren die worden gecombineerd. Bij de beschrijving van de objecten haal je de naamgeving ook weer uit een referentiestructuur, daardoor worden ook de verschillende sites met elkaar gelink. het voordeel hiervan is dat het gedaan kan worden door niet-inhoudsdeskundige (en dat is goedkoper en meer beschikbaar).
Overheid.nl
De tweede presentatie over de toepassing van Aduna software is van Hans Overbeek van Advies Overheid.nl. In 2003 zijn zij begonnen met overheid.nl. De grootste knelpunten op dat moment waren:
- grote verschillen in kwaliteit van de overheidswebsites
- veel gebruik van Google: veel hits, maar geen samenhang
- geen goede zoekmachines voorhanden.
Nu drie jaar later hebben ze de volgende resultaten behaald:
- Er zijn webrichtlijnen
- Er is een zoekdienst
- Er zijn gemeenschappelijke zoeksleutels (metadata)
Ze zijn begonnen met een aantal collecties:
- vergunningen
- bekendmakingen
- wet- en regelgevingen
- productencatalogus
De uitdaging hierbij was dat het meeste nog niet digitaal beschikbaar was. Verder wordt er decentraal (gemeente, provincie, ministerie) gepubliceerd en dit moet centraal gevonden worden. Voor de metadata gebruik ze DublinCore aangevuld met enkele eigen velden, want DublinCore was niet toereikend. Ze zijn wel actief binnen DublinCore om tot een uitbreiding te komen voor overheidsinformatie.
Conclusie
Aduna heeft zeer indrukwekkende software voor het realiseren van een Search Infrastructuur. Het mooiste van dit alles is dat het nog open-source is ook. Ze hanteren hetzelfde model als MySQL.com, dus het product is gratis en je kan er support bij kopen.
No feedback yet
Form is loading...