Seitdem
Bibliotheken bestehen, wird in deren Büchern,
Zeitschriften und Katalogen von Hand und damit
"konventionell" recherchiert. Mit dem
Aufbau externer Datenbanken, d.h. Datenbanken, die
außerhalb eines Unternehmens bei Datenbankanbietern
(Hosts) geschaffen und zum Durchsuchen angeboten
werden, kam die Online-Recherche als zweite
Rechercheform hinzu. Sie ermöglicht jedem, mit
geringem technischen Aufwand in großen Datenmengen
zu suchen und innerhalb kürzester Zeit Ergebnisse zu
erhalten. Erst durch diese neue Rechercheart besteht
eine Chance, die heutige Informationsflut zu
bewältigen.
Mit der Möglichkeit, externe
Datenbanken direkt online durchsuchen zu können,
steht jedem das Wissen der Welt zur Verfügung, so
daß es nur abgefragt werden muß. Hierbei sind
folgende Vorteile zu beobachten,
- hohe Schnelligkeit
- hohe Vollständigkeit
- hohe Aktualität
- hohe Exaktheit
- suchen vom Arbeitsplatz aus
- zeitunabhängig suchen
- preiswert
Aufbau einer externen Datenbank
Eine Datenbank kann als
elektronische Datei bezeichnet werden. Jede Datei
besteht aus einer Vielzahl von Karteikarten, die
geordnet in einem Kasten stehen. Jede Karte bildet
eine Informationseinheit, die in einer Computerdatei
(engl.: file) "Datensatz" (record) genannt
wird. Die Zeilen werden bei einer Datei
"Felder" (fields) genannt. Das wichtigste
Feld, unter dem der Datensatz in einer Datei abgelegt
ist, ist das "Haupt- oder Schlüsselfeld"
(key). Ferner werden für einen Datensatz noch die
folgenden Bezeichnungen verwendet:
Zitat (citation)
Referenz (reference)
Dokumentationseinheit
(documentation unit)
Die meisten Datenbanken enthalten
nur begrenzte Informationsmengen wie bibliographische
Daten und allenfalls Zusammenfassungen (abstracts) zu
einem technischen Aufsatz. Sie kommen daher mit einer
begrenzten Anzahl an ausfüllbaren Zeilen bzw.
Feldern aus. Datenbanken, die große Mengen an
Informationen, die also den gesamten Text in einem
Datensatz gespeichert haben, werden
"Volltextdatenbanken" genannt.
Bei einer Recherche in einer Datei
bzw. Datenbank geht es also immer darum, bestimmte
Datensätze zu finden. Suchen Sie z.B. in einer
deutsche Unternehmen enthaltenden Datenbank nach
allen holzverarbeitenden Unternehmen im Raum
München, so werden durch Eingabe der Postleitzahl
und des Wortes "Holz" oder sinnverwandter
Ausdrücke die Anzahl vorhandener Datensätze
erhalten und diese auf einem Bildschirm oder Drucker
ausgegeben. Diese gefundenen Datensätze werden auch
"Treffer" genannt.
Eine elektronische Datenbank
besitzt neben den Datensätzen noch ein Programm, das
die Datensätze verwaltet. Hierdurch können die
Datensätze angelegt, beschrieben, geändert und
gelöscht werden. Wenn ein Außenstehender in der
Datenbank online nach Datensätzen suchen will, steht
ihm das "Retrievalprogramm" (retrieval =
Abfrage) zur Verfügung. Durch diese Trennen der
Programme zum Aufbauen bzw. Verwalten und zum
Abfragen kann eine Datenbanken verschiedener Hosts
(Datenbankanbietern) unter verschiedenen
Retrievalsprachen jedermann angeboten werden.
Es ist üblich, eine Datenbank aus
mehreren Dateien aufzubauen. Die erste Datei
(Dokumentendatei) enthält die Datensätze in
derselben üblichen Ordnung wie eine Kartei, und die
zweite Datei (Indexdatei oder Index) enthält für
die eigentliche Suche alle Worte aller Datensätze
alphabetisch geordnet. Bei der Eingabe eines
Suchwortes wird nur die alphabetisch geordnete Datei
durchsucht. So kann die Anzahl der Datensätze, in
denen das Suchwort vorkommt innerhalb von Sekunden
ermittelt werden. Im Index fehlen nur unwichtige
Wörter wie Artikel und Hilfsverben. Diese
"Stopwörter" würden eine Datenbank
unnötig aufblähen.
In den meisten Index-Dateien kann
nach einem Anfangsbestandteil eines Wortes wie
z.b. "Schuh$" gesucht werden. Dies wird
"Maskieren" oder "Trunkieren"
genannt. Das $-Zeichen ist eine Art Joker und
bedeutet, daß auf der rechten Seite des
Stammbestandteils "Schuh" dieser beliebig
weitergeführt sein kann.
Es gibt zwei verschiedene
Sucharten in Index-Dateien:
Bei der oben beschriebenen
"Direktsuche" wird danach gesucht, ob ein
eingegebenes Wort exakt oder entsprechend der
Maskierung oder Trunkierung als Bestandteil der
Index-Datei vorhanden ist. Zu allen in der
Index-Datei gefundenen Worten ist gespeichert, in
wievielen Datensätzen jedes dieser Worte vorkommt.
Diese Zahlen werden addiert und als sogenannte
"Treffer" auf dem Bildschirm angezeigt.
Hierdurch wird angegeben, in wievielen Datensätzen
das gesuchte Wort vorkommt.
In der zweiten Suchart der
Indexsuche wird wiederum in der Indexdatei
gesucht, aber diesmal wird nicht die Anzahl der
Treffer angezeigt, sondern es wird derjenige Bereich
der Index-Datei als Liste dargestellt, in dem das
gesuchte Wort vorkommmt bzw. die dem Suchwort gleich
oder ähnlich sind. Durch die zweite Suchart kann
nachgesehen werden, welche ähnlichen Worte zum
interessierten Bereich vorhanden sind. Dies ist z.b.
bei einer Suche mit Namen oder bei in der
Schreibweise unklaren Worten von Vorteil.
Um in einer Datenbank suchen zu
können, müssen zuvor mehrere Fragen beantwortet
worden sein. So muß gewußt werden:
- welche Datenbanken zu meinem Problem
bestehen,
- bei welchem Host die ausgewählten
Datenbanken liegen,
- welche Retrievalsprache (Abfragesprache) bei
einem bestimmten Host verwendet wird und
- wie die Datensätze bei einer bestimmten
Datenbank aufgebaut sind.
U.a. zu diesen Fragen wird in dem
Programm "INFO & RECHERCHE" von
Dr. H.B. Cohausz ausführlich Stellung genommen.
Weitere Dokumente:
Methoden von Patentrecherchen
Download Lehrprogramm INFO & RECHERCHE
Online-Patentrecherchen / Datenbankanbieter
Patentinformationszentren /-stellen in Deutschland