Search strategy
Information search strategies involves the selection of information sources, e.g. bibliographical databases, physical libraries or the Internet, selecting search terms or other symbols, developing search profiles and modifying profiles by iterative search strategies. A complicating factor is search goal revision during the search process.
The developing of effective search strategies is dependent of knowledge about database coverage, of available subject access points and their relative information value for the topic being searched such as the relative value of searching descriptors versus cited references (cf., citation indexing) versus free text fields such as titles, abstracts or full texts.
A review of search failures is provided by Tonta (1992). A case study of a real-life search strategy is provided by Hjørland (1986/1988).
The theory of search strategy has been explored more formally in information theory and computer science, where a number of search algorithms have been developed, including a binary one, resembling the strategy used in "twenty questions":
"The game [twenty questions] suggests that the information (as measured by Shannon's entropy statistic) required to identify an arbitrary object is about 20 bits. The game is often used as an example when teaching people about information theory. Mathematically, if each question is structured to eliminate half the objects, twenty questions will allow the questioner to distinguish between 220 or 1,048,576 objects. Accordingly, the most effective strategy for Twenty Questions is to ask questions that will split the field of remaining possibilities roughly in half each time. The process is analogous to a binary search algorithm in computer science" (Wikipedia, 2006).
Literature:
Armstrong, C. J. & Large, J. A. (Eds.). (1988). Online Search Strategies. Aldershot, UK: Gower.
Armstrong, C. J. & Large, J. A . (Eds.). (2000-2001). Manual of online search strategies. 3rd ed. Vol. 1-3. Brookfield, VT: Gower. (vol. 1: Sciences; vol. 2: Business, law, news and patents; vol. 3: Humanities and social sciences).
Barrick, J. A. & Spilker, B.C. (2003). The relations between knowledge, search strategy, and performance in unaided and aided information search. Organizational Behavior and Human Decision Processes, 90(1), 1-18.
Bates, M. J. (1979). Information Search Tactics. Journal
of the American Society for Information Science, 205-214.
Bates, M. J. (1987). How to use information search tactics online. Online, (may), 47-54.
Cole, C.; Mandelblatt, B. & Stevenson, J. (2002). Visualizing a high recall search strategy output for undergraduates in an exploration stage of researching a term paper. Information Processing & Management, 38(1), 37-54.
Cooper, H. M. (1986). Literature searching strategies of integrative research reviewers. Knowledge: Creation, Diffusion, Utilization, 8, 372-383. (A summary of this article appeared in American Psychologist, 1985, 40, 1267-1269)
Cooper, H. M. & Ribble, R. G. (1989). Influences on the outcomes of literature searches for integrative research reviews. Knowledge: Creation, Diffusion, Utilization 107, 179-201.
Ford, N.; Miller, D. & Moss, N. (2002). Web search strategies and retrieval effectiveness: an empirical study. Journal of Documentation, 58(1), 30-48.
Ford, N.; Miller, D. & Moss, N. (2005). Web search strategies and human individual differences: Cognitive and demographic factors, Internet attitudes, and approaches . Journal of the American Society for Information Science and Technology, 56(7), 741-756.
Ford, N.; Miller, D. & Moss, N. (2005). Web search strategies and human individual differences: A combined analysis. Journal of the American Society for Information Science and Technology, 56(7), 757-764.
Frick, E. (1995). History; illustrated search strategy and sources. 2nd ed. Ann Arbor, Mich.: Pierian Press.
Haynes, , R. B.; Wilczynski, N.; McKibbon, K. A.; Walker, C. J. & Sinclair, J. C. (1994). Developing optimal search strategies for detecting clinically sound studies in MEDLINE. Journal of the American Medical Informatics Association, 1(6), 447-458.
Heine, M. H. & Tague, J. M. (1991). An investigation of the optimization of search logic for the MEDLINE database. Journal of the American Society for Information Science, 42(4), 267-278.
Hjørland, B. (1985). Forskeres selektionsstrategier i informationssøgning under "overload"-betingelser. SAML. Skrifter om Anvendt og Matematisk Lingvistik, 11, 69-103.
Hjørland, B. (1986). Litteratursøgning i forskning. Et eksempel og nogle vigtige implikationer. SAML. Skrifter om Anvendt og Matematisk Lingvistik, 12, 79-102. Click for full-text PDF
Hjørland, B. (1988). Information Retrieval in Psychology. Behavioral and Social Sciences Librarian, 6(3/4), 39‑64. Click for full-text IR in psychol_1988.PDF (English translation of Hjørland, 1986).
Hjørland, B. (1992). Litteratursøgning som en kvantitativ og kvalitativ forskningsmetode. IN: Klinisk psykologisk forskning. En indføring i metoder og problemstillinger. Redigeret af Nicole K. Rosenberg; Karen V. Mortensen; Esben Hougaard; Susanne Lunn & Alice Theilgaard. København: Dansk Psykologisk Forlag. (Pp. 57-69 + references pp. - ).
Shuman, B. A. (1993). Cases in online search strategy. Englewood, Colerado: Libraries Unlimited, Inc.
Shute, S. J. & Smith, P. J. (1993). Knowledge-based Search Tactics. Information Processing & Management, 29(1), 29-45.
Wilczynski, N. L. & Haynes, R. B. (2005). Optimal search strategies for detecting clinically sound prognostic studies in EMBASE: An analytic survey. Journal of the American Medical Informatics Association, 12(4), 481-485.
Wilson, P. (1979). On the use of records of research. Library Quarterly, 49(2), 127-145.
Wong, S. S. L.; Wilczynski, N. L.; Haynes, R. B. (2006). Developing optimal search strategies for detecting clinically sound treatment studies in EMBASE. Journal of the Medical Library Association, 94(1), 41-47.
Tonta, Y. (1992). Analysis of search failures in document retrieval systems: a review. The Public Access Computer Systems Review, 3(1), 4-53.
Wikipedia. The free encyclopedia. (2006). Twenty Questions. http://en.wikipedia.org/wiki/Twenty_questions
Zins, C. (2000). Success, a structured search strategy: Rationale, principles, and implications. Journal of the American Society for Information Science, 51(13), 1232-1247.
See also: Metabibliography
Birger Hjørland
Last edited: 19-03-2007
to be edited:
Brugere af biblioteker og databaser søger almindeligvis *information langt
mindre systematisk end bibliotekarer forestiller sig og måske synes de bør.
Dette gælder også i forskning (Jfr. Wilson, 1979). Der er naturligvis store
individuelle forskelle, der kan være betinget af brugernes personlighed, af
opgavens karakter eller af kollektive vilkår og forudsætninger i domænet. Typer
af opgaver, der klart lægger op til en meget systematisk søgning er empiriske
undersøgelser, der vedrører sjældne fænomener af stor teoretisk rækkevidde (i
psykologi f.eks. eenæggede tvillinger, der er opvokset separat). Generelt
spiller systematisk informationssøgning en stor rolle f.eks. i medicin. Derimod
er udtømmende og systematisk søgning sjældne i behandling af bredere teoretiske
perspektiver, hvor læsning af hovedværker og almen "horisont" som regel er
vigtigere end en pedantisk trang til fuldstændighed.
Bates (1979) definerer søgestrategi (i søgning) som en plan for hele søgningen,
mens søgestrategi som et forskningsområde betyder studiet af teori, principper
og praksis i udformningen og anvendelsen af søgestrategier og -taktikker.
Begrebet taktik handler derimod om kortsigtede mål og manøvrer, og søgetaktik
beskæftiger sig derfor med handlinger, der kan bringe en søgning videre.
Den mest benyttede, og ofte også mest effektive litteratursøgningsmetode består
i at gennemgå referencelister i den litteratur, man allerede har fundet. Den
kaldes sneboldmetoden, fordi den giver anledning til flere og flere, men også
ældre og ældre referencer. Den forudsætter, at man har har held til at
lokalisere nogle helt centrale referencer samt at litteraturen på området hænger
sammen ved eksplicitte citater. Ved hjælp af *citationsindekser kan denne metode
suppleres fremad i tid. Den indeholder da det yderlige problem i forhold til
sneboldmetoden, at den er afhængig af citationsindeksernes *dækning af det
pågældende emne. Tilsammen kan snebold- og citationsindekssøgning kaldes
kædesøgning.
Ved bibliografisk søgning forstås søgning i relevante fag- og
nationalbibliografier. Metoden er afhængig af, at der eksisterer relevante
bibliografier, samt af deres *dækningsgrad. Metoden kaldes ofte "systematisk
litteratursøgning", men i praksis er en garanti for komplet oversigt og dækning
sjældent til stede. Det kan øge graden af bibliografisk kontrol, hvis man
udarbejder en liste over relevante fagtidsskrifter og manuelt checker de
tidsskrifter (samt evt. håndbøger m.v.), der ikke er omfattet af det
fagbibliografiske apparat.
Nogle gange konstruerer bibliotekarer søgediagrammer, der rummer normative
anvisninger på, hvorledes informationssøgning skal foretages (Se nærmere under
*algoritme).
Man kan analytisk skelne imellem de søgetaktiske foranstaltninger, der er emne-
eller domæne-uafhængige og de, der er domæneafhængige. Det er en rent analytisk
skelnen, for der er i alle virkelige søgesituationer tale om en stærk
interaktion imellem anvendelsen af domæneafhængige og domæneuafhængige
taktikker. Shute & Smith (1993) påpeger således, at også intermediære, der ikke
har domæneviden, har behov for at trække hårdt på den smule domæneviden, de
måtte have opsnappet tilfældigt for at kunne anvende de domæne-uafhængige
søgetaktikker.
Et case-study i søgestrategi er analyseret i Hjørland (1988/1989). I dette
eksempel resulterede en edb-søgning i 79 unikke referencer, en manuel søgning i
trykte bibliografier gav yderligere 47 fund og en søgning i referencelister i
den fremfundne litteratur resulterede i yderligere 82 referencer, hvilket
demonstrerer "sneboldmetodens" effektivitet og betydning.
Bates (op. cit.) diskuterer 29 forskellige taktikker i informationssøgning.
Disse er opdelt i 4 overordnede grupper:
"Monitoring tactics", d.v.s. taktikker, der skal holde søgningen på sporet og
effektiv. Eksempel: "Check", d.v.s. gennemse den originale forespørgsel og
sammenlign den med det løbende søgeemne for at se, at det er det samme.
"File structure tactics", d.v.s teknikker til at bevæge sig frem gennem
filstrukturen hos informationsfaciliteten for at nå den ønskede fil, kilde
eller information i en kilde. Eksempel: "Select", d.v.s. at nedbryde komplekse
søgeopgaver i underproblemer og arbejde med eet problem ad gangen.
"Search formulation tactics", d.v.s. taktikker, der skal fremme processen med at
udforme eller omforme søgeformuleringer. Eksempel: "Specify": at søge på termer,
der er ligeså specifikke som den ønskede information.
"Term tactics", taktikker, der skal hjælpe med i selektionen og revisionen af
specifikke termer indenfor en søgeformulering. F.eks. "Super": at bevæge sig
hierakisk op til en bredere (overordnet) term.