Search strategy

Information search strategies involves the selection of information sources, e.g. bibliographical databases, physical libraries or the Internet, selecting search terms or other symbols, developing search profiles and modifying profiles by iterative search strategies. A complicating factor is search goal revision during the search process.

 

The developing of effective search strategies is dependent of knowledge about database coverage, of available subject access points and their relative information value for the topic being searched such as the relative value of searching descriptors versus cited references (cf., citation indexing) versus free text  fields such as titles, abstracts or full texts.

 

A review of search failures is provided by Tonta (1992). A case study of a real-life search strategy is provided by Hjørland (1986/1988).

 

The theory of search strategy has been explored more formally in information theory and computer science, where a number of search algorithms have been developed, including a binary one, resembling the strategy used in "twenty questions":

 

"The game [twenty questions] suggests that the information (as measured by Shannon's entropy statistic) required to identify an arbitrary object is about 20 bits. The game is often used as an example when teaching people about information theory. Mathematically, if each question is structured to eliminate half the objects, twenty questions will allow the questioner to distinguish between 220 or 1,048,576 objects. Accordingly, the most effective strategy for Twenty Questions is to ask questions that will split the field of remaining possibilities roughly in half each time. The process is analogous to a binary search algorithm in computer science" (Wikipedia, 2006).

 

 

 

 

 

Literature:

 

Armstrong, C. J.  & Large, J. A. (Eds.). (1988). Online Search Strategies. Aldershot, UK: Gower.

 

Armstrong, C. J. & Large, J. A . (Eds.). (2000-2001). Manual of online search strategies.  3rd ed. Vol. 1-3. Brookfield, VT: Gower. (vol. 1: Sciences; vol. 2: Business, law, news and patents; vol. 3: Humanities and social sciences).

 

Barrick, J. A. & Spilker, B.C. (2003). The relations between knowledge, search strategy, and performance in unaided and aided information search. Organizational Behavior and Human Decision Processes, 90(1), 1-18.

 

Bates, M. J. (1979). Information Search Tactics. Journal of the American Society for Information Science, 205-214.
 

Bates, M. J. (1987). How to use information search tactics online. Online, (may), 47-54.

 

Cole, C.; Mandelblatt, B. & Stevenson, J. (2002). Visualizing a high recall search strategy output for undergraduates in an exploration stage of researching a term paper. Information Processing & Management, 38(1), 37-54.

 

Cooper, H. M. (1986). Literature searching strategies of integrative research reviewers. Knowledge: Creation, Diffusion, Utilization, 8, 372-383. (A summary of this article appeared in American Psychologist, 1985, 40, 1267-1269) 

 

Cooper, H. M.  & Ribble, R. G. (1989).  Influences on the outcomes of literature searches for integrative research reviews.  Knowledge: Creation, Diffusion, Utilization 107, 179-201.

 

Ford, N.; Miller, D. & Moss, N. (2002). Web search strategies and retrieval effectiveness: an empirical study. Journal of Documentation, 58(1), 30-48.

 

Ford, N.; Miller, D. & Moss, N. (2005). Web search strategies and human individual differences: Cognitive and demographic factors, Internet attitudes, and approaches . Journal of the American Society for Information Science and Technology, 56(7), 741-756.

 

Ford, N.; Miller, D. & Moss, N. (2005). Web search strategies and human individual differences: A combined analysis. Journal of the American Society for Information Science and Technology, 56(7), 757-764.

 

Frick, E. (1995). History; illustrated search strategy and sources. 2nd ed. Ann Arbor, Mich.: Pierian Press. 

 

Haynes, , R. B.; Wilczynski, N.; McKibbon, K. A.; Walker, C. J. & Sinclair, J. C. (1994). Developing optimal search strategies for detecting clinically sound studies in MEDLINE. Journal of the American Medical Informatics Association, 1(6), 447-458.

 

Heine, M. H. & Tague, J. M. (1991). An investigation of the optimization of search logic for the MEDLINE database. Journal of the American Society for Information Science, 42(4), 267-278.

 

Hjørland, B. (1985). Forskeres selektionsstrategier i informationssøgning under "overload"-betingelser. SAML. Skrifter om Anvendt og Matematisk Lingvistik, 11, 69-103.

 

Hjørland, B. (1986). Litteratursøgning i forskning. Et eksempel og nogle vigtige implikationer. SAML. Skrifter om Anvendt og Matematisk Lingvistik, 12, 79-102. Click for full-text PDF

 

Hjørland, B. (1988). Information Retrieval in Psychology. Behavioral and Social Sciences Librarian, 6(3/4), 39‑64. Click for full-text IR in psychol_1988.PDF (English translation of Hjørland, 1986).

 

Hjørland, B. (1992). Litteratursøgning som en kvantitativ og kvalitativ forskningsmetode. IN: Klinisk psykologisk forskning. En indføring i metoder og problemstillinger. Redigeret af Nicole K. Rosenberg; Karen V. Mortensen; Esben Hougaard; Susanne Lunn & Alice Theilgaard. København: Dansk Psykologisk Forlag. (Pp. 57-69 + references pp. - ).

 

Shuman, B. A. (1993). Cases in online search strategy. Englewood, Colerado: Libraries Unlimited, Inc.

 

Shute, S. J. & Smith, P. J. (1993). Knowledge-based Search Tactics. Information Processing & Management, 29(1), 29-45.

 

Wilczynski, N. L. & Haynes, R. B. (2005). Optimal search strategies for detecting clinically sound prognostic studies in EMBASE: An analytic survey. Journal of the American Medical Informatics Association, 12(4), 481-485.

 

Wilson, P. (1979). On the use of records of research. Library Quarterly, 49(2), 127-145.

 

Wong, S. S. L.; Wilczynski, N. L.; Haynes, R. B. (2006). Developing optimal search strategies for detecting clinically sound   treatment studies in EMBASE. Journal of the Medical Library Association, 94(1), 41-47.

 

Tonta, Y. (1992). Analysis of search failures in document retrieval systems: a review. The Public Access Computer Systems Review, 3(1), 4-53.

 

Wikipedia. The free encyclopedia. (2006). Twenty Questions. http://en.wikipedia.org/wiki/Twenty_questions

 

Zins, C. (2000). Success, a structured search strategy: Rationale, principles, and implications. Journal of the American Society for Information Science, 51(13), 1232-1247.

 

 

 

See also: Metabibliography

 

 

 

Birger Hjørland

Last edited: 19-03-2007

Home

 

 

to be edited:

Brugere af biblioteker og databaser søger almindeligvis *information langt mindre systematisk end bibliotekarer forestiller sig og måske synes de bør. Dette gælder også i forskning (Jfr. Wilson, 1979). Der er naturligvis store individuelle forskelle, der kan være betinget af brugernes personlighed, af opgavens karakter eller af kollektive vilkår og forudsætninger i domænet. Typer af opgaver, der klart lægger op til en meget systematisk søgning er empiriske undersøgelser, der vedrører sjældne fænomener af stor teoretisk rækkevidde (i psykologi f.eks. eenæggede tvillinger, der er opvokset separat). Generelt spiller systematisk informationssøgning en stor rolle f.eks. i medicin. Derimod er udtømmende og systematisk søgning sjældne i behandling af bredere teoretiske perspektiver, hvor læsning af hovedværker og almen "horisont" som regel er vigtigere end en pedantisk trang til fuldstændighed.

Bates (1979) definerer søgestrategi (i søgning) som en plan for hele søgningen, mens søgestrategi som et forskningsområde betyder studiet af teori, principper og praksis i udformningen og anvendelsen af søge­strategier og -taktikker. Begrebet taktik handler derimod om kortsigtede mål og manøvrer, og søgetaktik beskæftiger sig derfor med handlinger, der kan bringe en søgning videre.

Den mest benyttede, og ofte også mest effektive litteratursøgningsmetode består i at gennemgå referencelister i den litteratur, man allerede har fundet. Den kaldes sneboldmetoden, fordi den giver anledning til flere og flere, men også ældre og ældre referencer. Den forudsætter, at man har har held til at lokalisere nogle helt centrale referencer samt at litteraturen på området hænger sammen ved eksplicitte citater. Ved hjælp af *citationsindekser kan denne metode suppleres fremad i tid. Den indeholder da det yderlige problem i forhold til sneboldmetoden, at den er afhængig af citationsindeksernes *dækning af det pågældende emne. Tilsammen kan sne­bold- og citationsindekssøgning kaldes kædesøgning.

Ved bibliografisk søgning forstås søgning i relevante fag- og nationalbibliografier. Metoden er afhængig af, at der eksisterer relevante bibliografier, samt af deres *dækningsgrad. Metoden kaldes ofte "systematisk litteratursøgning", men i praksis er en garanti for komplet oversigt og dækning sjældent til stede. Det kan øge graden af bibliografisk kontrol, hvis man udarbejder en liste over relevante fagtidsskrifter og manuelt checker de tidsskrifter (samt evt. håndbøger m.v.), der ikke er omfattet af det fagbibliografiske apparat.

Nogle gange konstruerer bibliotekarer søgediagrammer, der rummer normative an­visninger på, hvorledes informationssøgning skal foretages (Se nærmere under *algoritme).

Man kan analytisk skelne imellem de søgetaktiske foranstaltninger, der er emne- eller domæne-uafhængige og de, der er domæneafhængige. Det er en rent analytisk skelnen, for der er i alle virkelige søgesituationer tale om en stærk interaktion imellem anvendelsen af domæneafhængige og domæne­uafhængige taktikker. Shute & Smith (1993) påpeger således, at også intermediære, der ikke har domæneviden, har behov for at trække hårdt på den smule domænevi­den, de måtte have opsnappet tilfældigt for at kunne anvende de domæne-uafhængige søgetaktikker.

Et case-study i søgestrategi er analyseret i Hjørland (1988/1989). I dette eksempel resulterede en edb-søgning i 79 unikke referencer, en manuel søgning i trykte bibliografier gav yderligere 47 fund og en søgning i referencelister i den fremfundne litteratur resulterede i yderligere 82 referencer, hvilket demonstrerer "snebold­metodens" effektivitet og betydning.

Bates (op. cit.) diskuterer 29 forskellige taktikker i informations­søgning. Disse er opdelt i 4 overordnede grupper:
"Monitoring tactics", d.v.s. taktikker, der skal holde søgningen på sporet og effektiv. Eksempel: "Check", d.v.s. gennemse den originale forespørgsel og sammenlign den med det løbende søgeemne for at se, at det er det samme.
"File structure tactics", d.v.s teknikker til at bevæge sig frem gennem filstrukturen hos informations­faciliteten for at nå den ønskede fil, kilde eller information i en kilde. Eksempel: "Select", d.v.s. at nedbryde komplekse søgeopgaver i underproblemer og arbejde med eet problem ad gangen.
"Search formulation tactics", d.v.s. taktikker, der skal fremme processen med at udforme eller omforme søgeformuleringer. Eksempel: "Specify": at søge på termer, der er ligeså specifikke som den ønskede information.
"Term tactics", taktikker, der skal hjælpe med i selektionen og revisionen af specifikke termer indenfor en søgeformulering. F.eks. "Super": at bevæge sig hierakisk op til en bredere (overordnet) term.