任何高质量的文献搜索均离不开布尔运算符的支持。这些运算符——或连接语——告知数据库需要以何种方式对搜索项进行组合。为了查找更加准确和相关的结果,研究人员会利用它们配置其搜索内容。搜索体验取决于如何正确使用布尔运算符。

构建搜索的布尔运算符主要有三个:AND、ORNOT

AND

AND表示两个搜索项同时出现在结果中,或者同时显示所有搜索项(如果以AND连接两个以上搜索项)。

解析:

在某些数据库(比如PubMed)中,需要将布尔运算符大写,而在其他数据库(如Web of Science)中则不需要,但将它们大写也不会有坏处。

在上图中,第一个圆代表用“packaging”搜索到的结果,第二个圆代表用“logistics”搜索到的结果,最后一个圆则代表“fish*”的搜索结果。将这三个搜索项用AND连接后,搜索结果将同时包含这三个项目,即三个圆的橙色重叠区域所代表的结果。

根据搜索的位置,和搜索可以如下所示:

或者这样:

又或者这样:

上三种配置方式均属同一种搜索。

借助AND额外添加的每一个搜索项或概念都将使搜索变得更加具体和有针对性。需要注意的是,如果用AND添加了一个“错误”项(可能因为使用了具有不同含义的专业术语),可能搜不到相关的结果。

解析:

在某些数据库中,如果用户在单词之间未输入任何布尔运算符,数据库将默认这些单词间存在一个AND。举例来说,科学网(Web of Science)平台上的所有数据库均采用这种方法。其他数据库,如EBSCOhost平台上的任意数据库,则默认这些词汇是彼此关联(即一个词组)或彼此靠近的。其靠近的程度则取决于大学图书馆的内部规定。

为了解数据库的运行方式,用户可以分别使用AND和不使用AND搜索两个词。如果使用AND返回的结果数量超过不使用AND返回的结果,这说明用户需要输入AND来避免该数据库将搜索项处理为一个词组或彼此靠近的项目。我们将通过近期发布的博客文章《研究基础:词组和靠近》(Research Basics: Phrases and Proximity)对此进行深入探讨。

PubMed搜索引擎结合了此类处理方法。该引擎将某些与医学主题词 (Medical Subject Headings)相关的词汇处理为词组,而对于那些与这些主题词不相关的词汇,则默认它们之间存在一个AND。用户可以在高级搜索页面上的搜索细节中找到PubMed的搜索处理方式。

OR

使用AND可细化搜索,而OR则能扩大搜索范围。使用OR能够捕捉以两个或更多词汇来表示的概念。OR可避免由以下原因所导致的结果遗漏,包括:输入错误的搜索项;世界不同地区和不同时期的研究人员使用的词汇或拼写方式存在区别。

在下图中,我们使用了三个涵盖相同概念的相关单词。当我们用OR连接这些单词时,相当于告诉数据库,我们需要含fish的搜索结果,或者含seafood的结果。搜索结果可能同时含fish和seafood,或者seafood和“sea food”,或者“sea food”和fish,或者同时含这三个搜索项。只要有一个项目存在于数据库记录中,它便会出现在结果列表中。

用户可能注意到,严格来说,fish和seafood并非同义词,但它们是相关项目,可能与搜索存在关联。因此,研究人员需要决定使用哪些搜索项。当开始搜索时,用户应该参考研究人员所使用的术语来决定应该用OR连接哪些搜索项。在含OR的字符串中,用户无需拘泥于两三个搜索项。在这上述例子中,你还可以加入“OR salmon OR trout OR sardines”等更多搜索项。

根据搜索的位置,OR搜索可能如下所示:

解析:

请注意,字符串前后须加圆括号并输入在一个搜索框内。通常来说,最好将每一个由OR字符串定义的概念放在一个搜索框内。圆括号的作用是,告诉数据库将这些成组的搜索项视为单一概念。有的数据库会自动对在同一搜索框内输入的内容加圆括号,有的数据库则不会——但手动添加是永远不会出错的。

OR搜索也可能如下所示:

NOT

NOT是一种强大又存在潜在风险的布尔运算符,必须谨慎加以使用。NOT的问题在于,它会排除搜索结果,当这些结果被排除后,用户看不到它们,因此用户不知道它们是不是根据希望的方式被排除。

在下图中,所有返回的结果都将包含potato一词,除非它们还包含sweet一词。

总体而言,用AND来细化搜索比NOT更安全,但有时NOT有助于检查搜索是不是根据规定方式进行的。举例来说,用户可以在以下搜索中决定把“sweet potato*”当作一个词组,还是用AND来连接它们,即“sweet AND potato*”。

解析:

为执行这次搜索,用户需要将“sweet AND potato*”放入圆括号,告诉数据库这个搜索需要在词组“sweet potato*”被排除之前进行。用户将看到所有含sweet和potato*的数据库记录,除非这两个词被视为一个词组。

综合使用布尔运算符

上述搜索同时使用了AND和NOT。搜索经常需要同时使用不同布尔运算符。根据所使用的搜索界面类型,用户既可以一次性完成搜索内容的构建,也可采取循序渐进的方式完成。

最可能采用的搜索构建方式是,收集许多分别代表不同概念的词汇,然后综合每一种概念,使其与其它概念形成交叉。

像这样:

这样:

或这样:

请注意,数据库将处理或整合括号内的搜索内容。所以,请确保整合内容的正确性。否则,许多引擎将从左至右读取字符串,有的引擎甚至会以更加难以推断的方式读取信息。让我们来了解一下括号的重要性。在EBSCOhost平台上的FSTA数据库搜索fusarium OR hydrophobin* AND gush* OR flow* AND beer* OR ale OR brew* OR malt*将返回71842条搜索结果,但搜索 (fusarium OR hydrophobin*) AND (gush* OR flow*) AND (beer* OR ale OR brew* OR malt)”则会返回86条结果,实际上,每一条结果均包含所输入的所有概念。