搜索引擎在搜集相关信息的时候,抓取的信息维度很多面,学会基本的检索命令,可以有效解决综合搜索引擎反馈结果关联性不高的痛点,在此介绍几种最常用的检索命令,
1、双引号“”-完全匹配检索
现在多数数据库具有智能联想功能,为避免错误的智能联想和解构导致检索结果“答非所问”,就需要启用双引号“”精确检索命令。即将检索关键词放在双引号中,进行完全匹配搜索,这等于告诉搜索引擎,结果返回的页面必须与双引号中的内容完全一致,这么做的好处有三:
(1)避免不必要的自动联想。譬如输入lifugui,数据库可能以为用户要查找的是人名“李富贵”,进而智能地反馈以李富贵为关键词的检索结果。
(2)避免随意变换字母顺序,产生新的排列组合。比如想检索World IntellectualProperty Organization,如果不加引号,默认是and的关系,字母顺序是可以调换的,World Property Intellectual Organization就可能作为检索结果被反馈回来。
(3)避免被任意添加关键词。比如输入Emma Watsons,如果不加引号,搜索引擎可能反馈的结果中就包含了Emma bought tissues in Watsons这样的句子。
但要注意,在搜索地名、人名、机构名称和其他专有名称的时候,尽量使用双引号精确检索,避免进行二次繁复的结果筛查。
2、后缀词(一)→Site:
锁定哪一家网站、哪一类网站、哪个地区的网站,不少人 认为仅凭“site:”这一招,就能将检索效率成倍提升~
(注意此处为英文半角冒号,如无特殊提醒,下文提及的“:“均为英文半角冒号)
格式:
A:site:gov 关键词
B:关键词 site:gov
主要用途:
(1)可用于限制网站类型,学术资料在edu、org中会更精练,政府相关的在gov中也许更容易找;
(2)有的网站没有提供站内搜索,或者它的信息结构混乱,内容又多,不方便站内检索;
(3)搜索死链接网站、已关闭网站内的信息。
使用方法:
用于搜索结果局限于某个具体网站或者频道上
举例:
输入:律师 site:edu.cn,可搜索得到在中文教育网站中涵盖有律师内容的页面
3、后缀词(二)→Inurl:
搜索网址里面含有特定内容的关键词资源
格式:
A:inurl:court
B:inurl:court 关键词
C:关键词 inurl:court
主要用途:
与site类似,但是查询结果比site更精确,同时可替代filetype的使用。
4、后缀词四→intitle
标题中检索,指的是返回的结果是标题中包含指定关键词的网页。
格式:
intitle:关键词
举例:
如果要检索“预期违约”相关文章,如果直接以“预期违约”作为关键词进行检索,很可能找到一篇谈及不相干话题的长达几万字的论文,而其中仅出现了一次“预期违约”。
如果用“intitle:预期违约”作为关键词检索,得到的结果是标题中含有“预期违约”四个字的网页,相关性和精确度将大大提高。
5、后缀词五→filetype:
搜索文件的后缀名或扩展名
格式:
关键词 filetype:doc/pdf
现在很多纸质版本的材料均被电子化,如何找到某一特定类型的电子版本材料是重要的检索技能。“filetype:”即为限定文件格式检索。
譬如“合同法filetype:ppt”即检索文件类型为ppt,包含关键词合同法的相关内容。
很多人会问,直接以“关键词.ppt”的形式检索与用“filetype:”命令检索有何不同?如有此疑问,不妨以“经销商合同.pdf”与“经销商合同 filetype:doc”分别检索,前者搜索引擎反馈的内容包括但不限于pdf格式的文件,epub格式txt格式也会出现在结果之中,后者搜索引擎反馈的结果有且只有pdf格式。
具体使用指引及图示举例,以及更多的后缀词使用,可查看《大数据时代3分钟完成法律检索?你需要这份<法律人最全、最常用的检索内容和工具汇总>》一文,在此不重复解析!