GOOGLE搜索从入门到精通  
GOOGLE搜索从入门到精通v3.0(注:本文提到的“英文字符”是指在输入法为英文的状态下所输入的字符) 11/2/2000
donquix@sina.com
donquix —————————————————————————————————— 内容 1,前言
2,摘要
3,如何使用本文
4,GOOGLE简介
5,搜索入门
6,初阶搜索
6.1,搜索结果要求包含两个及两个以上关键字
6.2,搜索结果要求不包含某些特定信息
6.3,搜索结果至少包含多个关键字中的任意一个
6.4,“+”、“-”和“OR”的混合查询
6.5,用“+”和“-”减少冗余信息
7,辅助搜索
7.1,通配符问题
7.2,关键字的字母大小写
7.3,搜索整个句子
7.4,搜索引擎忽略的字符和词汇
7.5,强制搜索
8,进阶搜索
8.1,对搜索的网站进行限制
8.2,查询某一类文件(往往带有同一扩展名)
8.3,搜索的关键字包含在URL链接中
8.4,搜索的关键字包含在网页标题中
9,其他罕用语法
9.1,搜索所有链接到某个URL地址的网页
9.2,查找与某个页面结构内容相似的页面
9.3,从GOOGLE服务器上缓存页面中查询信息
9.4,info
10,图片搜索
11,目录内搜索
12,新闻组(USENET)搜索
13,GOOGLE的其他杰出功能
13.1,集成化的工具条
13.2,单词英文解释
13.3,网页翻译
13.4,搜索结果过滤
14,搜索技巧之关键词选择初探
15,常用搜索个案
15.1,找人
15.2,找软件
15.3,找图片
15.4,找MP3
15.5,找书
16,GOOGLE搜索FAQ
17,后记 —————————————————————————————————— 1,前言 我是在2000年上半年知道GOOGLE的。在这之前,我搜索英文信息通常用AltaVista,而搜索中文信息则常用Sina。但自使用了GOOGLE之后,它便成为我的Favorite Searchengine了。这也得感谢新浪网友曹溪,因为当初正是因为他的大力推介,才使我识得了GOOGLE。 记得1996年夏季的时候,当我第一次接触Internet,便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真是妙不可言。在经历了疯狂的WWW冲浪和如痴如醉的BBS沉迷之后,我意识到Internet对我影响至深的还是在于学习方式的变迁。 如何来描述这种变迁呢?以前的学习,一般需要预先在肚子里存储下足够的知识,必要时,就从海量的信息中提取所需的部分。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,到了信息领域大大超出“四书五经”的新时期,预先无目的的吞下海量信息的学习方式就有些不合时宜了。比方说,我们到了大型的图书城,往往有一种不知所措的感觉。旧有的学习方式需要变更以适应这个信息爆炸的年代。目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。我不妨把这称为“即学式”,相应的,旧有的称为“预学式”。 不过,“即学式”的实施是有前提的。首先,要求学习者拥有一个包罗万象的信息库,以供随时抽取各种目的信息;其次,是需要一个强劲的信息检索工具,以便高效率的从信息库中提取信息。很明显,Internet可以充当那个海量的信息库,而搜索引擎,则正是寻找光明之火的绝好工具。 “公欲善其事,必先利其器”。Internet只有一个,而搜索引擎则有N多个。有搜索高手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。但是,对于普通人而言,掌握诸多搜索引擎的可能性似乎不大。用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人们所迫切希望。不同的时期,涌现出不同的强者。就目前而言,我们非常幸运的有了: *****GOOGLE***** 2,摘要 本文简要的介绍了GOOGLE的历史和特点,GOOGLE的基本搜索语法和高级搜索语法,GOOGLE的特色功能,包括图片搜索、新闻组搜索和集成工具条等,还简单的介绍了一些常用搜索技巧和实用个案。尽管本文名为“GOOGLE搜索从入门到精通”,但事实上,笔者对运用GOOGLE进行搜索也尚处于“入门”阶段。:) 3,如何使用本文 阅读本文最好具备一些最基本的布尔代数基础,如“与”、“或”、“非”等。不过,即便你没有这方面的知识,也不必在意。对那些实例进行练习,你的疑惑就会迎刃而解。对于刚刚接触网络搜索的读者而言,也许你应该从头到尾的阅读本文;但对于那些有一定搜索基础的读者而言,只需要跳跃着寻找自己所需要的信息就可以了。当然,如果你有一定的英文基础,也可以把本文与GOOGLE大全(http://www.google.com/about.html)参照阅读,那样效果会更好。 4,GOOGLE简介 Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。 GOOGLE的成功得益于其强大的功能和独到的特点: GOOGLE支持多达132种语言,包括简体中文和繁体中文;
GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE速度极快,据说有10000多台服务器,200多条T3级宽带; GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;
GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。 5,搜索入门 要用GOOGLE做搜索,当然首先要进GOOGLE网站–www.google.com;不过,163.com和yahoo.com.cn使用的实际上也是GOOGLE搜索引擎,只是对搜索结果进行了编排,但无法提供一些特色功能,如图片搜索等。 第一次进入GOOGLE,它会根据你的操作系统,确定语言界面。需要提醒的是,GOOGLE是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对GOOGLE界面进行个人设定了。 GOOGLE的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,要查找所有关于“易筋经”的中文网站和网页。在搜索框内输入一个关键字“易筋经”,然后点击下面的“google搜索”按钮(或者直接回车),结果就出来了。 搜索:“易筋经”
结果:已搜索有关易筋经的中文(简体)网页。 共约有5,930项查询结果,这是第1-10项 。 搜索用时0.12秒。 6,初阶搜索 在上例子中,你已经知道了最基本的搜索,即查询包含单个关键字的信息。现在,进一步探讨多个关键字以及关键字间不同逻辑关系的查询。 6.1,搜索结果要求包含两个及两个以上关键字 一般搜索引擎需要在多个关键字之间加上“+”,而GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。 示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。 共约有774项查询结果,这是第1-10项 。 搜索用时0.24秒。 注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。 6.2,搜索结果要求不包含某些特定信息 GOOGLE用减号“-”表示逻辑“非”操作。 示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 -吸星大法”
结果:已搜索有关易筋经 -吸星大法的中文(简体)网页。 共约有5,150项查询结果,这是第1-10项 。 搜索用时0.40秒。 注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 – 吸星大法”,搜索引擎将视为关键字为易筋经和吸星大法的逻辑“与”操作,中间的“-”被忽略。 6.3,搜索结果至少包含多个关键字中的任意一个 GOOGLE用大写的“OR”表示逻辑“或”操作。假定你是布兰妮和批头士的歌迷,现在要查找所有关于布兰妮和批头士的中文网页。 示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索:“Britney OR Beatles OR 布兰妮 OR 批头士”
结果:已搜索有关Britney OR Beatles OR 布兰妮 OR 批头士的中文(简体)网页。 共约有31,300项查询结果,这是第1-10项。 注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。 6.4,“+”、“-”和“OR”的混合查询 混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。如果只涉及“与”操作和“非”操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索的结果顺序会视关键字的顺序而定。单纯的“或”操作也同样道理。但是,如果“或”查询和其他两种查询混合在一起,问题就复杂了。现在我们做这样的查询:“所有关于Britney或者Beatles、但是没有Madonna相关信息的中文网页”。 搜索:“Britney OR Beatles -Madonna”
结果:已搜索有关Britney OR Beatles -Madonna的中文(简体)网页。 共约有16,200项查询结果,这是第1-10项。 搜索用时0.23秒。 搜索:“-Madonna Britney OR Beatles”
结果:已搜索有关-Madonna Britney OR Beatles的中文(简体)网页。 共约有16,200项查询结果,这是第1-10项。 搜索用时0.13秒。 搜索:“Britney -Madonna OR Beatles”
结果:找不到和您的查询-Britney -Madonna OR Beatles-相符的网页 搜索:“Britney OR -Madonna Beatles”
结果:找不到和您的查询-Britney OR -Madonna Beatles -相符的网页 可见,“或”操作的前后两个关键字必须是默认的“与”查询,否则,搜索引擎将无法完成搜索。 6.5,用“+”和“-”减少冗余信息 通常情况下,用一个关键字查询,会得到很多和查询目的不相关的冗余信息。我们总是希望,搜索结果的第一个条目中就包含所需要的信息。“+”和“-”很多时候就起到缩小搜索结果的范围,以提高查询结果命中率。 例:查阅天龙八部具体是哪八部。 分析:如果光用“天龙八部”做关键字,搜索结果有20,300项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。 1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字。“天龙八部 阿修罗”的搜索结果就只有1,050项,可以很快找到全部八部。 2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录。“天龙八部 佛教 -金庸”的查询结果为1,120项,可以迅速找到需要的资料。 7,辅助搜索 7.1,通配符问题 很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。GOOGLE不支持通配符,只能做精确查询,关键字中的“*”或者“?”会被忽略掉。 7.2,关键字的字母大小写 GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。 7.3,搜索整个句子 GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。 示例:搜索包含“long, long ago”字串的页面。
搜索:“"long long ago"”
结果:已搜索有关long long ago的中文(简体)网页。 共约有16,500项查询结果,这是第1-10项 。 搜索用时0.06秒。 。 7.4,搜索引擎忽略的字符和词汇 GOOGLE对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。 示例:搜索关于第一次世界大战的信息
搜索:“"worldwar i"”
结果:"i"使用过于频繁,没有被列入搜索范围。已向英特网搜索"worldwar i". 共约有7,370项查询结果,这是第1-10项。 搜索用时0.17秒。 7.5,强制搜索 如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。 示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索:“"+who +am +i"”
结果:已向英特网搜索"+who +am +i". 共约有332,000项查询结果,这是第1-10项 。 搜索用时3.68秒。 注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。 8,进阶搜索 上面已经探讨了GOOGLE的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。 8.1,对搜索的网站进行限制 “site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。 示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。 共约有1,730项查询结果,这是第1-10项 。 搜索用时0.23秒。 示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙 的中文(简体)网页。 共约有734项查询结果,这是第1-10项 。 搜索用时0.12秒。 示例:搜索新浪文教频道中关于鲁迅的信息。
搜索:“鲁迅 site:edu.sina.com.cn”
结果:已在edu.sina.com.cn搜索有关 鲁迅的中文(简体)网页。 共约有672项查询结果,这是第1-10项 。 搜索用时0.24秒。 注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。 8.2,查询某一类文件(往往带有同一扩展名) “filetype:”,这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。:) 最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前GOOGLE检索的PDF文档大约有2500万左右。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。 示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“ecommerce filetype:pdf”
结果:已向英特网搜索ecommerce filetype:pdf. 共约有25,500项查询结果,这是第91-100项 。 搜索用时0.44秒。 下面是某项搜索结果: [PDF] www.ecommerce.gov/apec
文档类型: PDF/Adobe Acrobat – 一般文字档
Page 1. A Partnership of the Business Community With APEC Economies E-COMMERCE
READINESS ASSESSMENT GUIDE www.ecommerce.gov/apec Page 2. …
www.ecommerce.gov/apec/docs/readiness_guide_files/readiness_guide_5.pdf – 类似网页 可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。 搜索PDF文档还可以用“inurl:”语法。比如上例,也可以用“inurl:pdf ecommerce”。搜索结果数量大致相同,不过查询结果顺序则略有很大差别。 注意,上述查询均是对PDF内文的检索,“ecommerce”这个关键字是包含在PDF文档中的。 “filetype”的另一个强大用处则在图片搜索。下文将对GOOGLE的图片搜索功能作详细说明,此处只是略提一下。进入“http://p_w_picpaths.google.com/”,查找关于本拉登的JPG图片。 搜索:“Bin Laden filetype:jpg”
结果:搜索有关 Bin Laden filetype:jpg 的图片()。(试验版) 共约有1,630项查询结果,这是第1-20项 。 搜索用时0.14秒。 除此之外,我尚未发现其他的filetype用法。如果有谁知道,请给我发邮件。预先感谢。:) 8.3,搜索的关键字包含在URL链接中 “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。 示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。 共约有16项查询结果,这是第1-10项 。 搜索用时0.16秒。 示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关inurl:security windows2000 的网页。 共约有188项查询结果,这是第1-10项。 搜索用时0.27秒。 注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。 “allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。 示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有37项查询结果,这是第1-10项 。搜索用时0.36秒。 8.4,搜索的关键字包含在网页标题中 “intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。 共约有465项查询结果,这是第1-10项 。 搜索用时0.16秒。 9,其他罕用语法 9.1,搜索所有链接到某个URL地址的网页 如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。 示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页 。 共约有856项查询结果,这是第1-10项 。 搜索用时0.17秒。 注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。 9.2,查找与某个页面结构内容相似的页面 “related”用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:wwwsina.com.cn/index.shtml”。 9.3,从GOOGLE服务器上缓存页面中查询信息 “cache”用来搜索GOOGLE服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。 示例:查找GOOGLE缓存的中文yahoo首页
搜索:“cache:www.yahoo.com.cn”
结果:这是 G o o g l e 内 http://cn.yahoo.com/ 的页库快照。
G o o g l e 已先预览各网站,拍下网页的快照存档。
这网页可能有更新的版本,请按此查看新版。 Google 和网页作者无关,不对网页的内容负责。
… 9.4,info info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。 示例:查找和新浪首页相关的一些资讯。
搜索:“info:www.sina.com.cn”
结果:有关www.sina.com.cn的网页信息。 新浪首页
北京站 上海站 广东站. … 首页, |, 新闻, |, 体育, |, 财经, |,
科技, |, 娱乐, |, 游戏, |, 军事, |, 健康, |, 教育, |, 汽车, |,
女性, |, 个人家园. …
简介: 位于北京的新闻中心,包括新闻与评论。
类别: World > Chinese Simplified > 新闻 Google 提供这个网址的信息: 查看Google网页快照里www.sina.com.cn的存档
寻找和www.sina.com.cn类似的网页
寻找网页有链接到www.sina.com.cn
寻找网页包含有"www.sina.com.cn" 10,图片搜索 我不得不承认,GOOGLE的图片搜索功能真是个伟大的发明!!GOOGLE自称可以检索320,000,000张图片,并称自己为“互联网上最好用的图像搜索工具”。尽管目前该功能尚在B测试阶段,但的确已经非常好用! GOOGLE首页点击“图像”链接就进入了GOOGLE的图像搜索界面“p_w_picpaths.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,就会搜索到大量的小甜甜布兰妮的图片。我目前尚不是很清楚图片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,然后才按照普通的页面搜索时的标准排列。 GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。 GOOGLE图像搜索目前支持的语法包括“+”,“-”,“OR”,“site”和“filetype”。 示例:查找美国教育网上的宇宙大爆炸jpg图片
搜索:“BIG BANG filetype:jpg site:edu”
结果:搜索有关 BIG BANG filetype:jpg site:edu 的图片()。(试验版) 共约有337项查询结果,这是第1-20项。 搜索用时1.99秒。 11,目录内搜索 如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“http://directory.google.com/”,中文目录是“http://directory.google.com/Top/World/Chinese_Simplified/”。 目前GOOGLE使用的分类目录采用了ODP的内容。“Open Directory Project”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行搜索往往能有更高的命中率。另外,GOOGLE根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。 示例:查找一下关于×××治疗以及护理方面的中文资料
搜索:先进入中文简体分类目录,再进入“健康”子目录,确定选中“只在健康中搜索”单选项目。在搜索栏内填入“×××”进行搜索。
结果:在分类健康项中搜索×××。 共约有370项查询结果,这是第1-10项 。 搜索用时0.05秒。 可以看到,上述查询结果比普通的检索更有效,因为在分类健康项中进行搜索剔除了很多不相关的诸如新闻之类的无效信息。不过,对于中文用户而言,现在最大的问题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。但愿这个问题能随着GOOGLE以及ODP项目在国内名声的响亮而能得到改观。 12,新闻组(USENET)搜索 新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。由于新闻组包含的信息实在是海量,因此不利用工具进行检索是不大可能的。DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。 进入GOOGLE新闻组“http://groups.google.com/”,你有两种信息查找方式。一种是一层层的点击进入特定主题讨论组,另一种则是直接搜索。现在,我们进行一个最简单的搜索试验,查找一下新闻组中关于山顶洞人的讨论信息。 搜索:“山顶洞人”
结果:在各群组内搜索 山顶洞人 共约有18项查询结果,这是第1-10项 。 搜索用时0.29秒。 搜索结果默认按照“留言内容”排列,但是你也可以点击“依照日期”按钮,让帖子按照发布日期排列。 因为新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语法,所以建议使用“高级群组搜寻”进入高级搜索界面。新闻组高级搜索提供留言内容、分类主题、标题、留言者、留言代码、语言和发布日期作为条件进行搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。 13,GOOGLE的其他杰出功能 13.1,集成化的工具条 为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。不过,GOOGLE工具条目前只支持IE5.0以上版本。 对于经常进行网络搜索者而言,GOOGLE工具条实在是必备的东西!! 13.2,单词英文解释 写英文文章的时候,最头疼的事情就是对某个英文单词的用法不确定。现在有了GOOGLE,一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法,均可使用在线词典。 进入英文GOOGLE,输入你要查的单词。举个例子,我想查一下suggest的用法。结果如下:“Searched the web for suggest. Results 1 – 10 of about 8,000,000. Search took 0.08 seconds. ”注意看上面句子中,单词suggest下出现了一个横线,点击这个链接,就跳转到另外一个网站“http://www.dictionary.com/”,GOOGLE已经把单词提交给该网站的查询脚本。看看这个网站所提供的详尽解释吧。:) 13.3,网页翻译 你懂英文,但是你不见得就懂德文、法文、拉丁文。如果搜索出来的页面是这些语言怎么办?呵呵,GOOGLE提供了网页翻译功能!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个杰出功能。 试着做以下搜索:“big bang site:fr”。这个表示查找关于宇宙大爆炸的法文网页。看第一条结果: The Big Bang Website – [ Translate this page ]
… A propos de Big Bang. Le dernier numéro en date. Les anciens numéros. Autres
activités. Concerts progressifs en France. Emissions de radio. Liens.
perso.club-internet.fr/calyx/bigbang/ – 3k – Cached – Similar pages 有点晕。没关系,点击“Translate this page”按钮。再看结果,嗯,大致能看明白,这原来是个叫“big bang”的乐队的网站,与大爆炸无关… 机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟专门用英语撰写的内容是不可能的。但西文间的互相转译比中英文机译强得多得多了。至少能看明白。 13.4,搜索结果过滤 网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。 14,搜索技巧之关键词选择初探 关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。 例一:查找《×××缘》一书中淑士国酒保的酸话原文。 分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。 搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是×××缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。…” 以上的关键字选择技巧可以谓之“特定词法”。 例二:“黄花闺女”一词中“黄花”是什么意思。 分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女
黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。 搜索:“黄花闺女 黄花
由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。 以上的关键字选择技巧可以谓之“近义词法”。 例三:刘德华同志的胸围是多少。 分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。 搜索:“刘德华 胸围
身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华胸围 身高 -阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。 以上的关键字选择技巧可以谓之“相关词法”。 15,常用搜索个案 15.1,找人 分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。 15.2,找软件 分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0
下载的中文(简体)网页。共约有6,670项查询结果,这是第1-10项。搜索用时0.22秒。 分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0
inurl:download的中文(简体)网页。共约有358项查询结果,这是第1-10项。搜索用时0.44秒。 在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了***,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。 共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial
number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第1-10项。搜索用时0.30秒。 15.3,找图片 除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。 分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“p_w_picpath”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurl:photo”
结果:已向英特网搜索"britney spears" inurl:photo. 共约有2,720项查询结果,这是第1-10项。搜索用时0.23秒。 分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第1-10项。搜索用时0.40秒。 分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第1-10项。搜索用时0.47秒。 15.4,找MP3 分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say
you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第1-10项。搜索用时0.17秒。 分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第1-10项。搜索用时0.73秒。 当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。 15.5,找书 分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。 分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德风车 桑乔”迅速找到该书。 16,GOOGLE搜索FAQ Q:如何全面的了解google.com?
A:查看网站相关页面“http://www.google.com/about.html”。 Q:如何切换google.com的初始语言界面?
A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你期望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。需要提醒的是,GOOGLE用cookie记录这个偏好,所以如果你把浏览器的cookie功能关掉,就无法进行设定。 Q:如何设定每页搜索结果显示数量?
A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果需要的时间越长,默认是10项。 Q:搜索到的链接无法打开怎么办?
A:链接无法打开的原因很多,比如网站当机,或者页面已经死掉等等,可以点击GOOGLE的“网页快照”查看在GOOGLE服务器上的网页缓存。不过,如果该页面是被当地ISP过滤的话,服务器缓存还是无法打开。唯一的办法在于利用代理服务器,然后在URL栏内输入链接的IP地址。 Q:打开搜索结果的链接,可是该页面太大,很难找到一下子找到目的资料怎么办?
A:直接打开“网页快照”,GOOGLE会把关键词用不同颜色标记出来,很容易找到。 Q:点击每个查询结果的时候,我想单独弹出窗口,这该怎么办?
A:进入“使用偏好”界面,注意底部有个“结果视窗”项目,选中“开启新视窗以显示查询结果”复选框然后存储设置就可以了。 17,后记 这个小文章的3.0版本终于更新完成,我终于可以吁口气了。写这个搜索普及文章的初衷和动力在于我以及我的朋友因为使用Internet搜索引擎而使得工作和学习变得更加轻松有趣,我想应该有更多的人来分享这种愉悦。需要提及的是,这个小文章的继续和更新,多亏了新浪网友“搜索引擎9238”的大力帮助和鼓励。如果没有他的热忱意见,我想此文会逊色的多了。其他提供过帮助和意见的网友就一并谢过了。希望你们能继续给出意见。 补充几点: 1、filetype: 现在已经可以搜索15种
http://www.google.com/help/faq_filetypes.html#what
文件格式,如果没有关联文件,可以按html格式浏览 2、site: 作者有误,可以使用诸如 site:www.microsoft.com linux 或
site:http://www.microsoft.com 的格式,但是对于虚拟域名无效。 3、词典功能。在引擎中填入任何一个字,点击结果中的那个关键字,google自动转到
www.dictionary.com 显示该字的解释。 (还有股票insc,地图map什么的没有什么用就不说了) 4、几个关于google的常识:
a、念 “哥儿狗”
b、yahoo
的搜索引擎买的就是google,如果google找不到,就别去yahoo了,也不要去网易。
c、google每月更新一次web 数据库,如果google找不到,去更新最勤的
www.alltheweb.com —— 9到12天,或许有收获。google的新闻组数据
库号称每天更新数次。 d、google的爬虫只爬到每个文档的前110k字节处就停止了,所以长文档里面的部分,
google会找不到。altavista 100k,all the web 90k。

转载于:https://blog.51cto.com/mzhang/184768