第三章 搜索引擎实验
第一节 使用搜索引擎进行网络信息的查询
实验目的
1.学会常用的搜索引擎的使用方法。
2.学会在网络上查询信息的方法。
实验内容
1.利用Google搜索“搜索引擎发展历史”的相关信息。
2.杂项语法。
3.进阶搜索。
实验步骤
1.利用Google搜索“搜索引擎发展历史”的相关信息。
(1)搜索入门:搜索包含单个关键字的信息。
实验:打开http://www.google.com或http://www.baidu.com。
搜索:“搜索引擎”,见图3-1。

图3-1
结果:已搜索有关搜索引擎的中文(简体)网页。共约有12400000项查询结果。仔细看一下搜索结果的前十项,就会发现绝大部分链接是搜索引擎本身。
单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,我们需要进一步缩小搜索范围和结果。
(2)初阶搜索:搜索结果要求包含两个及两个以上关键字。一般搜索引擎需要在多个关键字之间加上空格(后文表述用“□”表示),而Google无需用明文的“and”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。
实验:搜索所有包含关键词“搜索引擎”和“历史”的中文网页。
搜索:“搜索引擎□历史”,见图3-2。

图3-2
结果分析:已搜索有关搜索引擎历史的中文(简体)网页。共约有62800000项查询结果。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。
删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。
(3)搜索结果要求不包含某些特定信息。Google用减号“-”表示逻辑“非”操作。“A□? B”表示搜索包含A但没有B的网页。
实验:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页。
搜索:“搜索引擎□历史□-文化□-中国历史□-世界历史”,见图3-3。

图3-3
结果分析:已搜索有关“搜索引擎历史-文化-中国历史-世界历史”的中文(简体)网页。共约有39800000项查询结果。
我们看到,通过去掉不相关信息,搜索结果又减少了将近一半。第一个搜索结果是:“中文Google搜索引擎使用方法≡Google从入门到精通”。点击进入,发现内容非常符合搜索要求。另外,第二项搜索结果是:“七大搜索引擎的历史与名称的由来”,也符合搜索要求。
注意:这里的空格“□”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间不能有空格。比如“搜索引擎□-□文化”,搜索引擎将视关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。
(4)搜索结果至少包含多个关键字中的任意一个。Google用大写的“OR”表示逻辑“或”操作。搜索“A□OR□B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。
Baidu、Archie、蜘蛛、Lycos、Yahoo等都是有关搜索引擎或搜索引擎技术。要搜索有关搜索引擎的历史。在上例中,我们希望搜索结果中最好含有“Archie”、“Lycos”、“Baidu”等关键字中的一个或者几个,这样可以进一步地精简搜索结果。
实验:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中任何一个或者多个:“Archie”、“Baidu”、“Lycos”、“Yahoo”。
搜索:“搜索引擎□历史□Archie□OR□Baidu□OR□Lycos□OR□Yahoo□-文化”,见图3-4。

图3-4
结果:已搜索有关“搜索引擎□历史□Archie□OR□Baidu□OR□Lycos□OR□Yahoo□-文化”的中文(简体)网页。共约有1400000项查询结果,这是第1~10项。我们看到,搜索结果缩减了很多,前20项结果中,大部分都符合搜索要求。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
2.杂项语法。
(1)通配符问题。很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支“持有限。它目前只可以用“*”来替代单个字符,而且包含*”必须用""引起来。比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。
(2)关键字的字母大小写。Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
(3)搜索整个短语或者句子。Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。
实验:搜索关于第一次世界大战的英文信息。
搜索:“world□war□I”,见图3-5。

图3-5
(4)搜索引擎忽略的字符以及强制搜索。Google对一些网络上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
实验:搜索关于www起源的一些历史资料。
搜索:“www的历史□internet”,见图3-6。

图3-6
结果:搜索“www的历史□internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里顺便说一点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
搜索:“+www+的历史□internet”,见图3-7。

图3-7
结果:关键字中已看到www。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“"world war I"”中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
搜索:“"www的历史"internet”,见图3-8。

图3-8
我们看到,这一搜索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。
注意:大部分常用英文符号(如问号、句号、逗号等)无法成为搜索关键字,加强制也不行。
3.进阶搜索。
上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。
(1)对搜索的网站进行限制。“site表示搜索结果局限于某个具体网站或者网站频道,如“www.sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。
实验:搜索中文教育科研网站(edu.cn)上关于搜索引擎技巧的页面。
搜索:“搜索引擎□技巧□site:edu.cn,见图3-9。

图3-9
实验:搜索新浪科技频道中关于搜索引擎技巧的信息。
搜索:“搜索引擎□技巧□site: tech.sina.com.cn,见图3-10。

图3-10
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
(2)在某一类文件中查找信息。“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档(如.xls、.ppt、.doc, .rtf)、WordPerfect文档、Lotus1-3文档、Adobe的.pdf文档、Shock Wave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是Adobe公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
实验:搜索几个资产负债表的Office文档并且文档扩展名为.doc或者.xls。
因为资产负债表的Office文档主要的文档有Word、Excel、PPT。所以,搜索:“资产负债表□filetype:doc□OR□filetype:xls□OR□filetype:ppt”,见图3-11。

图3-11
实验习题
1以“三峡旅游”为关键词,用以下搜索引擎查找,列出查找结果的前三项,并点击查看链接是否可用,填写表3-1。
表3-1

2.练习搜索引擎的常用技巧,填写表3-2。
表3-2

3.搜索“电子商务的发展历程”。
4.搜索“几篇网络营销的论文”,并且为PDF格式的文档。
相关案例
搜索引擎推广具体实施方案
1.背景
2012年2月,常州常衡精工自动化设备有限公司在原有网站基础上进行全面设计,修改了主页并更新了许多产品及网页内容。为了更好地推广网站,网络营销部进行了大量的调研,最终选择了以搜索引擎推广为主,网络实名、网上信息发布、论坛广告等为辅的网络推广策略。本方案是在此基础上提出的。
2.认识搜素引擎
许多企业简单地认为建了网站就是信息化,就可以做电子商务了,其实这是一种误解。这是因为做了网站只是表明企业在浩如烟海的网络中有了一席之地,除了知道网站的客户能访问,其他消费者不可能在数以亿计的网络中寻找到你的网站。因此网站需要推广才有访问,需要访问才能带来客户。而搜索引擎,是网站推广最廉价,最高效的方式。
请看以下权威系统数据。
(1)根据CNNIC2010年7月的调查:51.3%的中国互联网用户经常使用搜索引擎,57.5%的中国互联网用户得知新网站的主要途径是搜索引擎。
(2)根据JUPITER MEDIA METRIX于2010年7月底的统计,47%的消费者通过搜索引擎来寻找和购买在线产品。
消费者在线购买时寻找产品的方法和比例是:在搜索引擎中输入产品名28%;直接访问网上商店网址23%;在搜索引擎中输入商标名9%;在搜索引擎中输入商店名5%;访问搜索引擎的购物频道5%。
(3)根据Georgia技术研究院做的调查:80%准备购买物品的顾客使用搜索引擎来找到他们要的产品。
从搜索引擎来的访问者,新用户比例很高,而且所有访问者均具有极强的针对性,他们是主动找上你的网站的,所以他们对商业网站的价值也特别高。
3.搜素引擎排名的重要性
从上面的叙述我们了解了公司网站登录搜索引擎的重要性,但是,网站只要登录搜索引擎就万事大吉了吗?
我们在网上进行搜索引擎搜索的时候,都有过这样的经历,当我们在某一搜索引擎中输入我们想要查找的内容,反馈结果却告诉我们有10000条相关信息,我们查看哪一条?通常我们都只查看排在前面的10条或20条,却无意间忽略了第21条至第10000条的信息,其中不乏有价值的内容。
回过来说,当我们的网站排在搜索结果的第21条至第10000条中(很有可能)。这种登录对我们的网站还有意义吗?低的排名还不仅仅是公司站点访问量的流失,更为严重的是,在公司网页检索排名之前的检索结果信息,都可被视为我们的竞争对手。由于公司的排名落在竞争对手之后,访问者首先访问的是公司的竞争对手,如果访问者对我们竞争对手的站点满意,就不会再访问我们的站点了。
统计结果表明:65%~70%的网民点击搜索结果的第一页即前10条;20%~25%的网民点击搜索结果的第三页即第11~20条;3%~4%的网民点击量被其他所有的,可能是成千上万的搜索结果分享。所以,为了使网站发挥最大效果,公司的网站排名必须在前20位,越前越好。
4.常见的网络搜素引擎推广服务
(1)搜索引擎普通登录服务。将公司的网站登录到新浪、搜狐、网易三大知名门户网站中,关键字不超过30个字。不保证排名,按照搜索引擎算法自动排名,不保证可以在第一页显示,可以优先排列在免费登录的网站前面。
(2)搜索引擎推广登录服务。推广型登录保证公司的网站出现在著名搜索引擎搜索结果的第一页,并用显著的标志加以区分,吸引目标客户有效点击。可选择两个关键字。
(3)搜索引擎竞价排名服务。“竞价排名”是指由用户(通常为企业)为自己的网站或产品网页出资购买关键字排名,通过竞价排名服务提供商发布到国内主流搜索引擎前列的一种服务。这是一种按点击计费的一种服务。通过竞价排名,搜索结果的顺序将根据用户出价的多少由高到低排列,同时奉行不点击不收费的原则。
搜索引擎竞价排名服务可将公司的网站排在百度搜索结果前列,同时出现在中文雅虎、搜狐、网易、Lycos中国、21CN、广州视窗、Tom.com、上海热线、163.net、腾讯等主要中文门户网站搜索引擎搜索结果的最前列(目前共有三十六大国内著名搜索引擎或门户网站及地方门户站点)。
竞价排名有5个特点:搜索排名自己定,公司的网站在搜索引擎的排名位置由你自己决定;网站描述任你写,网站标题、内容描述及搜索关键词由我们随心所欲制定;不点击不收费,按你网站的实际被点击量计费,每次点击起价仅0.30元;预付金超低,预付金最低只需300元;完善的客户服务,提供详细的访问统计报告。
(4)价比分析,如表3-3所示。
表3-3

从上面的表格可以看出,竞价排名是按照带来潜在客户的访问数量计费,而不是按照使用时间长短来计费,公司可以根据需要,灵活控制推广力度和投入。你可以注册大量产品关键字(产品服务的具体名称),使介绍你产品的网页出现在相应搜索结果最明显的位置,让那些真正对你产品感兴趣的人直接访问你的网站。
因此,我们认为竞价排名服务是企业网站搜索引擎推广的最好方式。
5.具体实施
(1)投入预算。根据与网络公司反复谈判,最终达成包年制竞价排名服务,我公司一年投入4000元。网络公司保证我公司有十五个关键词在百度竞价排名第一页。其中由于干燥、干燥设备价格较高,我公司不要求排名,只要求登录。不包括在十五个关键词内。
(2)关键字选择。目前,干燥设备企业选择竞价排名服务的比较多,因此如“干燥设备、干燥、干燥机”等关键词的价格现在都比较高,而具体的产品名称关键字如“喷雾干燥设备、旋转闪蒸干燥机”等关键的价格都比较低。但是,我们可以这样分析:干燥设备是面向制药、化工、食品加工等行业的高科技产品,在这些行业中的潜在客户完全清楚他需要的干燥类设备的具体名称或是型号,因此他们在通过搜索引擎寻找干燥设备供应商时会直接输入相关产品的名称关键字,如“干法辊压造粒机、气流干燥机”等,因此,我们在选择关键词时,应该综合考虑关键词的价格和可能带来的效益来灵活制定出价。
因此,我们建议关键词的选择及名次按如下表格实施,如表3-4所示。
表3-4

(3)后期维护管理。当公司正式开通网站搜索引擎推广服务后,网络营销部将密切关注排名情况,要求网络公司每两个星期提供一次客户点击统计报告一份。同时网络营销部将随时关注网站反馈情况,及时提交相关情况给相关部门。
(案例资料来源:www.yingxiao.net/wen/list/125.html)