求职简历网 > 知识 >

谷歌中文搜索

来源:求职简历网时间:2024-04-07 15:28:31编辑:皮带君

谷歌浏览器怎样设置翻译成中文网页

1、首先打开电脑上的“谷歌浏览器”,浏览器主界面如下图所示。 2、在搜索框输入一个英文网站的网址,打开英文网页如下所示。 3、接着在界面上点击右键,可以看到“翻成中文(简体)”按钮。 4、点击按钮翻译之后,英文网站就变成中文了,如下图所示。 5、下面点击界面右上方箭头处的按钮,找到“设置”选项。 6、点击进入浏览器的设置界面,下拉之后可以看到“高级”。7、接着点击“高级”按钮,进入浏览器的高级设置界面。 8、找到“语言”按钮,点击后出现的界面如下图所示。 9、点击“询问是否翻译非您所用语言的网页”右边的按钮,开启此功能。10、结果如图所示。

chrome浏览器怎么设置成中文

1、首先需要点击chrome右上角的三个点,找到设置选项。
/iknow-pic.cdn.bcebos.com/6a600c338744ebf8d5303c07d6f9d72a6059a741"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/6a600c338744ebf8d5303c07d6f9d72a6059a741?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/6a600c338744ebf8d5303c07d6f9d72a6059a741"/>
2、点击设置,进入到设置页面。直接拉到最底层,点击高级设置。
/iknow-pic.cdn.bcebos.com/64380cd7912397dd4c09c23c5682b2b7d0a28792"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/64380cd7912397dd4c09c23c5682b2b7d0a28792?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/64380cd7912397dd4c09c23c5682b2b7d0a28792"/>
3、复制高级设置下的所有单词到翻译网页,找到“语言”鼠标放上去,查看对应的单词是哪个。
/iknow-pic.cdn.bcebos.com/79f0f736afc37931772bde11e4c4b74543a91142"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/79f0f736afc37931772bde11e4c4b74543a91142?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/79f0f736afc37931772bde11e4c4b74543a91142"/>
4、回到设置页,点击语言项后面的下拉框。
/iknow-pic.cdn.bcebos.com/dc54564e9258d1099406f38ade58ccbf6c814d24"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/dc54564e9258d1099406f38ade58ccbf6c814d24?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/dc54564e9258d1099406f38ade58ccbf6c814d24"/>
5、然后需要点击添加语言。
/iknow-pic.cdn.bcebos.com/aa18972bd40735fa8216148191510fb30f240827"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/aa18972bd40735fa8216148191510fb30f240827?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/aa18972bd40735fa8216148191510fb30f240827"/>
6、然后需要勾选中文简体,点击右下角的确定选项。
/iknow-pic.cdn.bcebos.com/4a36acaf2edda3cc80a6e0180ee93901213f924c"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/4a36acaf2edda3cc80a6e0180ee93901213f924c?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/4a36acaf2edda3cc80a6e0180ee93901213f924c"/>
7、然后需要点击刚添加到中文后面的三个点。
/iknow-pic.cdn.bcebos.com/f636afc379310a55cd9986ccb84543a98226104c"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/f636afc379310a55cd9986ccb84543a98226104c?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/f636afc379310a55cd9986ccb84543a98226104c"/>
8、勾选第一个选项,就都变成中文了。
/iknow-pic.cdn.bcebos.com/b64543a98226cffc9cbfe58ab6014a90f603ea75"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/b64543a98226cffc9cbfe58ab6014a90f603ea75?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/b64543a98226cffc9cbfe58ab6014a90f603ea75"/>


我是怎么用Google找关键词

用谷歌找关键词,是目前我们外贸人事常用的工具。但如何用,怎么用?对于很多外贸新人来说,是很陌生的。在这里我为大家提供一种用Google快捷找关键词的方法。
第一步:打开谷歌的翻译网页,链接如下:
http://translate.google.cn/?hl=zh-CN&tab=wT#en/pt/
第一页

第二步:点击右下角“全球商机洞察”,进入页面。链接如下:
http://translate.google.com/globalmarketfinder/index.html?locale=zh-CN 第二页

第三步:打开后,大家可以按照提示输入自己公司主打产品关键词,选择国家和语言,输入验证码,确定后就可以看到该国家语言的关键词,点击更多,就是那个加号,可以看到更多关键词,链接如下:
http://translate.google.com/globalmarketfinder/index.html?locale=zh-CN
如我选择语言是“中文”,关键词是“路由器”,页面如下:
第三页

1、第一步是选择语言的,可以根据自己的能力来选择。选择什么语言,整个页面就出现什么语言。
2、第二步我就不说了,大家看文字提示就知道了。
3、第三步选择的语言关系到第四步的关键词的。如:我选择的语言是中文,关键词就是用中文书写的,其他语言也如此。
4、第五步是选择地区,如:欧洲、亚洲、大洋洲、欧盟、美洲等地区。


Google和百度的优缺点各是什么?世界最好的搜寻引擎是什么?

Google和百度的优缺点各是什么?世界最好的搜寻引擎是什么? 最好的搜寻引擎百度,中国国内使用率95以上。 优势 Google是技术驱动的科技平台,所以需要大批一流人才,“自己想怎么被管理就怎么管理这些天才”的精神招揽最棒的人。Google的决策是科学化,网际网路化,参考真实资料后才做判断的。如果微软是航空母舰,则Google是快艇,能利用小团队+实时反馈+主人翁感打造和创业公司一样快的产品更新和创新。 劣势 Google最大的挑战是它有“最容易作恶”的最大、最有价值的资料,却有“绝不作恶”的承诺。它能够束缚自己的手脚,不被大资料诱惑吗?如果别的公司都会动用,它能忍住不用吗?如果一旦用了,它的“不作恶”理想把自己放上了神坛,它会被攻击的更严重的(一个小小的“动用”,别的公司没事,Google会被认为是违背了承诺和价值观)。我认为把自己放上神坛的公司使命是非常危险的。 Google是个理想主义的公司。 没有柔性的 *** 关系是危险的。Google碰上的垄断问题,是有可能牵累整个公司的(微软就是为了处理垄断调查,最后公司疲累不堪,为了不触犯法律,谨慎到流程变缓)。另外,Google自认为是个科技为核心的公司,所以希望不断地在各个领域带来颠覆。但是,在矽谷其实颠覆者都是小公司。所以Google会不会还没有颠覆别的领域。 百度优势 1.覆盖面广。 覆盖百分之九十五中国网民 全球最大的中文网站 覆盖138个国家 每天响应数亿次搜寻请求 2.按效果计费 完全按照给企业带来的潜在客户点选计费,没有点选不计费。 3。针对性强,轻松锁定目标客户。 百度推广帮助准确锁定目标客户,针对性强,投资回报更高。 通过关键词锁定有需求客户: 选择希望推广的关键词,客户的推广资讯就会出现在消费者面前。 通过地域筛选,时间筛选,帮客户锁定消费者。 将推广资讯按设定的地域,时间进行投放,精确覆盖特定地区、特定时间段的潜在客户。 缺点 百度的这个技术漏洞其实很低阶,就是在短时间内提交大量搜寻申请,百度并不拒绝这种非正常搜寻,而恰恰相反,百度反而会把这些搜寻关键字当做正常搜寻而进行词汇频度计算,并且根据这种词汇频度计算,在搜寻页面下方给出相关搜寻词汇。这种低阶错误Google是坚决杜绝的,而百度的技术能力有限,对于搜寻频率的真实、有效性缺乏技术措施,即使同一个IP地址,用上一分种时间连续重新整理关键词页面几百次,百度也会认为这个关键词是热门关键词。 验证这个缺陷非常简单,随便一个人都可以编写一个回圈访问指定网页功能的程式,那么通过这个程式就可以大量搜寻某一个指定的关键字,然后,百度搜索类似的关键字时候,所刷的关键字就会出现在“相关搜寻”栏目,要是刷的次数足够多,那么还可以上百度中文搜寻风云榜呢。 百度和google两个搜寻引擎各有什么优缺点 百度是中国的网站,是世界上最大的中文搜寻; 另外一个是鬼子的网站,这个搜寻基本上搜不到钓 鱼 岛的东西, 但是却能搜到尖 阁 列 岛(钓 鱼 岛鬼子的叫法),所以要抵 制这个垃圾搜寻!!!! 百度和Google两个搜寻引擎的优缺点有哪些? Google:全球最大的搜寻引擎,alexa排名第二,如果搜寻国外的资讯,那么它是首先,如果企业的主要目标客户在国外,那么,选择google;缺点:百度:商业味太重,你搜索的关键字的首页基本都被竞价排名出价高的企业占据了,很难找到你需要的真正自然搜寻的结果,百度的搜寻排名技术不够权威; google:操作过于复杂,偏好选择,语言选择,等等,太麻烦! 最好的搜寻引擎是什么? 国内用百度,国外用谷歌 世界上最好的搜寻引擎是什么? 就英文搜寻而言 Google最好 Yahoo其次 就中文搜寻而言 Baidu最好 其实各有所长,各取所需了 Google是世界上最好的搜寻引擎吗? 被全世界公认为是地 中国还是百度 Excite搜寻引擎的特色及优缺点 Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对网际网路上的大量资讯作更有效的检索。到1993年中,这已是一个完全投资专案Architext,他们还发布了一个供webmasters在自己网站上使用的搜寻软体版本,后来被叫做Excite for Web Servers。(注:Excite后来曾以概念搜寻闻名,2002年5月,被Infospace收购的Excite停止自己的搜寻引擎,改用元搜寻引擎Dogpile) 1994年1月,第一个既可搜寻又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜寻,它还支援Gopher和Tel搜寻。 搜寻引擎的发展和应用,确实给人们的工作、学习和生活带来很大的方便,但目前的搜寻引擎仍然存在不少的局限性。概括起来主要表现在三个方面: 其一是资讯丢失。一般来说,目录式的搜寻引擎由于目录只在对站点的描述中进行搜寻,因此站点本身的动态变化不会反映到搜寻结果中来,对网站的描述也十分简略,其描述能力不能深入网站的内部细节,因此使用者不能查询网站内部的重要资讯,造成了资讯丢失。 其二是返回资讯太多。基于机器人的搜寻引擎由于应用了全文检索技术,能够解决对网页细节的检索问题。从理论上说,只要网页上出现了某个关键词,就能够使用全文检索用关键词匹配把该网页查出来,但是这又导致了它的缺陷——返回的资讯太多。 其三是资讯无关。返回资讯过多只是全文检索给人直观感觉到的问题。除此之外,它还有两个不很直观的深层次问题也给资讯检索带来了不少困难。 造成上述资讯检索困难的原因的实质在于搜寻引擎对要检索的资讯仅仅采用机械的关键词匹配来实现,缺乏知识处理能力和理解能力,也就是说搜寻引擎无法处理在使用者看来是非常普通的常识性知识,更不能处理随使用者不同而变化的个性化知识、随地域不同而变化的区域性知识以及随领域不同而变化的专业性知识等等。因此,结合人工智慧技术的智慧搜寻引擎把资讯检索从目前基于关键词层面提高到基于知识(或概念)层面,是解决问题的根本和关键。但真正“智慧化”和“个性化”的搜寻技术还仍在人们的期待之中。 所以,朋友您提出问题正是搜寻引擎研发人员正在努力解决的问题。 中国最好的搜寻引擎是什么 国内的搜寻引擎有百度,搜搜,搜狗,有道,360,谷歌,雅虎,必应等。 毋庸置疑的是百度占据的市场最多,影响力也是最大的。 因此百度可以说算是国内的最好的搜寻引擎。 但是谷歌的技术也是非常强大的,走到了百度前面,可以算是世界第一。 百度是最好的搜寻引擎么? 是最好的中文引擎。 百度,更懂中文。 以前是谷歌 现在就是百度了


google是传统意义上的搜索引擎吗?

是的。Google是由Google公司推出的一个互联网搜索引擎,它是互联网上最大、影响最广泛的搜索引擎的首位。 Google每日透过不同的服务,处理来自世界各地超过2亿次的查询。除了搜索网页外,Google亦提供搜索图像、新闻组、新闻网页、影片的服务。2005年6月,Google已储存超过80亿的网页,1亿3千万张图片,以及超过1亿的新闻组讯息 - 总计大概10亿4千万个项目。它也缓存了编入索引中的绝大多数网页的内容。

我不小心将Google网址语言改成日文,怎么改回成中文呢?

可以在谷歌搜索网站的语言设置中将网站语言改成中文。1、打开谷歌搜索官网,点击网站右下角上的“设定”按钮:2、在展开的菜单中点击最上面的“检索设定”按钮进入设置界面:3、点击页面左右的“言语”按钮进入语言设置界面:4、将言语选择为“中文(简体)”,然后点击“保存”按钮,这时谷歌网站的语言就会从日文改回成中文:

GOOGLE搜索对比百度的优势

百度,这个自称是全球最大的中文搜索引擎,经过这几年来的发展,在中国的市场占有率已经超过了Google,独占国内搜索流量的第一名。作为中国最大的搜索引擎的百度,目前的确非常风光,在业界被千万光环所笼罩,但是它真的值得用户信赖和尊敬吗?百度是如何对待自己的产品,如何对待自己的用户呢?让我们一起来看一个真实的百度。

模仿抄袭

从百度成立的第一天起,百度就和抄袭结下了不解之缘,百度抄袭最多的产品当然是Google搜索引擎,从外观上看,百度整个网站的风格和Google如出一辙。当然,百度的抄袭不仅仅是界面这种低级的抄袭,更高级的抄袭是在搜索引擎的底层技术进行抄袭。Google搜索的技术核心是PageRank专利技术,通过对网页的链接进行计算而对网页的重要性做出客观的评价,而百度核心技术竟然和Google类似,也是通过超链分析产生不同的搜索结果。当然,对于这个问题百度也有自己的说法,百度总裁李彦宏就曾经在接受Forbes采访时宣称Google始创于1998年的PageRank技术专利为其持有,Google抄袭了百度的 PageRank技术云云。

当然,百度的抄袭绝不仅仅如此,百度的发展史简直就是一部抄袭的历史,几乎所有Google的产品,只要百度有能力抄袭的产品,它就会不遗余力地进行抄袭。Google出了“地图服务”后,Baidu也推出“百度地图”,Google推出“桌面搜索”,Baidu就出“百度硬盘搜索”,Google出“工具栏”,Baidu也出“搜霸工具栏”,Google推出“新闻快讯订阅”,百度也出“邮件新闻订阅”,Google推出“Google Answers”,百度也出“百度知道”,Google推出“AdSense”,百度就出“百度主题推广”。当然,百度也有自己的说法,百度声称自己并不是简单模仿Google的所作所为,对于Google的一些奇怪的产品,百度是不会模仿的。

Google的精髓在于创新,每推出一个新产品都在市场、客户的前期需求方面做了大量调查工作,百度这种“拿来主义”的工作方式,的确为自己节省了大量的市场调研费用。但是令人质疑的是,一个企业如果自己产品的大部分功能都只能抄袭自竞争对手,那么它是否会有自己的发展前途呢?

竞价排名

竞价排名是百度模仿Google AdWords做的一种按效果付费的网络推广方式,是百度的主要盈利方式,但是其显示方式和Google AdWords有很大不同。用户在Google中搜索出来的结果中,赞助商链接位于页面顶部和右侧,用户们可以清楚地区分哪些是正常的搜索结果,哪些是赞助商们花钱买的位置。百度不仅仅在搜索结果的右侧有赞助商链接,在正常搜索结果的左侧链接也有赞助商广告,这些广告链接和真实搜索结果混杂在一起,很难区分,如果一个广告用户出的钱足够高,那么其广告链接会排在搜索结果的第一名,这样的处理,使得用户的搜索体验非常糟糕。由于遭到广泛的批评,百度搜索内容的广告最近有所减少,但是搜索结果第一页经常大部分或者全部是广告。

流氓软件

百度为了获得更大的流量,开发了一个颇有争议的流氓软件-百度超级搜霸,百度公司称其能使用户的搜索更加方便,并且远离网页广告困扰。但有大量用户投诉百度超级搜霸强制安装、难以卸载,在不少论坛中,如何卸载百度超级搜霸插件经常成为热门话题,在2005年北京网络行业协会设立的“流氓软件”网络调查中,百度超级搜霸成为“流氓软件”排行榜前十名,并被限令整改。然而可笑的是,2006年的3月15日,百度居然贼喊捉贼,自己开通超级搜霸315举报网站。

侵犯版权

百度对于知识产权的保护是比较漠视的,百度自身的很多服务在国际公认的法律中是违法的。例如颇受争议的百度MP3搜索提供在线播放和下载音乐MP3服务,一些唱片公司认为百度的这种服务侵犯了唱片公司信息网络传播权,给唱片公司造成了经济损失,为盗版提供了便利。早期曾有多家唱片公司在北京的法院起诉百度,虽然百度无一胜诉,但是法院裁决百度赔偿的金额却非常少,实际上起到了纵容百度继续侵权的效果。国际上公认提供MP3下载是非法的,典型的案例是在台湾提供音乐下载的Kuro网站负责人被判入狱三年并罚款,Google等搜索引擎在各国皆不提供有争议的MP3搜索。

百度最近开通的另一项服务-百度百科,更集中了百度的两大看家法宝-“抄袭”和“侵权”于一身,肆无忌惮地进行大规模地侵犯知识产权的行为,在百度百科上找到一条原创的条目如大海捞针般的困难,百度百科开通才两个星期,其条目数就超过了中文维基百科几年来的条目总和。而目前我们国家在著作权等法律上的漏洞,以及早先在音乐侵权案件上的低额罚款,使得百度在侵权方面有了更足的底气,在侵权的力度上也更加肆无忌惮(不过某些针对国外的服务有特殊处理)。

技术落后

在技术层面,做为搜索引擎最基本的技术-收录页面的技术,我们发现百度收录网站页面的技术相比Google来说是有很大缺陷的,这在我另外一篇文章:《Google和百度收录网站页面的比较》中有很详细的说明。百度的收录网页的机制使得作弊的垃圾网站更容易被收录,客观上使得原创的有特色的网站被边缘化,当垃圾站横行的时候,百度必需投入巨大的精力来封杀作弊的垃圾网站,误封正常网站的情况比比皆是,对于被封的大流量网站,一些百度的业务员威胁网站站长办理百度竞价排名,导致百度和大量站长都结有恩怨,越来越多的人开始咒骂百度。

冒充民族企业

百度在对外宣传上,张口闭口都说自己是所谓的“民族企业”,比Google等国外公司“更懂中文”,并打着所谓“爱国”的旗号,说反百度就是反对中国的民族产业,支持Google就是卖国云云。

然而,百度真的是中国公司吗?事实是:百度公司注册于英属开曼群岛,百度的创始人李彦宏持有美国绿卡,百度启动的资金是美国的风险投资,现在美资在百度中占有51%以上的份额,百度在中国注册全资子公司的目的可能是为了规避中国政府的关于外资不能进入新闻广告等领域的法规。因此,百度准确的说应该是一家由华人创办的、专注于在华业务的美资搜索引擎技术公司。

同行恶意竞争

百度对于同行的恶意竞争的手段可谓层出不穷。在百度赶超Google的过程中,在2002年9月发生了一起中国封杀Google的事件,导致中国大陆地区无法访问Google网站,后来因为各地用户强烈反对,Google又被解封,但Google的网页快照功能至今都无法正常使用,据传闻称封杀限制Google前后均由百度在幕后操作。

另外一起著名的事件是8848被百度攻击案,事件的起因是2004年12月,8848向互联网用户提供一个名为“搜索助手”(MySearch)的流氓软件,8848称该软件能帮助网友更方便搜索网页,然而网民发现安装该软件后,使用百度进行搜索,原有的搜索结果页面会被修改,并出现8848所插入的广告、图片等链接。8848的这种行为当然是典型的流氓作风,然而百度的后续做法却同样令人无法认同。在2005年1月21日,8848网站发现百度采用分布式拒绝服务攻击(DDOS攻击)的手段,借助几千家百度搜索联盟网站的巨大访问量集中攻击8848的服务器,使8848网站无法被正常访问至少长达26 小时,导致网上商城的商户无法正常销售、支付和结算收款。这简直成了流氓集团间的混战了。

以上是我总结出的百度在这些年出现的种种问题,这些问题也许还是中国IT行业中不少公司所面临的通病,急功近利、唯利是图、丧失诚信、同行之间恶意竞争等等,我们衷心地希望百度公司能够正确地面对自己的错误,勇敢地进行改正,而不是百般狡辩、抵赖、回避。如果百度还是执迷不悟,依旧这样对待自己的用户,那么最终百度必定会被自己地用户所唾弃。

注:我写本文的直接原因,是因为前几天看到有人在为百度摇旗呐喊地攻击Google。

更新:关于PageRank的专利到底属于谁,KESO在美国专利和商标局网站上查询到,Lawrence Page(即Larry Page)共有两项专利被批准,其中于1998年1月9日提交的PageRank的专利申请(PDF文件下载),于2001年9月4日被批准,美国专利号6,285,999。Li Yanhong有也有相关专利,美国专利号:5,920,859。专利提交日期为1997年2月5日,批准日期为1999年7月6日。这项专利是关于超文本文档检索系统和方法(Hypertext document retrieval system and method)。相关专家可以来分析两个专利的相似性。


百度和Google的搜索算法,技术有何差异

百度是中国的,谷歌是美国的。各有侧重不能不可比较。技术都是一样的侧重不同罢了。百度侧重的是中国民俗,谷歌是侧重美国民俗。因为国情国法不同所以无可能比较量级。【搜索引擎技术是硬件加软件。硬件是实际使用的机器,软件是程序编程】搜索产品搜索引擎产品其实包括很多种类,并不限于我们最熟悉的全网搜索引擎。简单分类罗列一下:*全网搜索:包括市场份额最高的几大搜索引擎巨头,Google,Yahoo,Bing。*中文搜索:在中文搜索市场中,百度一家独大,其它几家如搜狗、搜搜、有道,市场份额相对还比较小。*垂直搜索:在各自的垂直领域成为搜索入口的,购物的淘宝,美食的大众点评,旅游的去哪儿,等等。*问答搜索:专注于为问句式提供有效的答案,比如Ask.com;其它的如问答社区像Quora和国内的知乎,应该也会往这方面发展。*知识搜索:典型代表就是WolframAlpha,区别于提供搜索结果列表,它会针对查询提供更详细的整合信息。*云搜索平台:为其它产品和应用提供搜索服务托管平台(SaaS或是PaaS),Amazon刚刚推出它的CloudSearch,IndexTank在被Linkedin收购之前也是做这项服务。*其它:比始DuckDuckGo,主打隐私保护,也有部分用户买帐。各种搜索产品在各自领域都需要解决特定的技术和业务问题,所以也可以建立相对通用搜索的优势,来得到自己的市场和用户。搜索技术搜索引擎所涉及和涵盖的技术范围非常广,涉及到了系统架构和算法设计等许多方面。可以说由于搜索引擎的出现,把互联网产品的技术水平提高到了一个新的高度;搜索引擎无论是在数据和系统规模,还是算法技术的研究应用深度上,都远超之前的简单互联网产品。列举一些搜索引擎所涉及到的技术点:*爬虫(Crawling)*索引结构(InvertedIndex)*检索模型(VSM&TF-IDF)*搜索排序(RelevanceRanking&Evaluation)*链接分析(LinkAnalysis)*分类(Document&QueryClassification)*自然语言处理(NLP:Tokenization,Lemmatization,POSTagging,NER,etc.)*分布式系统(DistributedProcessing&Storage)*等等虽然搜索引擎涉及的技术方方面面,但归结起来最关键的几点在于:*系统:大规模分布式系统,支撑大规模的数据处理容量和在线查询负载*数据:数据处理和挖掘能力*算法:搜索相关性排序,查询分析,分类,等等系统搜索引擎系统是一个由许多模块组成的复杂系统。核心模块通常包括:爬虫,索引,检索,排序。除了必需的核心模块之外,通常还需要一些支持辅助模块,常见的有链接分析,去重,反垃圾,查询分析,等等。[附图:搜索系统架构概念模型]*爬虫从互联网爬取原始网页数据,存储于文档服务器。*文档服务器存储原始网页数据,通宵是分布式Key-Value数据库,能根据URL/UID快速获取网页内容。*索引读取原始网页数据,解析网页,抽取有效字段,生成索引数据。索引数据的生成方式通常是增量的,分块/分片的,并会进行索引合并、优化和删除。生成的索引数据通常包括:字典数据,倒排表,正排表,文档属性等。生成的索引存储于索引服务器。*索引服务器存储索引数据,主要是倒排表。通常是分块、分片存储,并支持增量更新和删除。数据内容量非常大时,还根据类别、主题、时间、网页质量划分数据分区和分布,更好地服务在线查询。*检索读取倒排表索引,响应前端查询请求,返回相关文档列表数据。*排序对检索器返回的文档列表进行排序,基于文档和查询的相关性、文档的链接权重等属性。*链接分析收集各网页的链接数据和锚文本(AnchorText),以此计算各网页链接评分,最终会作为网页属性参与返回结果排序。*去重提取各网页的相关特征属性,计算相似网页组,提供离线索引和在线查询的去重服务。*反垃圾收集各网页和网站历史信息,提取垃圾网页特征,从而对在线索引中的网页进行判定,去除垃圾网页。*查询分析分析用户查询,生成结构化查询请求,指派到相应的类别、主题数据服务器进行查询。*页面描述/摘要为检索和排序完成的网页列表提供相应的描述和摘要。*前端接受用户请求,分发至相应服务器,返回查询结果[附图:爬虫系统架构]爬虫系统也是由多个模块构成:*URLScheduler存储和高度待爬取的网页地址。*Downloader根据指定的网页列表爬取网页内容,存储至文档服务器。*Processer对网页内容进行简单处理,提取一些原始属性,为爬取的后续操作服务。*TrafficController爬取流量控制,防止对目标网站在短时间内造成过大负载[附图:搜索系统架构实例:Google这是Google早期的一张系统架构图,可以看出Google系统的各模块基本和前面概念模型一致。所以一个完整的全网搜索系统的大致系统架构是类似的,区别和竞争力体现在细节实现和优化上。数据除了搜索引擎系统提供了系统支撑外,搜索结果质量很大程度上依赖于源数据的数量和质量,以及数据处理的能力。全网数据的主要来源通常是从互联网上进行自动爬取,从一些高质量的种子站点开始,并沿网页链接不断,收集巨量的网页数据;这通常能达到数据在数量的要求,但也不可避免混入了大量的低质量网页。除了自动爬取来的数据外,搜索引擎的数据来源还可以来自人工收集、合作伙伴提供、第三方数据源和API、以及购买;这些来源通常会有更好的质量保证,但在数量规模和覆盖率上会相对少一些,可以和爬取的数据形成有效的互补。收集到足量的原始数据后,需要进行各种数据处理操作,把原始数据转换成在线检索需要的数据。这个过程通常包括:网页分析,数据抽取,文本处理和分词,索引及合并;最终生成的数据会包括:词典,倒排表,正排表,文档权重和各种属性。最终生成的数据要布署上相应的在线检索服务器上,通常会进行数据分区和分片布署,数据内容更丰富时还可能根据内容分类和主题进行分别布署,比如新闻时效类的网页可能就会独立布署,针对性地响应时效类的查询[附图:索引数据:字典、倒排表、正排表]这张图来源于Google早期的索引数据结构,包括词典、倒排表、正排表。算法有了相当数量的高质量数据之后,搜索结果的质量改进就取决于搜索算法的准确性上。现在的搜索引擎通常通过向量空间模型(VSM=VectorSpaceModel)来计算查询和各文档之间的文本相似性;即把查询或文档抽象成一个词向量,然后再计算向量在向量空间中的夹角,可以用余弦公式得出,作为文本相似度的度量值。在基本的向量空间模型基础上通常会进一步加入词的权重值进行改进,通过经典的TF-IDF公式得出,即词频(TF)乘上逆文档频率(IDF);其中TF=TermFrequency,即该词在所在文档中的出现次数;IDF=InvertDocumentFrequency,即包含该词的文档数除以总文档数,再取反,通常还会取对数来降维,这个值值越大表示这个词越能代表文档特征。除了通过向量空间模型得出的文本匹配评分外,每个文档还会有自己本身的质量评分,通常由网页链接数据计算得出,代表了该网页本身的流行度权重。最终的评分会以文本匹配的查询时动态评分和文档静态评分为基础计算得出;搜索引擎的评分计算都会考虑很多因素,但这两项通常是评分计算的基础。有了确定的排序算法后,另一个重要的任务就是评估搜索结果的质量。由于搜索结果的好与坏是一个比较主观的过程,所以进行定量的评估并不容易。常见的做法是通过事先选定一批查询,通过人工评估或是预先设定标准值的方式,逐个评估每个设定查询搜索结果,最终得到一个统计结果,作为搜索算法的评估度量。另一类做法是直接通过线上的用户点击数据来统计评估搜索结果质量,或是通过A/B测试来比较两种排序算法的点击效果来衡量。合理而有效的评估方法,是搜索算法可以不断改进和比较的前提。查询分析是另一个对搜索结果影响很大的方面,主要任务是把用户的查询文本转换成内部的结构化的搜索请求。涉及的处理可能包括基本的分词处理,专有名词的识别和提取,或是查询模式的识别,或是查询分类的识别。这些处理的准确性将能极大地改进搜索请求的方式,进一步影响搜索结果的相关性和质量。开源方案近年来在搜索公司内部搜索系统和技术的改进和发展的同时,一批开源的搜索系统和解决方案也逐渐发展和成熟起来。当然开源系统在功能全面性、复杂性和规模上都不能与专业的搜索引擎系统相比,但对于中小企业的搜索应用来说应该已经能很好地满足需求,而且也成功应用到了一些大规模的产品系统中(比如Twitter的搜索就使用和改进了Lucene)。现在比较常见的开源搜索解决方案有:*LuceneLucene自然是现在最流行,使用度最高的搜索开源方案。它用Java开发,以索引和检索库的方式提供,可以很容易地嵌入需要的应用中。*Solr&SolrCloudSolr是Lucene的子项目,同属Apache软件基金会项目;它是基于Lucene之上实的一个完整的搜索服务应用,提供了大量的搜索定制功能,可以满足大部分的搜索产品需求。SolrCloud是Solr为了加强其分布式服务能力而开发的功能,目前还在开发阶段,将在Solr4.0发布。*Zoie&Sensei(Linkedin)Zoie是Linkedin公司在Lucene基础上实现的准实时索引库,通过加入额外的内存索引,来达到准实时索引的效果。Sensei是Linkedin公司在Zoie基础上实现的分布式搜索服务,通过索引分区来实现分布式搜索服务。*ElasticSearchElasticSearch也是刚推出不久的一个基于Lucene实现的分布式搜索服务,据说在分布式支持和易用性上都有不错的表现。因为还比较年轻,真实的应用应该还不多,需要观察。因为也是基于Lucene的分布式开源搜索框架,基本上会与SolrCloud和Sensei形成正面竞争关系。*其它开源产品除了Lucene家族以外,还有一些其它的开源产品,比如Sphinx和Xapian,也有不少的应用;但近年来的更新频率和社区活跃度都不太能和Lucene系的产品相比。*托管平台除了开源产品外,现在还出现了一些基于云计算和云服务的搜索服务,比如Amazon新近推了的CloudSearch,还有更早一些的IndexTank(已被Linkedin收购)。这类服务无需自己布置搜索系统,直接使用在线服务,按需付费,所以也将是开源产品的替代方案和竞争对手。附几张上面提到的开源系统的概念模型和架构图:[附图:Lucene概念模型][附图:Lucene工作流程][附图:Sensei系统架构][附图:SolrCloud系统架构]现状与未来:传统的搜索引擎经过了十几年的发展,目前在技术和产品上都已走向逐渐稳定和成熟,通用搜索的市场也基本进入饱和,不像早些年一直呈现高增长率。同时,在各个垂直领域,也出现了很多和产品结合的很好的垂直搜索产品,比如淘宝的购物搜索,大众点评的美食搜索,去哪儿和酷讯的旅游搜索等,也都在各自领域占据了相当大的市场,成为除了通用搜索引擎之外的重要的用户入口。在开源领域,各种开源产品和解决方案也逐渐发展成熟,通用搜索技术不再为大公司所专有,中小企业能够以较低的成本实现自己的搜索应用。现在搜索引擎产品之间的竞争的在数据、应用方式和产品形态上,在系统架构和基本算法上区分并不大。搜索引擎在未来发展上,一是搜索将不仅仅以独立产品的形式出现,的会作为搜索功能整合到的产品和应用中。在产品形态上,基于传统的搜索引擎,会演化出像推荐引擎,知识引擎,决策引擎等形式的产品,更好地满足和服务用户需求。而搜索引擎所涉及和发展起来的各种技术,会更广泛地应用到各种基它产品上,比如自然语言处理,推荐和广告,数据挖掘,等等。总之,搜索引擎对互联网技术和产品带来的影响是巨大的,未来也仍将有很大的发展和应用空间。


Google是世界范围内的搜索引擎吗?为什么输入后出现的都是中国的网页?

google是全球范围的搜索。
如果搜索中文,自然出现中国网页为多。如果是英文,还是外国网站为多。另外,google会根据你电脑的默认语言打开不同语言的google首页,如你把默认语言改为日文,输入www.google.com就会引导你打开http://www.google.co.jp/,在搜索时,搜索条下面也有关于语言的选择,比如“中文网页”“简体中文网页”等等。


中国搜索引擎有哪些?

1、百度搜索百度搜索是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。 “百度”二字源于中国宋朝词人辛弃疾的《青玉案》诗句:“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。2、搜狗搜索搜狗搜索是中国领先的中文搜索引擎,致力于中文互联网信息的深度挖掘,帮助中国上亿网民加快信息获取速度,为用户创造价值。3、360搜索360综合搜索,属于元搜索引擎,是搜索引擎的一种,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。4、谷歌搜索谷歌搜索引擎是谷歌公司的主要产品,也是世界上最大的搜索引擎之一,由两名斯坦福大学的理学博士生拉里·佩奇和谢尔盖·布林在1996年建立。谷歌搜索引擎拥有网站、图像、新闻组和目录服务四个功能模块,提供常规搜索和高级搜索两种功能。

上一篇:藏人是否承认仁吉公主

下一篇:没有了

相关推荐

热门头条