分類彙整: 搜索引擎

谷歌与开源组织合作 在Linux整合大量迷你软件

据IDG新闻服务报道,一位Linux开发者于当地时间本周二透露说,由于看好逐渐兴起的Linux市场,谷歌正在积极准备与开源组织合作,在操作系统中整合谷歌出品的应用程序.
Good OS创始人兼总裁David Liu在美国洛杉矶举行的LinuxWorld大会上说,通过与开发者合作,谷歌可以将其应用程序渗透到更多的低价笔记本电脑产品中,用户可以通过这些应用程序进行诸如网络浏览和电子邮件等基本的应用.

谷歌提供的软件包括Google Docs和Spreadsheet这样基于网络的应用程序以及一些基于本地操作系统的迷你程序.虽然低价笔记本电脑目前还处在发展初期,但是这类产品有望在今后几年呈现爆炸式的增长.
谷歌和Good将进行合作将谷歌的一些迷你应用程序预装在Good即将发布的名为GOS Gadgets 3的Linux系统中,这些迷你应用程序为用户提供游戏和系统查看功能,包括查看电池剩余时间和无线网络信号的强度.Liu还表示,这一系统是专为超低价笔记本电脑设计的,整合谷歌的应用程序也将非常有意义.因为谷歌的应用程序对系统的要求更低,而基于网络的应用对于本地资源缺乏的低价笔记本而言也非常具有吸引力.这款系统还将与谷歌网站上的约一万个小程序建立链接.
除此之外,微软和苹果也分别在其各自的操作系统中整合有迷你应用程序.
Liu说虽然所有人均可使用谷歌的小程序,但是谷歌位于北京的开发人员将会帮助Good将这些应用程序整合到GOS系统中.虽然官方并未正式宣布此项合作,但是双方仍将通力合作保障这些程序的正常运转.Liu表示,谷歌并不希望自己与开源组织之间的合作受到太多的关注.除此之外,谷歌还积极地与 Wine这样的模拟软件进行协作.Wine可以让使用Linux的用户使用微软Office这种原本只能在Windows上运行的软件.而Wine也将被捆绑安装在GOS系统中.
GOS Gadget 3系统还将预装谷歌的Picasa软件,同时提供谷歌Gmail的网络链接.该系统将会在今年九月发布,产品完全免费,该公司正在与电脑厂商接洽,希望能够成为低价笔记本电脑的预装系统.
IDC的研究显示,到2012年,Netbook也就是超低价笔记本电脑的出货量将达到900万台.该产品的先驱——华硕易PC今年一季度的销量已经达到35万台.然而,华硕CEO沈振来却表示Windows版的Netbook的需求量将会大于Linux版的产品.
谷歌未立刻就此发表评论.

谷歌音乐搜索:仅限于中国内地

谷歌音乐搜索的地址在香港无法访问,返回的页面非常简单,就一句话:抱歉,谷歌不在您所在的地区提供您所需要的服务。显然,知识产权的地域性在互联网上得到了体现……作为一名律师,我当然是欢迎Google的这种合法搜索引擎的。没有秩序的社会,是律师的地狱……作为一个网民,我也欢迎这种安排。谷歌通过谈判,获得了版权人的许可,向用户提供免费的音乐作品,然后与版权人分享搜索页面的广告收益。
这样的安排,在使用户得到免费音乐的同时,保证了版权人的利益……其实,Google英文版也有音乐搜索引擎,只不过它是唱片的搜索……利用Google的 Advanced Google Search Operators工具,有人(并非Google公司)制作了基于Google的音乐搜索引擎,,命名为“Musgle”。它倒的确带来一些更为有趣的法律问题。

在cnBeta上看到谷歌音乐搜索上线的消息。地址是:http://g.cn/music,在中国内地的访问者应当可以见到类似下面的页面:

根据报道,和其他音乐搜索最大的区别是:谷歌音乐搜索搜索到的都是经过唱片公司授权的正版音乐。在我订阅的财经新闻中,也提到Google是在与音乐公司持续数月的谈判后,才在中国内地推出这个免费的音乐搜索服务的。我试了一下,上述谷歌音乐搜索的地址在香港无法访问,返回的页面非常简单,就一句话。

“抱歉,谷歌不在您所在的地区提供您所需要的服务。 “

显然,知识产权的地域性在互联网上得到了体现——只有中国内地的“谷歌”用户才能获得这项音乐搜索服务。这也是我为什么在帖子标题中破例使用“谷歌”而不用“Google”的原因。

作为一名律师,我当然是欢迎Google的这种合法搜索引擎的。原因倒不是出于什么大的价值关怀,而是一个很简单的屁股决定脑袋的理由:没有秩序的社会,是律师的地狱。

作为一个网民,我也欢迎这种安排。谷歌通过谈判,获得了版权人的许可,向用户提供免费的音乐作品,然后与版权人分享搜索页面的广告收益。这样的安排,在使用户得到免费音乐的同时,保证了版权人的利益。想起几年前一次在北大召开的mp3下载法律问题研讨会上(这个研讨会的赞助者是中国的某搜索引擎提供者),弥漫着“要么让搜索引擎分享收费下载的利润,要么搜索引擎就拐弯抹角地找法律空子提供音乐搜索”的空气。相比起来,Google无疑又让人感到了(至少相对于其它一些网站的)“不做恶事”的风格。更重要的是,它宣示了一种既有制度的张力:无论我们多么希望一个Free Culture的到来,这个Culture要成其为Culture,就必须有秩序。

其实,Google英文版也有音乐搜索引擎,只不过它是唱片的搜索,不提供试听,地址是:
http://www.google.com/musicsearch?q

在这个搜索引擎中搜索Jacky Cheung(张学友)的结果截图如下(可以发现都是链接到iTunes的付费下载)

此外值得一提的是,利用Google的 Advanced Google Search Operators工具,有人(并非Google公司)制作了基于Google的音乐搜索引擎,命名为“Musgle”,Musgle可以找到可供下载的mp3文件,点下面的图标可进入:

Musgle

通过Musgle,访问者不能试听音乐,但的确可以下载相关音乐的mp3文件。这种对搜索引擎的二次开发,在技术上遇到的障碍应该不大,不过它倒的确带来一些更为有趣的法律问题。比如:Google是否因此还是难逃版权纠纷?如果Google不必承担责任,那么Musgle的举办者呢?这个问题值得相当精细地讨论——对于这类法律问题,还是那句话,没有概括的“是”与“否”,只有对细节的分析和暂时的答案。这方面的问题,以后有空再谈。在此之前,也希望专业的读者在本文后提出自己的看法(纯粹表达情绪的就免了,呵呵我这里不是天涯)。

谷歌中国宣布联合巨鲸网推出音乐搜索功能

谷歌中国和巨鲸音乐网正式宣布,在谷歌中国的整合搜索推出音乐搜索功能的实验版.
此项新功能通过由巨鲸音乐网提供音乐内容、谷歌提供搜索技术、音乐界与巨鲸音乐网分享广告收入的模式来满足中国用户不断增长的互联网娱乐需求.

访问:Google 音乐搜索

此次谷歌中国在 www.google.cn 平台率先推出该功能的实验版,也是谷歌在全球第一次尝试音乐搜索服务.目前,在实验阶段,谷歌整合搜索的音乐功能可以为用户提供上百家唱片公司旗下的数万 首歌曲的搜索服务.在此次发布的整合搜索音乐功能实验版中,先期囊括了上百家唱片公司的数万首中文歌曲,这一正版音乐搜索功能的推出,可避免用户以往音乐 搜索死链频频、下载速度慢、歌曲质量差如音效差、不完整甚至受到病毒侵害的苦恼.

此次合作创建了一种崭新的商业模式,即由巨鲸音乐网与音乐产业对巨鲸音乐广告收入分成,为正版音乐的合法下载提供了一种可持续的解决之道,谷歌通过自身强大的搜索技术和用户基础为巨鲸音乐带来新的产品功能、体验和大量用户.

分析指出这种合作盈利模式的出现,搭建了一个多方共赢的平台:广大用户自此可以合法地、方便地、免费的、高质量试听、下载正版音乐;唱片公司通过授权,合理、合法地维护了自己的版权;谷歌则获得新的用户群,同时通过负责任的方式提升用户搜索体验.

巨鲸音乐网CEO陈戈表示:”针对中国上亿网民巨大的免费音乐下载、视听等使用需求,是时候建立相应的商业模式,用服务于广告主的音乐广告平台、广告产品及服务来回馈于音乐的创造者.我们非常高兴谷歌同我们分享同样的理念.”

谷歌大中华区总裁李开复博士表示:”谷歌十分认同巨鲸音乐网一直倡导的下载正版音乐的做法,互联网产业绝不应该成为音乐产业的对立面,此次通过与巨鲸音乐 网合作,共同在整合搜索中发布音乐功能实验版,实现了用户利益、关联产业利益、谷歌利益的良好平衡,谷歌一直深信共赢而非独大才是致力于长远的发展之 道.”

百度日本域名Baidu.co.jp正式启用 任命井上俊一为百度日本总裁

百度日本分公司近日正式启用了Baidu.co.jp域名与Baidu.jp 共同提供搜索服务(中国大陆暂无法访问)。
在此之前,百度日本曾因Baidu.co.jp域名问题与该域名之前的所有者交涉,随后获得了日本政府获胜裁定,但由于一些原因,裁定后就一直没有了消 息。据记者获悉,百度日本自2008年7月10号正式获得了Baidu.co.jp域名的非物质财产所有权,自 7月31日正式启用。
百度今日宣布任命井上俊一为百度日本总裁,此任命从宣布之日起正式生效。
“井上先生在日本具有长达10年从事互联网搜索业务的经历,不仅深刻了解日本互联网和搜索引擎市场的发展状况,而且拥有广阔的国际化视野和丰富的国际化企业管理经验。他的技术和产品经验,必将为百度日本带来新的活力。”百度董事会主席兼首席执行官李彦宏表示。

井上先生1998年起在著名搜索引擎Excite日本担任首席技术官,2004年加入雅虎日本,历任搜索事业部部长、主管搜索业务的副总裁,负责雅虎日本所有的搜索产品,为雅虎在日本市场上成为市场占有率最高的搜索引擎做出了重要贡献。

“作为日本互联网搜索产业的领军人物,井上先生的加盟是百度日本业务发展迄今为止最重要的里程碑事件,极大增强了百度在日本市场上吸引更多一 流人才、提供更好的产品与服务的信心,也必将促进百度日本各项业务得到更加迅猛的发展。”百度负责国际业务的市场和商务拓展副总裁任旭阳表示。

此次Baidu.co.jp域名的正式启用更符合日本国民的日常习惯,将极大的对百度在日本市场的推进产生积极影响。日前刚有消息称百度日本总裁人选将浮出水面。记者对百度日本近日的诸多动作将保持高度关注。

搜索Cuil开张首日瘫痪 搜索界三分天下

谷歌公司几名前员工28日推出新搜索引擎Cuil,对抗老东家谷歌。Cuil创始成员说,Cuil在搜索深度和广度上均超过谷歌。 但一些网络专家对Cuil的前景持谨慎态度。“Cuil”一词源于古爱尔兰语,发音同英文单词“cool”,意为“求知”。Cuil黑色主页上说,它覆盖 的网页超过1200亿个。Cuil公司设在美国加利福尼亚州门洛帕克市,由风险资本投资者筹资3300万美元组建。

首日“瘫痪”
Cuil“开张”第一天“生意火暴”,吸引了众多网民前来“捧场”。28日上线当天由于访问量过多,导致Cuil服务器一度陷入瘫痪状态,一部分访问者输入关键词搜索后,网页上显示“访问量过大,暂无结果”的字样。

四大天王

Cuil由Googlebase前首席技术官安娜·帕特森(上图)与她的丈夫科斯泰罗联手创办,他们的两位亲密助手拉塞尔·帕威尔和路易斯·蒙尼尔同样也曾是谷歌的资深员工。

帕特森来头最大,她在此前曾一手建立起功能强劲的搜索引擎Recall,并在2004年被谷歌连人带网站高价收购。2006年,更喜欢独自高飞的帕特森辞职,并开始创建Cuil。而协助IBM构建新型搜索引擎WebFountain的丈夫科斯泰罗也成为她最有力的帮手。

拉塞尔·帕威尔是大型搜索目录TeraGoogle前工程师。路易斯·蒙尼尔是早期搜索引擎AltaVista的首席技术官,曾是协助构建eBay搜索引擎的业界老将。

三分天下

目前的搜索界仍处于“三分天下”的状况。在英国,谷歌6月占有的份额为82%,雅虎和微软分别为5%和4%。在美国,谷歌5月份拥有62%的份额,雅虎和 微软分别以21%和8.5%的份额紧随其后。Cuil还将面临eoma、Vivisimo、Snap等竞争对手的挑战。

酷点

数据库

Cuil索引数据库包含1200亿个网页,至少3倍于谷歌。按照帕特森的说法,谷歌常常忽略访问量小或默默无名的网页。

Google表示能浏览1万亿个网页链接,但考虑到部分网页内容相似或影响搜索结果质量,因而没有把它们全部编入索引,仍自称拥有最大的索引数据库。

搜索显示

Cuil的搜索结果以更杂志化的方式排列,结果页面上将显示更多图片和工具条,用户可以点击工具条了解更多与搜索关键字相关的内容。搜索排名方式专注于分析网页内容。

Google显示传统的条块状文字链接,但提供新闻、视频、本地、图片等专门搜索服务,以网页受欢迎程度进行排名。

隐私权

Cuil称最大特色在于,它希望通过承诺不保留用户搜索历史和上网行为的信息来吸引用户。

Google以及其他搜索引擎都保留用户资料,这些引起了隐私权保护机构的强烈不满。

中文服务

Cuil开通初期阶段,将主要搜索和分析美国英语网页。今年晚些时候将使欧洲各大语种用户也能用上Cuil服务。目前没有中文网页。

Google中文页面新增生活搜索服务,可以在房屋、工作、餐饮、票务和电影等方面进行专门搜寻。

前Google工程师开发新搜索引擎“Cuil”

硅谷一家名不经传的小公司“Cuil”近日自称推出了互联网上最大的搜索引擎,其索引页面的数量比Google还要大三倍。这家公司的总裁Anna Patterson此前曾在Google工作,但是她在2006年离开了公司,并和她的丈夫和几位朋友共同创建了Cuil搜索引擎(Cuil发音为“酷”,源自于盖尔语,意为“知识”),她的丈夫Tom Costello此前帮助IBM构建了新型搜索引擎WebFountain,而另外另外工程师Russell Power和Louis Monier则是Google的TeraGoogle项目前工程师。
在界面上Cuil搜索引擎并没试图模仿Google,但是也不具备图片、视频搜索能力。但Cuil相信,通过其特有的识别方法和结果展示页面,它也能一枝独秀。Cuil的搜索结果页面提交就像是一本杂志的内容,而不只是内容的叠加。Cuil也承诺将不保留用户的搜索历史,以保证用户的隐私。

Cuil搜索引擎目前获得了3300万风险投资,他们宣称索引数量已经超过1200亿个网页,是Google的三倍左右。不过Google没有公开其索引页面的数量,所以Google的实际索引数量仍不得而知。Patterson表示,3年前Google索引的页面数量是82亿个页面。

在Cuil对外公开索引页面数量之后,Google上周五在官方博客中透露,他们索引的页面数量在1万亿左右。不过Google并不会把所有索引到的页面都放到搜索结果中,因为这样会削弱搜索结果质量

访问:cuil

Google公布互联网最新索引数量:1,000,000,000,000个网页

连Google也不得不承认互联网真的是很大很大的东西,到现在为止,他们已经索引了一兆(百万的平方)的网页数,数量比银河系的星体还多出一倍.
Google的索引在1998年开始工作,当时他们收集了2600万个页面,2000年就突破了10亿,到10年后的2008年,Google的数据库变成了全球最庞大的索引之一.

1,000,000,000,000个网页

1,000,000,000,000个网页

Google发布Knol

Google周三推出了Knol挑战维基百科,让用户写自己擅长的东西.
Knol产品经理塞德里克-杜邦表示:“我们深信,这种著述方法让读者相信这些内容.”Google从去年十二月开始对该产品进行测试.Knol的发布工具与博客页面的工具类似,但是Knol鼓励作者将内容缩减到一页,而不是按时间数序的很多页面.

杜邦说:“我们不希望最后的声音获胜,这对一个忙碌的专业人士是很困难的.”Google希望按照受欢迎程度排列,以便鼓励竞争.

与维基百科按话题区分不同,Knol的重点是个人用户或用户群.Knol不编辑信息.只要作者不批准,用户不能修改信息,也不能写新信息,用户可以通知Google内容是否客观.

Google与《纽约人》签约,让Knol的作者们都可以使用一个该杂志著名的漫画人物,作者们还能够在页面上做广告并获得收入分成.杜邦说:“我们希望Knols将填补网络上的一些空白.”

Knol

Google终于发布了knol,但是不知道这会不会像维基一样被河蟹呢?

Google自爆数据中心基础设施

Google一向很少对外透露其数据中心的工作,但5月28日,Google伙伴Jeff Dean在Google I/O会议的听众前,轻轻撩起了Google公司基础设施的神秘面紗。

一方面,Google用的是一般的服务器、处理器、硬盘、软驱等等。另一方面,Dean似乎认为1800台服务器也是非常普通、不值得一提。而Google公司使用的软件,能在半秒之內回应700至1000台服务器的搜索請求,则完全是另一回事。

Google从未透露他们究竟拥有多少台服务器,但Dean认为至少不下数十万台。Dean表示,每個机柜里存放了大约40台服务器。而根据某项估 计,Google目前在全球有36個数据中心,以每个中心有150个机柜计算, Google的服务器至少超过20万台,而实际数字还要比这大得多,且每天都在增加中。

不论真正的数字有多少,Google的成就也实在惊人,部分原因是他们推翻了电脑业的传统做法。当所有的超大型数据中心,如纽约股票交易所或航空公司的联合订位系统都是采用许多主流服务器和软件系统的时候,Google的数据中心绝大部分却是自身的技术建设而成。

有些制造和出售服务器的公司虽然不以为然,但Google显然相信自己的技术命运最好操纵在自己手中。Google搜索产品与使用者经验副总裁搜 Marissa Mayer在5月29日的演讲中提到,共同创办人Larry Page鼓励员工对“不可能的事情”保持一种健康的不敬。也就是说,别太相信有什么不可能的事情。

要维持如此大规模的运作,Google必须对每一台机器都抱有一种随时可牺牲的态度,服务器制造商喜欢宣传他们的主机质量优越、具有高度承受故障或当机的能力,但Google仍然宁愿把钱投资在冗余软件系统上。

Dean表示:“我们的观点是,拥有两倍数量但比较不可靠的硬件,胜过数量一半但比较可靠的硬件。你必须为软件提供可靠保障,如果你有1万台主机在运作,每天一定会有一些意外。”

Dean说,每次新业务上线最能显示出硬件的脆弱。一般每个新业务上线的第一年,通常会发生1000次个别主机的故障、数千次硬盘故障;一次电力输送 问题,会导致500至1000太主机失效约6小时;20次机柜损坏,每次会造成40至80台主机下线;5次机柜摇晃,会导致一半的网络封包在传送过程中遗 失;整个业务至少一次重新上线,在两天之内的任何时间,影响5%到主机。整个业务中还有一半的几率会过热,可能导致5分钟内让几乎所有服务器当机,恢复则 需要花费1到2天地时间。

虽然Google用一般的硬件组装其服务器,却不用传统的封装,他们要求英特尔提供特制的主机板。Dean表示,Google目前在每40台服务器的机柜外,都包了一层外壳,这是Google自行开发的设计,而不是服务器厂商提供的外壳。

Dean表示,Google使用了几种服务器组装的方式,有些配备了很多硬盘,有点则数量比较少。还有一些大范围的差异,他说:“我们不同的数据中心都有一些差异,但数据中心内部不会。”

对于服务器本身,Google偏好使用多核心晶片。许多习惯追求运算速度的软件公司其实很难适应多核心的晶片,但Google沒有这种问题。他们在技术上早就必须适应横跨数万台电脑的结构,因此他们已经进入平行运算的世界。

Dean说:“我们真的很喜欢使用多核心主机。对我们而言,多核心主机就像很多相互连接、性能优越的小机器,对我们来说相对好用。”

虽然Google对搜索和其他服务都要求快速回应,其平行运算能在单一指令的执行相对较慢时产生快速回应的结果。这对于多核心处理器和多线程模式设计者是一大鼓励。Dean說:“单线程的表现对我们来说无关紧要,我们有很多平行化的问题。”

那么Google要如何处理这些一般的硬件问题呢?用软件。

Dean说明了Google软件的三个核心要素:GFS(Google档案系统)、BigTable和MapReduce演算法。虽然Google资助了许多有助于其开展的开放源代码的计划,这些仍然属于专有软件。

Dean表示,三者中级别最低的GFS几乎在所有主机中运作,负责储存资料。某些GFS的化身是“许多petabyte大小”的档案系统。目前有超过200个业务在执行GFS,其中许多都包含数千台主机。

GFS把一块储存的资料(通常是64MB),至少放在三台称为chunkserver的主机內;假如chunkserver发生故障,主服务器便负责吧资料备份到一个新的地方。Dean說:“至少在储存层级,主机故障完全由GFS系统处理。”

一窥Google数据中心自行定制的40台服务器机柜。基础建设大师Jeff Dean在Google I/O大会上展示了这张照片。

谷歌创始人位列英国媒体最具权力100人榜首

英国《卫报》7月14日发布了08年度“英国媒体最具权力100人”排行榜榜单,谷歌创始人谢尔盖·布林(Sergey Brin)和拉里·佩奇(Larry Page)位居榜首.
《卫报》将榜单的头名授予布林和佩奇,其原因在于该报在考量经济、文化和政治影响力的基础上,认为“谷歌具有对媒体无孔不入的影响”.排在榜单次席的是传 媒大亨鲁珀特·默多克(Rupert Murdoch)之子——詹姆斯·默多克(James Murdoch ),他是英国天空电视台董事长,同时身兼新闻集团欧洲和亚洲事务部主席和CEO.其父鲁珀特·默多克则位列榜单第五位. 閱讀全文

杨致远致信雅虎员工 揭露微软伊坎收购真相

雅虎首席执行官杨致远周一向雅虎全体员工发送电子邮件,阐述了雅虎与微软及投资人卡尔·伊坎(Carl Icahn)最新一轮谈判破裂的问题.杨致远在邮件中表示,微软及伊坎试图分拆雅虎,并将雅虎的搜索业务出售给微软.以下是电子邮件全文:
标题:微软和卡尔·伊坎在周末发起的联合收购建议

雅虎同仁:

在上周五晚上,公司董事会收到了来自微软和卡尔·伊坎关于收购搜索资产并对公司进行重组的提议.大致上讲,此提议要求把雅虎的搜索资产出售给微软,并把公司的剩余业务交给伊坎来负责.公司董事会因许多原因拒绝了这一收购建议,因为担心该交易将不利于雅虎股东.随着年度股东大会举行日期8月1日的日益临近,我想给你们谈谈未来几天或几周内可能将发生哪些事情.

微软和伊坎试图分拆雅虎,并将雅虎的搜索业务出售给微软的建议,可能会引发更多的争论.尽管我知道这不会让你们过度分心,但我也知道你们已无法全身心的继续投入到工作当中,来改变我们用户、广告客户、发行商和开发者的体验.我还认识到,我们的客户和合作伙伴可能会有另外的一些问题.

请相信,公司当前的董事会、管理团队和我所做的一切都是为了股东和公司业务.我们已准备好由股东,而不是微软和伊坎来决定到底什么符合股东的最佳利益.我们期待着即将到来的股东大会.感谢你们的辛勤劳动和对雅虎的承诺.

答员工疑问:

问:雅虎管理层当前是否考虑出售搜索业务,分拆公司?

答:微软及伊坎的联合提议内容包括分拆雅虎,并将雅虎的搜索业务出售给微软.雅虎董事会拒绝了这一提议.雅虎董事会的结论是,将搜索业务出售给微软不利于雅虎股东的最佳利益.我们仍然认为,同Google签署的合作协议,将有利于雅虎股东,将使雅虎能够在现实和搜索广告领域具备竞争力.

问:雅虎是否认为,在搜索和显示业务同时发展,是最大化股东价值的最佳途径?

答:我们认为,搜索和显示的融合,将会使快速变革的网络广告产业进化的下一个重要发展阶段.我们的战略,包括最近宣布同Google进行合作,都将有利于这一融合.

问:微软和伊坎向雅虎提出的收购提议的实质是什么?

答:微软和伊坎提出了关于收购搜索资产并对公司进行重组的提议.微软和伊坎的提议要求迅速替换当前的董事会,并清洗雅虎当前的最高管理团队.雅虎董事会认为,这些提议将使公司在未来一年内陷入动荡之中.而且交易能否成行,政府监管部门都将会对此进行为期一年的调查.雅虎董事会董事决定,接受此提议并不符合雅虎股东的最佳利益.

问:作为雅虎员工,这一次我将如何来帮助公司?

答:我们要求你们继续投身于自身的工作当中,来改变我们用户、广告客户、发行商和开发者的体验.

答客户与合作伙伴疑问:

问:雅虎管理层是否考虑出售公司搜索业务,分拆公司?

答:雅虎董事会已经拒绝了将把搜索业务出售给微软的微软和伊坎的重组提议.我们仍然认为,同Google签署的合作协议,将有利于雅虎股东,将使雅虎能够在现实和搜索广告领域具备竞争力.

问:微软和伊坎提议的实质是什么?

答:微软和伊坎提出了关于收购搜索资产并对公司进行重组的提议.微软和伊坎的提议要求迅速替换当前的董事会,并清洗雅虎当前的最高管理团队.雅虎董事会认为,这些提议将使公司在未来一年内陷入动荡之中.而且交易能否成行,政府监管部门都将会对此进行为期一年的调查.雅虎董事会董事决定,接受此提议并不符合雅虎股东的最佳利益.

台湾Yahoo联手Mozilla 对抗Google

新闻来源:DigiTimes(台湾)
为持续巩固在台湾网络市场的龙头地位,业者雅虎奇摩9日宣布与网页浏览器业者Mozilla合作,在Mozilla开发的Firefox浏览器中,预先载入雅虎奇摩的应用服务;雅虎亚洲区董事总经理邹开莲指出,以往雅虎注重应用服务层面,希望透过Mozilla结合工具程序的开发,提供更丰富的使用者需求 及经验;这也是Mozilla在全球首次与非Google的网络业者进行大规模合作
    合作内容即是在Firefox 3.0版繁体中文接口的网页浏览器中,预先加入雅虎奇摩的各项服务连结,包括新闻、影音等,并将浏览器首页直接预设为雅虎奇摩的网络搜索引擎;不过,就 Mozilla的布局观察,Firefox在全球市场主要预设的搜索引擎为Google,在单一市场携手非Google业者的大规模合作则是首见。
 
    负责与雅虎奇摩合作的北京谋智(Mozilla Online)执行长宫力指出,各地市场的差异性仍然存在,以Google在亚洲市场的搜索引擎占有率并非特别出色,台湾则以雅虎奇摩位居领先地位,因此 也希望透过新的合作方式,找寻新的商业模式。据了解,Mozilla与Google的合作方式是依据营收进行一定比率的拆帐分配等,2007年 Mozilla全球营收约8,000万美元,全球员工数则约100人。

    据了解,Firefox浏览器全球市占率约20%,微软 Internet Explorer(IE)则约8成;宫力指出,6月中旬开放下载的Firefox 3.0,至今全球新增加约3,000万名新的使用者,其中台湾约25万人,而Firefox在台湾市占率亦约为20%,透过与雅虎奇摩的合作意在拉高台湾 的市占率表现。

    邹开莲表示,由于Firefox亦以开放为原则,双方会投入更多在应用服务与程序工具相结合的技术开发上。不过正值微软仍有意购并雅虎的时点,双方合作亦被外界质疑是雅虎暗中与微软相互较劲,对此邹开莲指出,该合作案是由亚洲区自行决定而非美国总部,也不具有对抗微软的「野 心」,主要目标仍锁定在持续进行网络的创新。

Google推出虚拟现实服务“Lively”

谷歌近来不断超出组织全球信息的主要使命,周二又推出了免费的虚拟现实服务“Lively”,这对“Second Life”(第二人生)构成了挑战.
Lively采用了三维软件,人们会齐集想象中的房间等背景中.谷歌认为有多个虚拟现实网站会吸引更多用户,而且Lively不收费.只要从lively.com安装一个软件包,用户就能从博客、社交网站等网站进入Lively.
Lively by Google

谷歌已经在Facebook创建了一个Lively应用程序,并且正在针对更大的社交网站MySpace.com开发一个版本.谷歌设计经理Niniane Wang表示:“我们知道人们已经花了很多时间进行网上社交,我们只想让这更有乐趣.”

Lively用户可以设计出一个形象,可男可女,也可以是其它生命,它有自己的身份,可以换衣服、表情.用户可以在各种数码环境中漫游,如小孩的房间、色情场所等.房间中可以装饰多种家具,如大屏幕电视,上面甚至可以播放YouTube的视频.用户可以邀请朋友或家人进入自己的虚拟现实环境,进行聊天、拥抱、哭泣等互动.

谷歌要求Lively用户至少要13岁.此前,谷歌在亚利桑那大学的一群学生中间对Lively测试了几个月.目前,谷歌还没有在Lively做广告的计划.

http://www.lively.com/catalog/images/corner_logo.gif

《PCWorld》:Google到底要干什么?

PCworld发表文章,讨论了Google最有意思的一些项目的进展情况,包括关于Android的一些细节、新能源开发、语言翻译还有新的面部识别搜索技术等.
另外,文章还就网上流传着的一些Google的秘密项目,也向Google发言人进行了求证,从而探究Google到底在做什么.以下为全文内容:
高涨的股票、狂热的追捧、另外更重要的是真正有用的互联网产品,Google可谓是新千年后的科技明星.

  然而,Google太活跃了,以致于要想全面跟踪它所做的一切已经变得不那么容易.当你刚刚弄熟Google发布的一连串Web应用、 Google实验室的各项创新以及前瞻性搜索项目时,Google就像翻硬币一样又开始新的投资,尽管对一个有着1.9万名员工,市值1670亿美元的公司来说,转变并不是像翻硬币那么简单,但谁又能想到一个搜索公司会去参与铺设美国和日本之间的海底光缆呢?

  ”整个Google帝国是从研究项目开始的,Google的核心理念是尝试并发现新事物并把他们变得有钱可赚,” Jupiter研究公司的分析师Michael Gartenberg说道,”当你拥有像Google那样的市值,拥有付费搜索这样的聚宝盆时,你就可以不停地去试验.往往,对于项目的实施,都需要必要的财政支持和人才支持,但对Google来说,这两者都不缺”.

  Android:Google想让所有人都接入Google

  ”GPhone”再也不会出现,取而代之的是”Andriod”——一个手机开源操作系统.Android已经成了Windows Mobile的直接竞争对手,也是对开源开发的一次实验.最近,Google举办了一次竞赛,评出由第三方开发者为Android开发的最具创新的应用,共有1700多名程序员参加了这项竞赛.

  这些参赛应用包括那些基于全球定位系统GPS的各种应用.比如,其中一个应用是让用户基于他目前所在位置呼叫到出租车;还有一个应用是可以让用户找到朋友们的位置,了解他们在做什么并参与他们的计划,这些信息都可以实时跟踪.就目前看来,有些应用听起来过于理论化,毕竟Android平台和基于 Android的手机到今年下半年才能发布,但Google还是评选出了头一轮的前50名入围优胜者.

  Android产品经理Erick Tseng说道,从让手机来规定你只能做什么到手机向任何类型的内容、服务、供应商和媒体开放,这将是个很大的转变.

  ”这对整个手机生态系统来说有着明显的好处,不仅是对普通用户,而且也包括开发者、运营商还有内容供应商”,Tseng说道,”不管你今天使用的是什么样的手机,想想你去获得内容的不便.但对Android来说,对内容的接入没有任何的羁绊.用Android,你永远都不必去关心内容的接入.”

  然而,Android也不是一切都进行顺利.Forrester 研究公司的分析师Charles Covin一直关心Android的进展,他说道,”我认为Android是一个长远的计划,要想在最近就看出Android带来的变化,那会让你失望. Google的意图是要让所有的消费者都来使用Google,不管是用什么方式,所以这就很清楚,当移动互联网的发展还有所局限的时候,Google将会把Android作为它下一个和用户进行连接的地方.”

  面部识别搜索:让图片搜索变得跟文字搜索

  图像搜索是个新兴的、远未被开发的市场.今天,当你在Google上键入”巴黎希尔顿”的时候,你会发现一些标记了的巴黎希尔顿图片.然而,打标签是个很单调的过程.举个例子来说,在Flickr.com上,很多图片未被打上标签,所以就很难通过搜索找到它们.如果越多的图片没打标签,那就越难找到它们.

  在Google,一个新的面部识别技术将让那些未打标签的图片不再难以被找到.不像该技术用于生物识别领域那样,图片搜索技术就是为了让你找到你想要的信息.

  ”那些Google对文本已经做到的搜索,我们希望能实现在图像上”,Google的研究人员Shumeet Baluja说道,”我们希望图像能和文本一样容易被搜索、被获得”.

  想象一下这样的情景:五年后,你所有的数码照片都是在线存储,当你想要查找你祖母的照片时.通过Google的面部识别技术,你可以通过一张含有祖母眼睛距离,鼻子、耳朵、眼睛位置信息的照片,在几秒之内,你就可以找到所有你曾经上传的祖母的照片,尽管这些照片是在不同地方在线存储.

  语言翻译:让机器变成人

  作为搜索引擎的一部分,自动语言翻译已经出现很多年,比如Alta Vista.Google在语言翻译上进展不小,可被翻译的语言包括俄语、阿拉伯语和最近增加的印地安语.另外一个革新是正在研究的基于语言文化现象规则进行的机器翻译,这需要大量的计算处理.

  ”使用越多的规则,翻译的质量就越高”,Google机器翻译研究人员Franz Och说道,”比如,如果你想进行一次英语到印地语的翻译,当语种越小,机器翻译的重要性就越大.芬兰语由于其奇怪的语法而很难进行机器翻译,它的每一个词汇可能派生出很多的信息.其他的一些语言由于语言间的差别很大,使翻译变得非常复杂.那些有着相同词根或者相近的语言就比较容易翻译,比如从法语到英语”.

  新能源探索:要做气候保护者

  Bill Weihl 负责整个Google公司的能效部分,他试图让Google成为提倡能效的领导者.Google总部的大部分建筑都有太阳能电池板,最高能提供近30%的能源.Google也让他的员工们短期使用那些停在车库靠吸收太阳能来存储能量的混合动力汽车.

  ”在过去的一年里,我们和行业里的其他公司合作来推动提高PC和服务器使用的能效”,Weihl说道,”我们已经和Intel、惠普以及星巴克共同启动一个名为’气候保护者’的倡议,.这不是个技术问题,而是需求问题”.

  通用搜索:一次性搜到全部内容

  当你在Google上进行搜索的时候,你就在使用”通用搜索”,Google提供的搜索结果不仅仅是文本链接,还包括一些Web站点的混合,图片,视频,博客以及音频.通用搜索就是Google用来决定应该提供什么样的搜索结果,已经怎样去提供.通用搜索的目标就是根据搜索字段提供均衡的搜索结果,而不仅仅是文本网页链接.

  ”当你搜索马丁路德•金的时候,你可能想到的是文本的结果,但我们会提供相关的视频结果”,Google通用搜索高级软件工程师David Bailey说道,”我们可以看到结果,然后进行比较和对比.有些人可能进行针对性的搜索,我们会提供’非文本的’搜索结果,可能会是博客的帖子或者博客的视频.”

  Google回应几个传言:与政府合作很正常

  除了那些已经确认的项目以外,还有很多传言的项目.这里我们向Google进行了求证,让Google来评论一下一些主要的传言,来确认其真假.

  有传言说Google的数据中心遍布世界各地.

  Goolge回复:”快速、创新的产品是满足用户需求的关键,同时也需要大量的运算能力.因此,Google在技术设施上进行了大量的投资,而且也拥有大量包含很多计算机的基础设施.然而,出于商业竞争的考虑,我们不便透露确切的数目以及准确的设施位置.”

  计划从微软收购Expedia(微软旗下的旅游网站):

  Google回复:不作评论.

  戴尔正在生产Google手机?

  Google回复:不作评论.

  Google和美国中央情报局有合作?

  Google回复:”对任何人来说,大部分的Google产品都可以在网上免费获得.我们也提供一些企业级解决方案给各个国家的公司、非盈利组织以及政府组织.”

  Google在为Web互联网提供一个操作系统?

  Google回复:不作评论.

  Google正准备从eBay那里收购Skype的网络电话业务?

  Google回复:不作评论.

  Google正在为Wi-Fi二代(Wi-Fi 2.0)购买无线频谱?

  Google回复:”这是对这个问题的误解.我们,包括微软、戴尔、飞利浦以及其他科技公司,都主张将空闲的电视频谱无照开放,来作为互联网接入使用.’无照’意味着那部分的频道不被拍卖,而是对每个想使用它的人开放.目前,无照频谱仅仅被用在车库大门和Wi-Fi站上.所以说Google要’ 买’下那部分频道是不准确的,我们认为那部分频谱不该被拍卖.”

用搜索引擎机器人的语言交流

发表者:Sean Harding,网站管理员工具小组原文:Speaking the language of robots
发表于:2008年3月27日星期四,下午1:27我们都知道

谷歌机器人是非常友好的。就像所有的友好的搜索引擎机器人一样,他耐心地听取我们的意见并且尊重我们的意愿不去爬行任何我们不希望它爬行的网站部分。我们可以仅仅给他一个robots.txt文件说明什么是我们希望他做的,然后他就会愉快地遵从。但是如果我们迫不得已只能与谷歌机器人直接交流呢?毕竟,不是所有的人都熟悉robots.txt文件的语言。这就是我们为什么如此高兴地向您介绍一款专属于您的搜索引擎机器人翻译工具:网站管理员工具中的robots.txt生成器。它旨在为您提供一个既简单又互动的方式去建立一个robots.txt文件。它的操作非常简单,您只需输入您不希望搜索引擎机器人爬行的文件和目录即可。或者,如果您需要的话,您可以为特定的搜索引擎机器人或您网站的特定区域建立更加细致的规则。


当您完成了对生成器的配置之后,您可以利用我们的 robots.txt分析工具检测新生成的robots.txt文件的效果。如果测试无误,您只需将生成的文件保存在您网站的根目录下即可。除此之外,这里还有一些关于robots.txt文件的重要事实希望您能牢记:

  • 不是所有的搜索引擎都支持robots.txt文件的所有扩展Robots.txt生成器可以生成谷歌机器人能够理解和识别的文件,而且绝大多数搜索引擎机器人也都能够正确识别。但是,一些例外情况也是存在的,或许有一些搜索引擎机器人不能完全识别生成器生成的所有特性。
  • Robots.txt文件仅仅是一个请求尽管在主要搜索引擎上极为少见,搜索引擎中还是有一些肆无忌惮的搜索引擎机器人会无视robots.txt的内容,对禁止访问的网站区域也进行爬行。如果您有一些需要进行彻底保护的敏感信息,您应该设置访问密码来对它们加以保护,而不是仅仅依赖于robots.txt文件。

我们希望这个新工具能够帮助您将自己的意愿与谷歌机器人和其他访问您网站的搜索引擎机器人进行更顺畅的沟通。如果您想了解更多关于robots.txt文件的情况,请访问我们的帮助中心。如果您想就robots.txt和搜索引擎机器人的有关问题与其他网站管理员进行交流的话,请访问我们的谷歌网站管理员支持论坛

转载自谷歌中文网站管理员博客

与谷歌机器人的第一次约会:标头和压缩

发表者:Maile Ohye (饰网站),Jeremy Lilley (饰谷歌机器人)

原文: First date with the Googlebot: Headers and compression
发表于: 2008年3月5日星期三,晚上6:13

googlebot with flowers
姓名/用户代理: 谷歌机器人
IP地址: 点击这里查看如何验证
寻觅: 拥有独特而诱人内容的网站
最不喜欢的行为:违反《网站管理员指南》

谷歌机器人 — 多么神奇的梦幻之舟!他了解我们的灵魂和各个组成部分。或许他并不寻求什么独一无二的东西;他阅览过其它数十亿个网站(虽然我们也与其他搜索引擎机器人分享自己的数据:)),但是就在今晚,作为网站和谷歌机器人,我们将真正地了解对方。

我知道第一次约会的时候,过分地分析从来就不是什么好主意。我们将通过一系列的文章,一点点地了解谷歌机器人:

  1. 我们的第一次约会(就在今晚):谷歌机器人发出的数据标头和他所留意到的文件格式是否适于被进行压缩处理;
  2. 判断他的反应:响应代码(301s、302s),他如何处理重定向和If-Modified-Since;
  3. 下一步:随着链接,让他爬行得更快或者更慢(这样他就不会兴奋地过了头)。

今晚只是我们的第一次约会……

***************
谷歌机器人: 命令正确应答
网站: 谷歌机器人,你来了!
谷歌机器人:是的,我来了!


GET / HTTP/1.1
Host: example.com
Connection: Keep-alive
Accept: */*
From: googlebot(at)googlebot.com
User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Accept-Encoding: gzip,deflate

网站: 这些标头太炫了!无论我的网站在美国、亚洲还是欧洲,你都用同样的标头爬行吗?你曾经用过其他标头吗?

谷歌机器人: 一般而言,我在全球各地所用的标头都保持一致。我试图从一个网站默认的语言和设定出发,搞清楚一个网页究竟长得什么样。有时候人们的用户代理各不相同,例如Adsense读取使用的是“Mediapartners-Google”:
User-Agent: Mediapartners-Google

或者对于图像搜索:
User-Agent: Googlebot-Image/1.0

无线读取的用户代理因运营商而异,而谷歌阅读器RSS读取则包含了订阅者数量等额外信息。

我通常会避免Cookies(因此不存在所谓“Cookie:”标头),因为我并不希望与具体对话有关的信息对内容产生太大的影响。此外,如果某个服务器在动态URL而不是Cookies上使用对话ID,通常我都能识别出来,这样就不用因为每次对话ID的不同而成千上万遍地重复爬行同一个网页。
网站:我的结构非常复杂。我是用许多类型的文件。你的标头说:“Accept:*/*”。你会对所有的URL进行收录,还是自动过滤某些文件扩展名?

谷歌机器人:这要取决于我想找什么。

如果我只是对常规的Web搜索进行检索,当我看到指向MP3和视频内容的链接,我可能不会下载这些东西。类似地,如果我看到了一个JPG文件,处理方法自然 就与HTML或者PDF链接有所区别。例如JPG 的变动频率往往比HTML低很多,所以我不太经常检查JPG的变动,以节约带宽。同时,如果我为谷歌学术搜索寻找链接,那么我对PDF文章的兴趣就会远远高于对JPG文件的兴趣。对于学者而言,下载涂鸦绘画(例如JPG),或者是关于小狗玩滑板的视频,是容易让他们分散注意力的,你说对吗?

网站:没错,他们可能会觉得被打扰到了。你的敬业精神令我佩服得五体投地。我自己就喜欢涂鸦绘画(JPG),很难抗拒它们的诱惑力。

谷歌机器人:我也一样。实际上我并不是一直都在做学问。如果我为搜索图像而爬行,就会对JPG非常感兴趣,碰到新闻,我会花大力气考察HTML和它们附近的图像。

还有很多扩展名,例如exe、dll、zip、dmg等,它们对于搜索引擎而言,既数量庞大,又没有多大用处。
网站:如果你看到我的URL“http://www.example.com/page1.LOL111”,(呜噎着说)你会不会只是因为里面包含着未知的文件扩展名就把它拒之门外呢?

谷歌机器人: 网站老兄,让我给你讲点背景知识吧。一个文件真正下载完成后,我会使用“内容—类别”(Content-Type)标头来检查它属于HTML、图像、文本还是别的什么东西。如果它是PDF、Word文档或Excel工作表等特殊的数据类型,我会确认它的格式是否合法有效,并从中抽取文本内容。但是你永远也不能确定里面是否含有病毒。但是如果文档或数据类型混乱不清,我除了把它们扔掉之外,也没有什么更好的办法。

所以,如果我爬行你的“http://www.example.com/page1.LOL111”URL并发现未知文件扩展名时,我可能会首先把它下载。 如果我从标头中无法弄清内容类型,或者它属于我们拒绝检索的文件格式(例如MP3),那么只能把它放在一边了。除此之外,我们会接着对文件进行爬行。

网站:谷歌机器人,我很抱歉对你的工作风格“鸡蛋里挑骨头”,但我注意到你的“Accept-Encoding”标头这样说:
Accept-Encoding: gzip,deflate

你能跟我说说这些标头是怎么回事吗?

谷歌机器人:当然。所有的主流搜索引擎和WEB浏览器都支持对内容进行gzip压缩,以节约带宽。你或许还会碰到其它的一些类型,例如“x-gzip”(与“gzip”相同),“deflate”(我们也支持它)和“identity”(不支持)。

网站:你能更详细地说说文件压缩和“Accept-Encoding: gzip,deflate”吗?我的许多URL都包含尺寸很大的Flash文件和美妙的图像,不仅仅是HTML。如果我把一个比较大的文件加以压缩,会不会有助于你更迅速地爬行呢?

谷歌机器人:对于这个问题,并没有一个简单的答案。首先,swf(Flash)、jpg、png、gif和pdf等文件格式本身已经是压缩过的了(而且还有专门的Flash 优化器)。

网站:或许我已经把自己的Flash文件进行了压缩,自己还不知道。很显然,我的效率很高喽。

谷歌机器人:Apache和IIS都提供了选项,允许进行gzip和deflate压缩,当然,节省带宽的代价是对CPU资源的更多消耗。一般情况下,这项功能只适用于比较容易压缩的文件,例如文本HTML/CSS/PHP内容等。而且,只有在用户的浏览器或者我(搜索引擎机器人)允许的情况下才可以使用。 就我个人而言,更倾向于“gzip”而不是“deflate”。Gzip的编码过程相对可靠一些,因为它不断地进行加和检查,并且保持完整的标头,不像 “deflate”那样需要我在工作中不断推测。除此之外,这两种程序的压缩算法语言都很相似。

如果你的服务器上有闲置的CPU资源,可以尝试进行压缩(链接:Apache, IIS)。但是,如果你提供的是动态内容,而且服务器的CPU已经处于满负荷状态,我建议你还是不要这样做。
网站:很长见识。我很高兴今晚你能来看我。感谢老天爷,我的robots.txt文件允许你能来。这个文件有时候就像对自己的子女过分保护的父母。

谷歌机器人:说到这里,该见见父母大人了——它就是robots.txt。我曾经见过不少发疯的“父母”。其中有些实际上只是HTML错误信息网页,而不是有效的robots.txt。有些文件里充满了无穷无尽的重定向,而且可能指向完全不相关的站点。另外一些体积庞大,含有成千上万条单独成行、各不相同的 URL。下面就是其中的一种有副作用的文件模式,在通常情况下,这个站点是希望我去爬行它的内容的:
User-Agent: *
Allow: /

然而,在某个用户流量的高峰时段,这个站点转而将它的robots.txt切换到限制性极强的机制上:
# Can you go away for a while? I’ll let you back
# again in the future. Really, I promise!
User-Agent: *
Disallow: /

上述robots.txt文件切换的问题在于,一旦我看到这种限制性很强的robots.txt,有可能使我不得不把索引中已经爬行的该网站内容舍弃掉。当我再次被批准进入这个站点的时候,我不得不将原先的许多内容重新爬行一遍,至少会暂时出现503错误相应代码。

一 般来说,我每天只能重新检查一次robots.txt(否则,在许多虚拟主机站点上,我会将一大部分时间花在读取robots.txt文件上,要知道没有 多少约会对象喜欢如此频繁地拜见对方父母的)。站长们通过robots.txt 切换的方式来控制爬行频率是有副作用的,更好的办法是用网站管理员工具将爬行频率调至“较低”即可。
谷歌机器人: 网站老兄,谢谢你提出的这些问题,你一直做得很不错,但我现在不得不说“再见,我的爱人”了。

网站:哦,谷歌机器人…(结束应答):)

***************

极酷的Google韩国分站首页

google_korea_hp_1.gif

 不少朋友可能早就已经知道,作为世界上互联网普及率最高的国家之一,韩国的网络极发达,网速也极快。可能正是由于有这些条件,所以韩国的网站很喜欢使用大量的图片设计或直接用Flash制作。我们都知道Google早在2001年就已经开设了韩国分站,即google.co.kr。入乡随俗,Google韩国分站的首页竟然也跟随着韩国的网站设计潮流而做出了改变。

  注:已补充中文版!  进入Google的韩国分站首页,你会发现它的设计与传统的Google首页截然不同,里面不但每个选择都有对应的图标,鼠标经过时还有很漂亮的动画效果:

google_korea_hp_2.gif

 看起来很像之前流行一时的Google X?没错,的确是很像,但这个是Google官方版。

Google News官方披露优化技巧

Google News以机器算法自动聚合新闻内容而著名,尽管它还不完美。但可以肯定的是,无论你的新闻网站是什么类型,一旦被Google News选为新闻源,那么它将会给你的网站带去非常可观的流量及新用户。一个很好的例子是FT.com在将部分内容免费及向Google News开放后,半年内流量增长了75%,注册用户增加了23万。正因为如此,一些与Google News有关的优化技巧就传开了。到底这些所谓的优化技巧当中,有多少是真的有效的呢?

Google News官方今天进行了鉴证。以下优化技巧/事实经Google证实为有效
1.文章发布后再进行更新,更新内容不会出现在Google News上。
这是因为Google News的爬虫只访问每篇文章的链接一次,因此在文章被抓取到Google News后,文章所进行的更新是不会出现在Google News里的。

2.以纯图片或视频为内容的文章不会被Google News抓取。尽管Google News的爬虫可以抓取多媒体内容,但前提是多媒体内容比如图片和视频得要有相关的文字描述,否则爬虫就会略过它们。原则上,文章的文字内容更多,被抓取的机会越大。
3.网站架构/布局的彻底改变将影响Google News抓取。当网站的架构/布局有了极大的更变后,Google News爬虫就可能无法浏览你的网站,又或者需要更长时间才能浏览你的网站,找到新闻内容。如果你的网站不得不进行这种程度的改版,请参考这里与Google News联系。
1.在文章附近加上图片能改善排名。

这样做的确可以增加图片在Google News上显示的机会,但它对文章本身在Google News上的排名完全无影响。

2.文章发布的时间会影响文章的排名。

Google News爬虫是持续寻找新内容的,因此无论你何时发表文章,发表时间都不会影响文章在Google News上的排名。比如在相同的新闻主题报道上,不管你的文章是在同类文章发布之前、之后或之中被发表,都不会影响你的文章在Google News上的排名。此外,如果一个新闻源总是将别人的原创文章进行”加工”以试图获得更好的Google News排名,那Google News就会对该新闻源进行惩罚。

3.你无法知道文章为什么不被Google News抓取。

事实上,你可以通过Google网站管理员中心再监测你的文章所发生的错误。

4.发布sitemap可以改善文章排名。

尽管给新闻文章创建sitemap有助于Google News爬虫更轻易找到内容,但这种行为本身却不会影响文章的排名。

5.给网站加上Google AdSense广告可以改善文章排名。

这是一个最常见的误传。事实上,给网站加上AdSense广告并不会对文章的抓取或排名造成任何影响。

Google完成收购DoubleClick的交易

 据Google官方博客报道新浪科技翻译),Google今天宣布,该公司已经完成了对网络广告公司DoubleClick的收购。
  Google董事会主席兼CEO埃里克·施密特(Eric Schmidt)表示:“谷歌收购DoubleClick交易已经完成,我们对此感到非常高兴。通过收购DoubleClick,Google拥有了行业领先的显示广告平台,它可以帮助我们面向市场推出更先进的技术和基础设施,从而为发行商、广告客户和广告代理提高数字媒体的有效性、可测量性和表现,以及为用户提高广告的相关度。”
  周二早些时候,欧盟监管部门正式批准了Google对网络广告公司DoubleClick的收购,认为这一交易并不会削弱网络广告市场的竞争。欧盟表示,经过深入的市场调查,并未发现Google收购DoubleClick将导致其它竞争对手出局的证据。这主要因为微软、雅虎和AOL提供了可靠的替代广告产品或服务,消费者在Google和DoubleClick之外仍然有很多选择。去年12月,这一交易率先获得了美国联邦贸易委员会的批准。

Google发布管理员支持论坛中文版

发表者:李露

今天,Google 正式推出中文版网站管理员支持论坛 。目前,Google 网站管理员支持论坛已经拥有了包括英文、德文、法文在内的多达二十种语言版本。此次中文版论坛的建立旨在为中文站长们提供一个互相交流和与 Google 工作人员直接交流的平台。你会发现一些成员的名字旁有蓝色 G 标志,这代表此用户是来自 Google 网站管理员支持小组以及搜索质量小组的成员,他们会参与部分讨论,回答网站管理员普遍关心的问题并维护论坛。我们欢迎更多站长和业内人士加入我们,将你在建站和搜索引擎抓取收录等方面的经验与大家分享,成为论坛的粉丝用户(我们称那些积极发帖为论坛成员提供建议和帮助的活跃分子为“粉丝用户”)。

值得强调的两点是:1. 只有名字前带有蓝色 G 标志的才是来自 Google 的成员,他们有包括删垃圾贴的权利;2. 我们为大家准备了详细的 Google 攻略,在发帖提问前不妨先尝试利用现有资源或在论坛内找找看,这样您可以在第一时间得到答案,也避免了资源的浪费。

我们在论坛首页已经列出了 Google 专为站长提供的资源链接, 这里再简要介绍一下:

Google 网站管理员中心 - 站长资源的集中站。这里提供了包括网站管理员工具,帮助中心,管理员博客等的链接。是通向所有 Google 为站长专设服务的大门。

Google网站管理员工具 - Google 对网站抓取和索引编制的统计、诊断和管理,包括 Sitemap 提交和报告。关于管理员工具的使用,在《 Google(谷歌)的网站优化利器—中文网站管理员工具》 已有详述。

Google 网站管理员博客 – 有关 Google 如何抓取网站并编制索引的最新资讯和信息。有来自 Google 的资深工程师、搜索质量小组成员发表的文章,同时,也有译自英文网管博客以及 Matt Cutts 博客中的文章。

Google 网站管理员支持中心 - 为中文管理员专设的支持中心,涵盖了关于抓取、编制索引、排名和其他网站管理员问题的常见问题解答。我们非常鼓励管理员充分利用该帮助中心,并通过反馈为我们提出内容和形式上改进的建议。

Google在德国遭遇断网近两小时

  当你打开浏览器,试图查看Gmail邮件时,却发现一直打不开Gmail网站。然后你试图上Google主页,同样也提示超时。难道Google被x了?!于是你赶快想上Google Docs将你刚刚做到一半的工作表格下载,但同样发现它已经无法访问。在绝望的时候,你甚至还发现就连想上Google Reader看看别人是否有相同的遭遇都不可能,因为它也无法访问了。最后,你发现所有Google相关的网站都无法访问……

  这并不是天方夜谭,而是昨天发生在德国的真实情况,Google在德国遭遇断网近两小时!德国电信固网业务部门(T-Com)所有用户都无法访问任何Google官方网站,就好像Google突然消失了一样。那是不是像xx电信一样故意搞鬼不让用户访问Google?不一定,因为德国电信随即发表声明称自己也无法访问Google,并且经调查没有发现自己的网络有问题。而Google德国发言人即告诉Philipp,承认了无法访问的事实,并表示正在调查原因。有德国媒体称Google的断网是从下午15:00或16:00开始,直至17:32分才恢复。

  不管原因是什么,这样的情况绝对是灾难级的。试想一下你的工作邮件、工作文档、日历行程、新闻来源、搜索引擎等等极重要的东西,一下子消失了,这会是怎样的可怕。再次证实了互联网并不是安全的,不要把所有鸡蛋放在同一只篮子里。难怪就连Google的Matt Cutts,也在2008年的预言里预测今年内将会有人专门编写Google备份工具,将用户储存在Google上面的所有数据都完整备份至电脑里。但令人遗憾的是,这样的工具至今还没出现。

  当然,目前你也可以借助Google提供的同步工具,手动或自动将部分重要的资料备份至桌面。比如用Outlook备份Gmail,用昨天发布的Google Calendar Sync备份/同步Google Calendar,手动下载Google Docs文档,等等。

Google工具条PR更新与排名变化的迷思

这几天Google工具条PR又在更新了。我感觉更新还没结束,显示PR数据准确性很值得怀疑。

现在对Google PR更新本身越来越不感兴趣了。因为基本上没有大的造链接活动,PR值也不会有什么太大变化了。不过看到网上有一些关于PR更新及网页在Google中排名变化的一些迷思,觉得还是有必要把自己的一些理解跟大家介绍一下。

Google工具条PR不是真实的PR

大家所看到的工具条上显示的绿色条,更准确的应该称为可见的工具条PR值,而不是Google内部用于排名计算的真实PR值。

Google真正使用的PR值是连续不停的计算的,并不是每三个月或两个月改变一次。我们看到的工具条PR是一段时间以前(比如两个月或三个月)某一个时间点的PR值输出。所以我们现在看到的工具条PR值,已经是两三个月前的数据。现在真实的PR值是多少是无法知道的。

另外,工具条上显示的PR值是否是输出时真实的PR值,我也表示怀疑。不仅是这次更新,从很多次更新的情况看,要么Google有意不告诉我们真实PR值,要么很多网站的数据出现了错误。

Google工具条PR更新与排名变化没有时间对应关系

在论坛里看到不少人说,Google PR值更新,网站PR提高了一或二,怪不得这几天排名也上升了。

其实Google工具条PR更新与Google排名之间没有时间上的对应关系。像上面说的,真实的PR是连续不停计算的,而且是随时被计入排名算法的。更新后我们看到的工具条PR值所带来的效应在几个月前就已经被计入排名了。

所以不要从工具条PR值上升,来判断对网页排名有什么影响。如果你同时看到工具条PR值上升和排名上升,最好找其他原因,这是时间上的巧合,而并没有直接因果关系。

Google PR只与链接有关

经常看到博客留言或论坛中有人说,我的网站已经两年了,为什么PR还是零呢?或者,我的网站内容全是原创,为什么PR还是零呢?

原因是,PR值与站长是否认真,内容是否原创,网站设计怎么样,甚至与域名年龄,都没有直接关系。

PR的计算只是根据反向链接,进来的链接越多,这些链接页本身的投票力越高,你的网页PR值就越高。所以就算你的域名已经十年了,如果没有反向链接,PR值也高不了。

最近几个月有可能出现一些看似的例外。有的网站因为付费链接问题被惩罚,PR值要么下降,要么清零。目前不知道这些网站PR值变化是人工调整,还是因为算法检测出付费链接后取消某些链接的投票力,而造成与之相关的其他网站PR值变化。总之,还是与链接有关。

Google已经不跳舞很久了

在论坛里还会看到有人用Google dance这个词,有的专家到现在也还在说Google dance。

其实Google已经不dance很久了。

Google dance这个词是数年前形容Google每个月一次大更新而创出来的词。那时候的Google更新,是网页数据库,算法,各数据中心之间的同步全部发生彻底变化。Google已经不进行这种dance四年多了。

现在的排名变化更多的是因为算法更新数据刷新而引起的。而且算法更新现在的特点是小规模不停的调整(everflux),那种大规模的更新已经十分十分少见。

以前的真正的Google dance和现在的排名变化特征并不相同。所以用Google dance这个词对某些初学者来说可能有误导。

作者: Zac@中新虚拟主机
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

Google搜索结果里再加搜索框?

blogoscoped报道,Google搜索结果又添新花样。

Google搜索结果中有时出现sitelinks,今天对出现sitelinks的一些网站下面又出现了一个搜索框。比如搜索“新浪”:

sina-onebox.gif

在搜索框里再搜索,相当于直接搜索“关键词 site:sina.com.cn”,也就是在sina.com.cn站内搜索:

sina-onebox-2.gif

目前看来只是有sitelinks的站才加这个搜索框。但不是所有有sitelinks的站都加,点石就没有:

dunsh-sitelinks.gif

这个功能大概还在测试中,Philipp自己还看不到这个搜索框,有人说只在美国能看到,有人说不是。至少我在新加坡能看到。只在google.com出现,在google.cn还没有。

域名的权威度越来越重要了,不仅对排名重要,出现在搜索结果中也越来越醒目。

作者: Zac@中新虚拟主机
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。