分類彙整: 搜索引擎

细说 AdSense 政策 – 什么是“版权材料”

作者 AdSense 政策专员 – AdSense 政策小组

在前面的“细说 AdSense 政策”系列中,我们陆续介绍了一些常见的政策问题。今天,我们再向大家介绍一下另一个非常常见的政策问题 – 版权材料问题。

顾名思义,“版权材料”就是指在未经版权所有者授权的情况下使用的材料,包括电影,电视剧,电视节目,音乐和歌曲(mp3,铃声,flash),漫画,书籍,软件等。

如果您网站上使用的这些材料有明确的版权所有人(公司或个人),而您在没有该版权所有人的正式授权(具有法律效力的授权书)的情况下使用这些材料,您的网站内容就属于版权材料,就违反了我们的计划政策。

需要强调的是,您网站上的版权声明(例如“本站所有内容均搜集与网络,如果侵犯了您的版权请立即通知我们,我们会立即删除”)是没有任何法律效力的。如果您没有版权所有人的授权,仍然是版权材料,仍然违反了我们的计划政策。

下面我们就举几个版权材料的具体例子:
1. 电影或电视在线观看或下载网站,如果没有出版公司的正式授权,这些内容就属于版权材料。
2. 音乐在线视听或下载网站,或使用歌曲做手机铃声下载的网站,如果没有出版公司的正式授权,就属于版权材料。
3. 漫画网站,如果使用的漫画有明确的版权所有人,并且没有版权所有人的正式授权,就属于版权材料。
4. 在线书籍或小说网站,如果该书籍或小说已经正式发表并有明确的版权所有人,如果没有版权所有人的授权,就属于版权材料。
5. 软件下载网站,如果软件有明确的版权所有人和发行公司,在未经版权所有人授权情况下提供的下载以及任何其他形式 – 如破解版、绿色版、汉化版等都属于版权材料。

另外,有些发布商来信说他的网站服务器上并没有这些材料,并不提供这些材料的直接下载,而只是提供下载链接,问算不算版权材料。我们的回答是:这样的网站内容仍然是版权材料,不符合我们的计划政策。我们不允许发布商直接或间接利用非法版权材料赚取 AdSense广告收益。

请注意,AdSense 所有的广告都不可以展示在版权材料的网站上,包括 AdSense for Content,AdSense for Search,移动广告和推介。同时,发布商也不可以在版权材料的网页上做导向放有广告或推介页面的链接、图片或flash,这同样是违反我们政策的。

如果我们发现含有大量版权材料的网站在投放 AdSense 广告,我们会停止广告的展示,并向发布商发出警告。对于严重违反政策的发布商,我们会停用账户,该发布商将再也不能参加 AdSense。

说这么多,就是希望让发布商对什么是版权材料有一个清楚的了解,帮助大家保证自己的网站符合我们的政策。我们希望广大发布商都能遵守我们的政策,同时,如果发现了违反政策的行为能及时通知我们,与我们一起维护 AdSense 网络的质量。非常感谢大家!

Google PR更新

早上起来一看Google Toolbar 上面的绿块,很多站的PR都已经刷新,这是很多SEOer期待已久的事情。

随便看了一些站,观察了一些5月份后增加的栏目和文章,PR由原来的0升到2-3不等,不过有点意外的是有几个8月份注册的域名PR也都上升到3了,也有部分由3降低至2,当然,本次更新来的比较突然,
仿佛就在一夜之间,关于还会不会有什么新的变化或者调整,我们继续关注中,赶快Check一下你的站点吧!

作者: 枫林&SEO博客

百度的搜索结果是通过人工编辑的?

试试在百度中搜索”Google Reader“,你会发现一个奇怪的现象

via 在百度中搜索”Google Reader”

分析一下访问Google Reader会被,重定向Google Account的登录页面,这个页面是经过SSL加密,所以爬虫才会访问不到

update:

看了一下google的robots.txt,发现一个问题

http://www.google.com/robots.txt

有一行 

Disallow: /reader/

这表明这个页面是不因该被收录的,但是包括Google本身的搜索引擎都没有遵守这个规则。

这个页面看起来的确是人工加上去的

谷歌在中国不是Google

这篇文章虽然有点老,但还是拿出来复习一下。
在中国,很多年轻人都把李开复当作名人。虽然不是像陈冠希或者演唱组合F4那样,但是这个44岁,总是身着一身灰色的计算机专家肯定能吸引一大堆粉丝。当 这个谷歌中国公司的总裁在中国的大学发表演说,讲中国的年轻人如何该和世界上其他地方的青年竞争的时候,黄牛党会把门票炒到60美元一张。还有一次,李开 复演讲的会场里有8000名听众,学生们被李开复的每一句话所吸引。

不 难看出为什么李开复被崇尚科技的中国年轻一代视为偶像。他在台湾长大,之后去了美国,中英文都很熟练。在去年加入谷歌以前,他曾在加州为苹果公司工作,之 后又效力于微软中国。他一手建立了位于北京的微软亚洲研究中心。他个人曾出版了”Be Your Personal Best,”一本卖得很好的励志类书籍,内容是关于中国学生需要接受有承担风险的精神的美国资本主义制度。七年前,他建立微软实验室的时候,就聘用了十几 个中国顶尖的毕业生。现在他又在谷歌重复这样的步骤,“中国的学生绝对不同凡响。”他在北京和我见面的时候这样说。“他们有巨大的学习的欲望。”

仁.亚.软件

在 讲述科技带来的巨大解放的时候,李就像是一个传教士。他说,网络会给中国广大农村地区的人们带来更平等的机会。一旦国内的小乡村也实现了网络化,距离北京 或者上海几千里之外的学生也能够学习麻省理工或者哈佛的网络课程,从而解决受教育的问题。李在去年夏天才加入谷歌,但是他身上早已经带着谷歌员工的那种热 诚和理想化的信念。当他从微软离职的时候,他在个人网页上发表了一封感情洋溢的公开信,赞扬谷歌将信息传播给大众的这种使命感。他用了一个公式作为结论: 年轻+自由+平等+ 颠覆+创新+用户为本+不要做坏事=谷歌的奇迹。

仁^亚^软件

当 我拜访李开复的时候,谷歌的奇迹正在北京的商业区的办公室里被进行着。这些小办公室看起来就像是在匆忙中租下来的。狭小的房间里挤满了穿着T-SHIRT 的年轻人,围着巨大的纯平显示器,讨论谷歌的新程序代码。“我们这些人所抱的理想都是非常高尚而重要的,“李告诉我,“如何做出用户喜欢的东西,然后考虑 下一步如何盈利。还有就是不要做坏事。” 李开复指的是谷歌公司的格言。“不要做坏事—我想我在内心深处始终是一个理想主义者。”

仁^亚软件

但 是谷歌最近几个月在中国的行动看起来却不怎么理想主义。在一月份,也就是李开复开办北京办事处不久,公司宣布将在中国市场推出新版本的搜索引擎。为了遵守 中国的法律,谷歌同意净化所有中国政府不赞成的搜索结果。这其中包括法X功;宣扬言论自由的网站;或者任何提及天X门XX的网站。如果你搜索“西藏”或者 “法XX”,中国以外的 google能给出几千个博客,新闻,还有讨论组。但是在中文谷歌上试试,绝大多数的链接都不见了。谷歌把他们删得一干二净。

谷歌的决定在美国反响极差。一月份,公司主管 被召到国会听证会,他们的行为被拿来和纳粹合作者相比。公司的股票下跌,抗议者举着标语在公司总部外抗议。谷歌虽然并非唯一一家在最近由于中国问题而受谴 责的美国科技公司,而且也不是做的最过分的。然而谷歌的管理者却应该另当别论。当公司在两年前上市的时候,公司年轻的创始人,Sergey Brin和 Larry Page 在写给证券所的文件中说,谷歌是一个值得信任的,关注公众利益的公司。谷歌现在却和压制自由的中国政权合作,他如何自圆其说?

我 很难准确的了解李开复对于公司和中国政府的合作持怎样的态度。作为我和李开复会面的条件,谷歌不允许我提起有关此类的问题,只有公司在加州的总部才被允许 谈论此话题。但是当我和李谈起网络是如何改变中国的时候,他的一个观点颇能说明问题:他所雇用的中国学生,其实并不渴望民主。“人们其实可以自由地谈论这 个话题,他补充说,(指的是民主和人权问题)我不认为他们在乎这个。我认为大家会说:“美国民主,那是好东西。中国现在的繁荣和稳定,也是好东西。不管怎 么样,我现在能去我喜欢的网站,能看到我的朋友,过得开开心心。”李开复说,当然,关于自我的表达,公开发表言论,已经变成了中国年轻人当中的热门话题, 这是由于互联网的普及以及博客,论坛已经遍布中国。“但是我不认为这有什么政治含义,”李接着说,“我认为只是越来越多的人发现他们可以表达自己,并且被 别人听到。他们喜欢这个,这样就够了。”

这样的话在我听来,就像是含糊的政治见解—一种缩了水的言论自由的概念。但是当我和 中国的年轻一代网民相处一段时间以后,我听到的都是略有不同的类似观点。年轻+自由+平等+不要做坏事这是一个等式,包含着几个恒量,却有着许多个可能的 解答。当下,对于中国人来说,何谓自由?审查制度也有层次之分?限制信息也有好坏之分?在美国,这样的问题根本就无法被接受—对话到这里就该结束了。 但是在中国,正如谷歌所发现的那样,对话才刚刚开始。

文化差异

事实上,谷歌在中国 并不是先驱。雅虎是第一家进入中国市场的美国网络公司,在1999年就推出了中文网站,并在北京建立了办事机构。雅虎的决策层很快就认识到进入中国是多么 困难—而且文化的障碍对于美国人来说是何等的巨大。例如,中国的生意人在沟通的时候不喜欢留言,留信息这样的方式,他们倾向于使用手机和短信。(我在联系 一个中国总裁的时候就遇到对方电话关机,而且不能使用留言的情况)对于中国网民而言,网络最吸引人之处—这一点和美国不太一样— 就是论坛。成千上万的关于不同问题的争论在论坛上出现。百度,一个2001年推出的中国搜索引擎,雅虎的早期竞争者之一,发明了一个讨论工具。允许人们对 当前的热点搜索项目进行即时讨论。用户现在如果在百度搜索nba巨星姚明的话,他们找到的不只是关于他比赛的报道,他们还能加入和姚明有关的成千上万个聊 天室。百度的聊天室每天会有超过5百万的发帖。

正如雅虎所发现的那样,这些文化上的细微差别导致了美国公司的网站对于中国用 户而言太外国化了。也使得这些用户转投那些中国网站。这其中包括了新浪和搜狐。这两家网站的搜索引擎不那么好用,但是充斥着论坛聊天室还有政府批准的中文 网站。高涨的民族情绪可能也有关系。“现在大家都有一种强烈自豪感,要支持自己人。”香港城市大学的LIH告诉我。

雅虎在另 外一股席卷中国的浪潮里也走得太慢了:盗版的浪潮。自从Napster事件以后,西方国家普遍都把上网免费下载音乐和电影看作违法行为。当然在西方这种现 象还是很猖獗,但是自从iTune的成功以后,更多的人愿意付费。在中国,下载盗版音乐,电影和软件就和上网查看天气预报一样平常。百度的总裁发现很多年 轻人都在网上找盗版mp3,所以公司就专为此目的开发了一个界面。一天下午,当我在北京的一家网吧里的时候,隔着几张椅子的一个年轻人正在吸着可乐,看着 下载的《最后的武士》,他的朋友则在使用百度来下载50cents乐队的新专辑。“差不多五分之一的百度流量来自mp3的搜索,这个在美国肯定不合法。 ”robin李,37岁的公司创始人说到,“现在我觉得唱片公司可能对我们提供的服务不太高兴。”他最近这样告诉我,“但我认为数字音乐是一种趋势,无法 阻挡。”

一开始,谷歌在进入中国市场上的策略和雅虎就不同。2000年早些时候,谷歌的工程师悄悄地开始研发能够接收中文, 日文,韩文的系统。到了年底,一个勉强能用的中文版google就诞生了。2001年的时候如果你在中国上网,谷歌的服务器就会检测到你的位置并自动连接 到中文的界面。法文版的谷歌系统也是这样运作的。

就在百度吸引大批喜欢下载mp3的年轻人的时候,谷歌却在另一些人那里受到欢迎:中国大城市里面的白领,那些接受西方文化,说话夹杂着英文单词的,一个认同全球视野多于民族情绪的阶层。

靠着吸引这些人,谷歌在2002年底成功超越了雅虎,占领了中国搜索引擎流量的四分之一—这样的成绩完全是在加州的公司完成的,远离中国政府的影响。

防火墙构成的万里长城

接 着在2002年9月3日,谷歌消失了。中国人在那天发现网站被封锁了,只剩下一个错误信息。中国政府开始封锁谷歌。中国在网络审查上主要依靠两个手段。对 于境内的公司,政府使用一系列惩罚和恐吓手段来保证内容的干净。对于境外的网站,政府使用另一种卓有成效的控制方法:被称作网络上的中国万里长城。

当 你在使用网络的时候,你感觉似乎是无形无界的。实际上却不是。通过光缆传输的信息需要经过真实的国境线。中国一共有三条光缆主线,中国的网络就以此来和世 界连接。中国政府要求管理这些网络的公司设置路由端口,在国内外网络的交接处。其中一些设施是由sisco思科公司提供的,一家美国公司,作为中国的新审 查员。

如果你用北京的一台电脑进入一个服 务器在芝加哥的网站,你的浏览器就会发出一个请求,这个请求就会通过光缆传到审查的路由那里,然后被检查。如果请求的网站在中国政府的黑名单上—长长的名 单—而且还在增多—请求被拒绝。如果请求没有被拒绝,路由接着就会检查所请求的网站上有没有敏感词汇。如果网站包含一个类似“法X”或者1989XXX之 类的,路由就会阻断信号,回到网吧,你就会看到浏览器给出一个错误提示。这个过滤系统的复杂程度让人惊讶,可以让某个网站的一些网页通过,同时封锁一些页 面。当我在北京的网吧上网,我可以浏览BBC的娱乐和体育页面,新闻页面就打不开。

谷歌给审查者们带来了特殊的问题:由于当 时谷歌在中国并没有办事机构,中国政府无权干涉,也没有能力让谷歌主动清除搜索结果。这样,网络长城的功效就只有一半了:它能够屏蔽谷歌的搜索结果所指向 的网站,但是却没法阻止人们看到被禁网站的列表。例如你在上海,然后搜索人 权,你可以搜索到包括中国人权组织在内的被中国政府屏蔽的网站。但是当你试图点击链接试图进入的时候,你就又会得到一个报告错误的提示信息。政府官员不喜 欢这种状况–中国人由此能感觉到,他们的领导人对什么话题感到了威胁—但是谷歌很受欢迎,他们也不敢完全屏蔽。

在2002 年,状况发生了改变。中国政府决定全面屏蔽谷歌。为什么?各种理论充斥着。谷歌的创始人sergey告诉我,他怀疑是某个竞争对手从中挑拨—某个中国的竞 争对手。但他很老练地没有给出任何一个名字。但是很多美国的网络总裁都相信百度在谷歌被封的事件中直接受益。一个在北京的合资企业家告诉我,屏蔽谷歌的幕 后挑拨者就是百度, 2002年,百度的市场占有率比谷歌低3个百分点。“百度的一些人就坐下来找了上百个能让谷歌被封的证据。”她说,(她坚持要求匿名,以免遭到官方的报 复)“接着百度的人就拿着这些结果找到政府,说,看这些有危害的东西都是在谷歌找到的,这就是谷歌被封的原因。“百度坚决否认指责。当我和北京社科院的一 位教授谈起的时候,他也否定对于百度的指责,争辩说百度本来就要比谷歌强,而且更了解中国人的需要。然而,许多了解内情的人都告诉我,中国本土的网络公司 经常向政府反映竞争对手的网站内容,以此希望对手遭到打压。在中国,审查制度不只是一个政治工具,而且还是一个竞争工具—一根公司之间互相捶打对方的大 棍。

自我审查有奖

10月份的一个晚上,当我去到一家网吧的时候,那里120多个机 位已经被年轻人们占满了。(因为电脑和家庭网络还是很昂贵,所以很多年轻人都是去网吧上网,享受低廉的价格和高速的带宽—还有冷饮)每个人看起来都准备好 好地享受一整个晚上:年轻的女孩穿这粉红色和黄色的hello kitty的运动衫,在几个聊天窗口之间切换。楼上一帮穿着橄榄色军装的年轻中国士兵,欢笑着徜徉在中世纪幻想的魔兽世界里。在一堵墙边,挨着一副褪色的 功夫电影海报,贴着一行字:请勿浏览色情及违法网页。这个告示几乎没有任何作用;这里的每个人看起来根本不会去浏览关于天X门事件的网站。我询问了网吧的 老板,他的顾客会不会经常浏览非法的内容。不经常,他笑着回答,就算有,也是黄色网站。他觉得封锁非法信息应该是政府的事。“政府不准看,那就是不该看。 ”

对于中国,西方人经常会犯的一个错误就是假设,政府进行审查是偷偷摸摸的。恰恰相反,党对于这个问题非常的诚实 —甚至是骄傲。一个不愿意透露姓名的美国商人告诉了我一件事,关于他参加一个中国网络公司协会的颁奖礼,其中出席的包括主要的网络服务提供商。“我当 时坐在听众席,然后他们就说,现在宣布年度自律奖!然后宣布了10个公司,给他们发了奖牌,然后握手。一位部长也在那里,还和每个人都拍了照。这基本上就 像是自我审查优秀奖—然后每个观众都在鼓掌。”这位商人解释说,中国的网络审查,是警察的一项额外任务。一月份,深圳公共安全部门推出了两个可爱的卡通形 象“网络警察”,被命名为JINGJING和CHACHA,每个网络警察都有博客和聊天窗口,市民可以和他们聊天。北京青年报引用深圳官员的话“这两个形 象的主要作用是震慑。”文章接着解释说这两个形象主要是公开提醒所有网民,注意安全和健康地使用网络,自我规范网上行为,创造和谐网络环境。

震 慑和“自我规范”,事实上在党使用审查制度控制私营网络公司方面很关键。要获准经营网络业务,私人公司必须签订一份协议,不允许包含某些特定话题的内容出 现,包括“扰乱公共秩序或破坏稳定团结”,“损害国家荣誉和利益”,或者“违反国内风俗和习惯”。有一项禁令特别针对邪教或者其他迷信,这是很清晰地指向 法XX的。但是整个协议的表述,有意地搞得很含糊。随便哪一级哪个部的官员都可以要求把他认为过分的内容清除掉。

国家信息产业部的官员每周都会召集各大网络服务公司的管理者开例会—特别是拥有新闻,博客和论坛的那些—讨论那些新的话题可能在本周出 现,而且最好被清理掉。“私底下我们都叫他吹风会。–换句话说,就是会吹哪个方向的风。”那个美国商人说到。政府官员会在几天前就发出警告。

美 国的网络公司在刚来中国的时候,都希望政府能够提供一份官方的黑名单,以及需要审查的敏感词。他们很快发现这样的清单根本不存在。取而代之,政府只是要求 公司模糊地去进行自我规范。所以公司必须要参透中国的政治,从而自己了解什么东西政府会不喜欢。去年网上曾经流传着一个清单,据传是政府给博客公司的黑名 单。事实上,这份黑名单是中国一家博客公司的一位年轻总裁自己整理的。每一次政府要求清理一个帖子,他就留意哪些内容是政府针对的。过了一段时间,他就开 发出了自己的黑名单,让自己的公司以后免遭斥责。

不服从 自我审查规范的后果很严重。一位美国的公共关系顾问最近在帮一家中国门户网站工作时见到,一天下午,警察冲进公司办公室,把CEO拖进了会议室然后严厉斥 责他没能阻止违法内容。“事后他脸都吓白了。”这名顾问回忆说,“你必须理解,这些人都被吓坏了,真的吓坏了。他们很害怕被抓去坐牢。每天坐在办公室里, 他们都在想着这种事。”

这样的结果就是,中国的网站总是 会审查清除掉甚至比需要的还多的内容。中国这一整套体系是建立在一个经典的心理学事实上的:自我的审查永远要比官方的审查更全面更彻底。让每一件网络公司 都各扫门前雪,政府就有效地控制了用其他方法难以监控的数十亿电子邮件,新闻,论坛话题。政府采用的方法看起来就像是让公司去自己揣测,然后时不时,怒气 冲冲地要求网站在24小时内清理某些内容。James,一位美国的中国问题专家说:“他们的执法总是充满着随意性,让人觉得他们就是在监控所有事情。

政 府的监控虽然很全面,但也有不灵的时候。某一天可能某个被禁的站点又突然看得到了,多数是由于路由器超出负载,或者政府突然决定容忍这个网站。第二天,或 许这个网站就又消失了。总的来说,网民的举动都是很小心的。他们很少触及政府的戒条。在中国有许多不能够跨越的界限,大家不用经常谈论这个,但每个生活在 其中,了解中国文化的人都或多或少的理解这些界限。这也正是美国公司对中国的环境感到困惑的原因。什么是被允许的?什么是被禁止的?

对 比美国人经历的彷徨,当我问起中国的商人,政府的审查制度对于公司到底难不难操作。“我告诉你,绝对不会比在美国提交财政报表难。”XIN YE,sohu的创始人这样说。还有一个晚上,我和CHARLES CHAO,新浪的总裁在上海一家爵士酒吧喝酒的时候,我问其他,多长时间他需要把新浪论坛上的帖子清理一次。他回答:“不太经常。”我问他,不太经常指的 是一星期,一个月还是更久。他提出了反对,我不认为我应该谈论这个。虽然这样,他却没有因为我问的问题而感到困扰,“我不想把这个叫做审查制度,这就像每 个国家都会有一种倾向。在美国也有些宗教禁忌不能谈论,大家都知道这个。”

阿里巴巴网站的老板JACK MA说的更直接“我们不想让政府生气。”我是在十月份的一天,在北京中国国际宾馆的大堂见到他的。MA的公司刚刚被雅虎收购了40%的股权,MA全权负责 雅虎在中国的经营。他对于网上言论的看法是:“任何在中国属于非法的东西,都不会出现在我们的搜索引擎上。我们只是做生意。股东要的是分红,股东希望我们 的顾客能够高兴。同时,我们也没有义务要在政治方面做这个做那个。忘记这个吧!”

小小的革命

去 年秋天,在北京星巴克,我遇到了中国最著名的政治博客写手,ZHAO JING。他是一个31岁,穿着讲究而又帅气的人。当他说起90年代晚期网络的到来让中国发生了巨变的时候,言语中透出喜悦。政府之前控制了所有的媒体, 但是中国的老百姓可以上论坛或者建立自己的博客了,这就像是解开了一把锁。就算你再谨慎,不愿谈论政治。你也可以只是公开的发表你对其他事情的见解— 天气,体育—感觉上真是一场小小的革命。ZHAO(他现在就职于纽约时报北京分社)在言论方面要比大多数人都大胆,越界。大学毕业后,ZHAO在一座 小城市的旅馆里做了接待员。他觉得如果自己够幸运,有一天也会有自己的事业。1998年他开始上网,开始意识到他真正想做的事情其实是谈论政治问题。他开 始撰文发帖。在网上写了一段时间以后,一家报社的编辑就请他去做记者了。

“这就使网络的作用。”ZHAO说着,并露出一丝微 笑,“我只上网了一个星期,就在省内外都出了名。我之前从来没想过自己能写东西。但我也意识到问题不在我,而是我居住的这座小城市。”ZHAO在 2003年3月丢了工作,由于他所在的报纸发表了关于一位支持政治改革的退休官员的文章,政府报复性地查封了报纸。但是ZHAO仍然渴望写作,因此就在一 个服务器在英国的博客网上安了家。他以安替作为笔名,写了很多诙谐的支持言论自由的文章。这些文章很快就吸引了成千上万的读者。八月下旬,政府使用防火墙 封掉了他的网站,这样在中国就没人能看到了。他转而使用微软的博客,MSN SPACE。虽然政府还在监控他的文字,但安替却仍然大胆地在写。安替告诉我,他知道自己很安全,因为他知道哪些界限不能碰。

“ 如果你只是每天上网写东西,批评政府,他们不会介意,”他说,“因为这只是言论。但如果你想组织一些人—哪怕只有三四个—那他们就要来收拾你了。因为 这不是言论,而是有组织有预谋。人们说我很勇敢,但其实我不是。”网络给安替带来了一定的政治影响力,但他说起自己的博客对政府能产生什么影响时,却不怎 么兴奋。更让他兴奋一点的,是他对自己的认识不断发生变化。还有几个中国的年轻人也是这样告诉我的。如果网络能给中国带来一场革命,那么革命也肯定是通过 每个人的自我实现,通过许许多多微小的,平凡的方式。

一天下午,我去拜访了一位29岁的中国女士,JIANG JINGYI。她在EBAY开了一个网上服装店。当她打开自己在上海的繁华地区的公寓大门的时候,我感觉自己突然撞进了一间别致的SOHO流行时装店。三 排衣架挂满了冬天穿的夹克,起居室的中间堆着运动衫,还有整齐地摆放着的跑鞋和靴子。我们坐在她摆了四台电脑的卧室里喝茶,JIANG通过翻译告诉我,她 以前是一个设计师。但她自己很喜欢开店。所以有一天就决定在当地的服装厂进一些便宜的衣服,然后放在网上卖。衣服卖得很快,她得了3成的利润。接下来的三 个月,她越卖越多。有一天她发现网上拍卖的利润已经超过了她原来工作的工资。她辞了工,开始专心搞拍卖。现在她每月的销售额超过100,000元,合 12000美元。

“我的父母没法理解。”她笑着说,一边用电脑向我展示她最新的拍卖,一件售价300元的夹克(网上她给这件 夹克的描述是“非常时髦,穿起来很酷!” )现在JIANG的销售范围已经遍布全国各大城市。以前中国落后的银行系统和信用机制让网络交易很复杂。但现在贝宝—EBAY的网络交易系统—终于把 中国和世界市场连了起来。她说自己准备开展小型的国际业务,把打折的衣服直接卖到伦敦或者洛杉矶。

妥协与放弃

谷歌到现在也没搞清楚,到底是什么原因让中国政府在2002年下了查封令。而查封令在两周之 后又神秘地嘎然而止。但是就算解除了查封,谷歌还是有很多麻烦。中国的防火墙长城拖慢了所有进入这个国家的网络信号。一百次里面有十五次,谷歌会因为网络 塞车而无法使用。防火墙也开始惩罚那些好奇的人们:如果有人查找一个敏感词汇,防火墙通常就回复一个虚假的错误信息,让人以为谷歌的系统坏掉了。然后接下 去的好几分钟,用户就没法再连接上谷歌—-这种惩罚可以算是数字化的一巴掌吧。对于谷歌来说,这些延迟和错误是个很大的问题,因为搜索引擎本因在毫秒 之间给出结果。百度,谷歌的主要中文竞争对手,就没有这样的问题,因为他们的服务器就在中国本土,在万里长城之内。更

BRIN 和其他谷歌的总裁们意识到,防火墙留给他们的只有两个选择,而且都是他们不情愿的。如果谷歌继续置之不理,继续只在国外运行,那么结果只能是被防火墙拖 慢,甚至更不公平的封锁—最终,市场份额就会被百度和其他中文搜索引擎瓜分。如果他们开办中国分部,把服务器开在中国,防火墙的问题就不存在了,服务 速度立刻就能提升。但是谷歌就必须屈从于中国的审查制度。

大 棒加胡萝卜最终把谷歌引到了中国。百度就是大棒:截至2005年,百度已经彻底地击败了竞争对手,几乎抢占了一半的中国搜索引擎市场,而谷歌的市场份额缩 水到了27%。胡萝不就是谷歌公司自己的一个概念,让一个独裁的国家的人民拥有更多的信息来源,这就是在做好事。公司的职员指出,他们肯定要比那些屈从于 审查制度的中国公司做得好。当然,谷歌也必须清楚最敏感的政治网站—-宗教团体,民主组织,天XX纪念—还有黄色网站。但是相比中国用户能够在谷 歌上找到的内容,这些只是九牛一毛。谷歌还是能让中国人更多地了解艾滋病,环境问题,禽流感,全球市场。BRIN告诉我,利润,在综合考虑的因素中占的比 重不大。他认为谷歌要想在中国盈利至少需要好几年。他认为,事实上进入中国市场的商业考虑并没有希望中国人能够好地获取信息的考虑多。“我们最终决定作出 这个妥协。”

他和起来管理层开始讨论哪些妥协他们能够接受。最后决定是,不像雅虎和微软,他们不提供中文的邮件和博客服务,因为这样的服务会被迫使得他们要审查博客或 者要把不同政见者的信息提交给秘密警察。他们还决定不会撤销现有的,没有审查过的中文版谷歌。这样一来,他们实际上就给中国人提供了两个搜索引擎。中国网 民仍然可以进入旧版google.com;这个版本提供没有审查过的搜索结果,虽然敏感的结果最后仍然会带来一个错误页面,虽然该版本仍然会很慢而且时不 时地被防火墙整个封杀。新版的谷歌是google.cn,这一版的内容会经过审查—但是会快得多,可靠而且不会被防火墙阻挠。

BRIN 和他的小组决定如果他们必须要清理例如“天XX事件”的搜索结果,那他们会在搜索结果的顶端放上一个声明,解释说根据中国法律,有些结果被隐去。当中国的 用户查找被禁止的条目,BRIN说,“他们至少能注意到有东西没有了,或者至少注意到国家的控制。”这就使计算机专家经常使用的解决方案:信息缺失其实也 是一种信息。(谷歌的法语和德语版也会显示类似信息,针对一些支持纳粹的网站)

BRIN的小组还要接受另一个挑战:如何决定 哪些网站要屏蔽?中国政府不会给他们一个黑名单。所以谷歌的技术人员就借助高科技手段。他们在中国境内设置了一台计算机,然后设置程序让该机访问国外站 点,一个接一个地试。如果有站点被屏蔽了,就意味着政府把它视为非法—这个网站就被加进谷歌的黑名单。

2005年12月,谷歌的管理层在许可证上签字,正是进入中国市场。他们从来没有正式地和政府官员坐下来,接受审查协议。他们决定自己先这么做—然后等着政府的反应。

中国风暴

Google.cn 于今年一月27日正式运营,维护人权组织的成员马上登陆新的引擎,察看它是如何运作的。谷歌的自我清查非常全面,有关法XX的第一页搜索结果,都是反对法 XX的网站。谷歌的图片搜索,也是很出类似的结果。输入天X门,你看不到XX和XX,只能看到夜晚的美景还有幸福的中国夫妇在那里的合影。

谷 歌的时机实在选得太差了。Google.cn的做法被代入一个政治语境,和其他在华科技公司的做法相提并论。去年九月,无国界记者组织透露,在2004 年,雅虎把一封用户的个人邮件交给中国政府。导致SHI TAO,一名商业记者,在把关于政府规范媒体的文件传给境外网站的时候被捕。他被判入狱10年。接着在12月,微软遵从政府的要求,关闭了安替的博客。值 得注意的是,微软的博客服务器甚至没有在中国;公司有效地遵从了大洋彼岸政府的审查,删除了位于美国的服务器里的资料。

对比这些 事件,谷歌的管理层也许表现得更负责更道德。但是中国问题的风暴在二月席卷了硅谷,谷歌首当其冲。国会召集了三家公司进行听证—一起的还有 csico,中国万里长城的硬件提供商—立法会质疑了三家公司的做法,谷歌更是被特别地教训了一顿。他们质问,一家以“不要做坏事”为口号的公司为何 与中国的审查者合作。“这样你们的公司就成了中国政府的打手,”JIM LEACH,爱荷华州的民主党人说,“如果国会也想学学怎么审查,我们就找你们谷歌。”

安替给出的排名

2月份,我又一次见 到了安替,这时候距离他的博客被关闭已经两个月了。我们在北京的一间酒吧喝酒。安替还是像之前那样充满活力,虽然他有点后悔上次自己所做的乐观的评价。“ 我现在有一点愤世嫉俗。”他的博客被封是因为一篇日志,谈到中国一家报纸的主编被炒。他当时呼吁大家抵制该报。这个举动显然是越界了。已经不只是言论那么 简单,因为安替号召了大家去行动。政府联系了微软,要求关闭安替博客,公司同意了。这个举动召来了大批拥护言论自由人士的抗议,他们指责微软甚至在中国政 府还没给出正式的要求之前就屈从了。
微软似乎对公众的抗议已经习 以为常。在国会听证的时候,公司的政府关系总管表达了遗憾。为了挽回颜面,微软高层指出他们备份了被删掉的博客日志,并把他们寄给了安替。安替告诉我,微 软并没有提及,他们拒绝把日志通过电子邮件发给他,他们只是刻了一张碟,然后寄到安替要求的美国境内任何一个地址。微软看起来太害怕中国政府了,安替苦笑 着说,他们甚至不敢通过邮件把被查禁的东西寄到中国。(微软拒绝对本文发表评论)

我 原本以为安替会很愤怒。但他却出人意料地很平静。他把几家公司进行了道德上的排名,扳着手指一间间的数。他说,谷歌应该排在最前。它确实真诚地在改善中国 人获取信息的质量,而且在这样坏的体系里希望做到最好。微软其次;安替显然对他们的做法不太高兴,但他说微软还是提供了一个好用的博客工具,毕竟给中国人 提供了一个公开发表意见的空间。雅虎排在最后,安替对他们的态度唯有怨恨。

“ 谷歌做出了妥协。”他说到,有时候妥协是必要的。但是雅虎的行为,却要被归到另一类:“雅虎是叛徒,中国人都痛恨雅虎。”安替说,不同点是雅虎把一个不同 政见者置于危险当中,而且很明显没有考虑到对人权的伤害。(雅虎没有做出评论)谷歌却相反,他们避免了那些有可能导致人们入狱的服务。安替说,他们虽然也 在审查信息,但他们犯的错无非是删掉一些信息,而不是删掉自己的人性。

失真的世界

安 替的道德观点很让人惊讶,不只是因为对于美国的思维方式来讲太过陌生。大多数美国人,特别是多数思考和写作关于中国问题的美国人,他们的思维中不存在折中 的民主,或者折中的言论自由。一个国家要么就完全拥护这些自由,要么就是跌进了集权国家的深渊。但是中国的博客写手和网民们其实之前早已经在谷底待着了。 从这个角度来看,被审查过的互联网,已经对中国社会产生了深远的影响。对于年轻一代来说,网络把公共言论变成了一种日常行为。这个角度也正是谷歌所接受 的。由此引出一个有趣的问题:一个不完美的互联网能否带来一个更完美的社会?

有一位我采访过的总裁把中国的互联网问题总结为 “失真的世界”的问题。如果那些用谷歌搜索法XX的人看到的都是反对的网站,他们的世界观会是怎样的? 他们也许会相信谷歌的权威,假设情况就是这样。这正是最近国会听证会上,民主党代表CRISTOPHER SMITH所担心的。“关于敏感问题,当谷歌只是带给你正面宣传的信息,那么谷歌在其中就起了协从的作用。这样就影响了整个下一代—他们会认为,也许 我们可以生存在独裁的环境里。没有什么LECH WALESAS(波兰革命的领袖人物),民主永远都不可能实现。”对于SMITH来说,谷歌的逻辑就是妥协的逻辑。就像很多公司和种族隔离的南非打交道一 样,谷歌太看重利益,而忽略政治问题。(本月早些时候,谷歌的CEO在北京见李开复时对记者说,谷歌去改变中国的审查制度,实在是很“傲慢”)

但 是也许失真的世界对中国来说还是小问题,因为很多中国人告诉我,他们很久以前就学会了跳过党的那些虚伪的政治宣传和媒体控制。中国社科院的GUO LIANG教授告诉我一个显著的例子。“哈佛的一些人做了一个关于中国互联网的调查,我们他们调查结果是什么?他们回答,我们认为中国政府试图控制互联 网。我就一直笑,我说,我们当然知道这个!”谷歌的审查过滤对GUO来说并没有什么值得讨论的,一点也不新鲜。

香港城市大学 的教授ANDREW LIH说,大多数中国人抱有一种长远的眼光看问题。“中国人有五千年的历史,你现在封一个网站,他们只会想,用不了多少时间,它自己就会回来的。”或者想 想中国那些想方设法登陆维基百科全书的人。最近,伟基百科被全面封杀。这些人希望说服维基的管理者能够建立一个中国政府允许的版本,禁掉那些在中国不合法 的条目。他们说,这对于中国来说其实是好事,特别是那些边远地区学校。(到目前为止,维基仍然表示不会创建一个审查过的版本)

电 脑程序的代码是很灵活的,因此有很多办法对抗虚伪—让信息审查这个事实或多或少被大家看到。在开发google.cn的过程中,谷歌曾经考虑禁掉和敏 感话题有关的所有内容。也就是说在谷歌中国去搜索法XX,结果是一个支持的站点也没有,一个反对的站点也没有。那样能带来怎样的影响呢?别忘了,当谷歌推 出审查版的google.cn的时候,仍然保留了旧版的搜索引擎。也就是说任何一个网民,只要输入一个敏感词,然后把新旧版本的结果做一个对比,就可以知 道黑名单上到底有什么了。有些批评家甚至建议谷歌做得更多一点,直接把黑名单在美国公布,让审查制度变得完全透明。

超级女生理论

当 我和李开复在他北京的办公室谈话的时候,有些时候我会感到他的前后矛盾。有一阵他就像一个热爱自由的谷歌人,强调说互联网给了每个网民以权力。但是下一分 钟,他就更像阿里巴巴的总裁JACK MA—强调中国人对于引发动荡不感兴趣。在和中国的网络公司总裁聊天的时候,我一次又一次的听到这样的圆圈逻辑:我们不觉得清理掉敏感话题有什么不 好,因为用户本来就不会去看那些东西。

也许他们是对的,用户是不会去看。但你也能很轻易地反驳说,他们不感兴趣只是因为他们被吓到了。谁会公开地在公共网吧查找不合法内容呢?—甚 至是在家里—政府要求每个上网用户都要登记姓名和电话号码以便追踪。政府对网络的镇压甚至有可能变本加厉,如果中国广大的穷苦农民也开始上网。政府适度的 容忍受过教育的知识分子的网络言论。但是那些被腐败的地方官僚欺压的农民们都是激进分子,他们对北京来说是现实的威胁。2004年有多达70,000起抗 议活动,其中很多都被强硬地镇压了。

在批评家眼中,谷歌是将中国 网民的期望置之不顾,为了保证市场赢利而屈从于中国政府。李开复的话则代表一种完全不同的信念:互联网由于与生俱来的特性,将会逐渐瓦解政府控制言论的能 力,为一个拥护民主的社会打下基础。从这个观点出发,中国的革命将不会存在“伟人”,也不会存在LECH WALESA式的英雄,激励被压迫的同胞,为民主而战的将是一亿毫不关心政治的年轻人,他们在博客上谈论他们的约会,他们喜欢的乐队,电子游戏—整整 一代把公共言论当作日常习惯的年轻人。

在我们谈话 当中,李开复谈起了去年的超级女生,一个模仿“美国偶像”的电视节目。和美国的版本类似,年轻漂亮的女孩在夺目耀人的包装之下演唱西方流行歌曲。每一回 合,观众都可以通过短信选出他们最喜欢的参赛者。随着比赛进入白热化,开始了类似总统大选的拉票活动,组织起来的粉丝们建立网站,要求大家投自己喜爱的歌 手。最后的决赛,有800万年轻人参与了投票;冠军是李宇春,21 岁,学生打扮的她唱了爱尔兰乐队Cranberries的一首zombie。

“我觉得这就是民主的一次实践。”李开复说,“大家为超级女生投票。他们喜欢这个比赛—他们上街去拉票。”换句话说,也许这并不是革命。但是这也许是个开始。

人们痛恨Google Adsense的十大理由

英文原文:10 Reasons Why People Hate Google AdSense
  中文翻译:William Long
  中文译文:人们痛恨Google Adsense的十大理由

  人们讨厌Adsense的理由非常多,不过大部分理由都相当可笑,我这里就收集到十大理由,并逐一进行讨论和反驳。尽管大多数理由是值得关注的,但也有少数理由是荒谬而不值得一驳的。

  10 – 邮件技术支持较差

  这是一个比较公平的观点,Adsense的确能够而且应该在现有的技术支持上做更多的事情。但是,请你考虑一下使用Google Adsense的用户数量,即使仅仅有1%的用户需要技术支持,那仍然有不少用户。人们希望Google Adsense能多做一些努力,特别是在12小时内回答所有的电子邮件支持问题,尽管这是很难的事情。

  9 – 允许广告在垃圾站上显示

  目前Google已经利用算法尽量杜绝垃圾站上显示广告,并且Google已经在Blogspot上减少了垃圾站的效应。

  但是MFA网站不会自动消失,要和他们斗争,Google需要人工检查核对这方面的应用(也许包括建立的时间,网站年龄,流量等)并且要每年(或半年)再进行随机检查。

  要想将垃圾站从系统中删除,那需要人工进行检查,虽然这还引起另一个讨厌的问题,即个人偏见可能会将一个重度优化的网站当成垃圾站进行处理。

  但是人们为什么还要嚷嚷着Google允许广告在垃圾站上显示?这对你有多大影响?

  8 – 智能定价

  如果你不知道什么叫做”智能定价”,那么你要读一下Jennifer Slegg的文章 Google的回应

  这就是Google AdSense/Google AdWords的工作机制。

  7 – 价格太低

  一个问题是,你期望从Google Adsense或者Google中获得多少?

  AdSense通常像一个流量函数,如果你的流量很低,那么你需要去TLA购买链接使得PageRank提高,如果你注册了AdSense,并指望其能支付你所有的开销,你最好最好充分的准备,先努力将你网站的流量搞上去再说。

  不要总是依靠单一的收入来源,要依靠你自身的流量,AdSense可能给你带来最坏的收益或者最佳的收益。

  6 – 广告难看

  这个理由对于经常使用AdSense的人来说很难赞同,Google已经做了很大的努力,将AdSense广告和网站内容融合在一起,与其责怪广告系统,不如好好研究一下广告网络设置,以便做出最优质的广告。

  5 – 不许套利

  很多人觉得,使用AdSense交叉牟利并不违反AdSense的许可政策,其实很多人都在做这样的事情,关键在于你要保证自己不会被抓住 🙂

  4 – 不允许禁用帐号重新申请

  如果AdSense真的是零容忍政策,那不一定是坏事,虽然帐户因为可疑活动被误封,在错误被发现后应该允许重新激活,Google只能优化欺诈检测系统,这样误封的可能性才会减少。

  3 – 广告到处都是

  这正好证明了AdSense的简洁和易用。

  2 – 广告匹配错误

  相对于其他的网络,AdSense的广告匹配实际上已经很好了,而且,再深入调查一下你会发现,Google通常都是领先一步的。

  在一定情况下,相关的广告没有显示,这可能是因为页面内容不附和许可政策。

  1 – 它养活了Google家族

  不错,这正是它的作用。

  即使每次点击你赚的钱无缘无故被削减,AdSense的客户服务或优化专家根本就不向你解释为什么会发生这种事情,这的确令人愤怒,但是出了抱怨之外,你必须学会去适应,最终你会找到替代品或者解决这样的问题。

http://blog.pcstars.tk/2007/07/google-adsense.html

Google的unavailable_after标签的使用方法

上周我们预告了Google将会增加一个新的Meta标签“unavailable_after”,它允许我们手动指定某个网页的失效日期,以提醒Google的爬虫在该日期后不再抓取含该标签的网页。不过上周我们并不清楚这个标签到底是怎样使用的。SEL今天从Google的产品经理Dan Crow那里了解到这个标签的详情用法,下面和大家分享一下。

要使用“unavailable_after”标签,只需要在网页的头部加入以下的Meta语句即可:
<  META NAME=”GOOGLEBOT” CONTENT=”unavailable_after: 日期 时间 时区” >
其中的日期、时间、时区(缩写)分别用23-Jul-2007、19:18:17、EST这种格式。当Google的爬虫看到网页里包含这个标签时,它不仅会不再抓取这个网页,还会在一天左右的时间内将网页从Google的搜索结果里除去。值得注意的是,Google Cache里的相关的网页快照依然会存在。要想移除Google Cache里的记录,得给网页加上noarchive标签
本文转载自:G速客原文地址:Google的“unavailable_after”标签的详细使用方法

优化网站结构

优化网站结构有两方面的意思,一是物理结构二是逻辑结构
网站物理结构指的是网站真实的目录及文件所存储的位置所决定的结构。
一般来说比较好的物理结构可以有两种,一是扁平式的,也就是所有网页都存在网站根目录下。像这样:
http://www.domain.com/pageA.html
http://www.domain.com/pageB.html
http://www.domain.com/pageC.html
…….
所有这些页都是在根目录这一级别,形成一个扁平的物理结构。
这比较适合于小型的网站,因为如果太多文件都放在根目录下的话,制作和维护起来都比较麻烦,容易搞乱。
第二种就是树型结构,也就是根目录下分成多个频道,或者叫类别,目录等,甭管名称是什么,都是一个意思,然后在每一个频道下面再放上属于这个频道的网页。比如频道分为:
http://www.domain.com/cat1/
http://www.domain.com/cat2/
http://www.domain.com/cat3/
……
在频道下再放入具体的内容网页:
http://www.domain.com/cat1/pageA.html
http://www.domain.com/cat1/pageB.html
http://www.domain.com/cat1/pageC.html
……
网站结构的第二个意义指的是逻辑结构或链接结构,也就是由网页内部链接所形成的逻辑的或链接的网络图。
比较好的情况是逻辑结构与前面的树型物理结构相吻合,也就是说:
主页链接向所有的频道主页主页一般不直接链接向内容页,除非是你非常想推的几个特殊的页所有频道主页都连向其他频道主页频道主页都连回网站主页频道主页也连向属于自己本身频道的内容页频道主页一般不连向属于其他频道的内容页所有内容页都连向网站主页所有内容页都连向自己的上一级频道主页内容页可以连向同一个频道的其他内容页内容页一般不连向其他频道的内容页内容页在某些情况下,可以用适当的关键词连向其他频道的内容页频道形成分主题
仔细读前面这几句话,你可以清楚的看到这些链接会很自然的形成一个树型的网络图,而这种逻辑的或链接的网络可以与物理结构重合,也可以不一样。比如扁平式的物理结构网站也完全可以通过链接形成逻辑上的树型结构。
对搜索引擎来说更重要的是由链接形成的逻辑结构。
有不少人有误解,认为物理结构比较深的网页不容易被搜索引擎收录。比如说
http://www.domain.com/cat1/cat1-1/cat1-1-1/pageA.html
像这样目录结构比较深的网页,是不是就不容易被收录呢?那不一定,如果这个页在网站的主页上有一个链接,对搜索引擎来说它就只是一个仅次于主页的二级网页。
收录的容易与否是在于离主页有几次点击的距离,而不是它的物理位置。
对稍有些规模的网站来说,一般树型逻辑结构的网站是比较好的。
从我看的网站来判断,大部分中国人的网站逻辑思维比较清楚,所以大部分中文网站都是按照这种结构做成的。其实有不少英文网站的逻辑结构还真是蛮乱的。
http://blog.pcstars.tk/2007/07/blog-post_13.html

新站点怎样寻找外部链接

外部链接对搜索引擎优化的重要性大家都知道。
但现实情况是富的更富,穷的更穷。如果你的网站已经有了很多外部链接,PR值也高,排名已经不错,那么你的文章就更容易被其他人发现,其他站长很可能自动就链接向你的网站,不用费多大功夫。就算是寻找友情链接也比较容易。
但对一个新站来说,找最初的几个链接却是最难的。下面提几个建议。
新站点开通三个月以后,再开始寻找链接
全新的站点非常不容易得到外部链接。
我一般是从自己现有的高PR值网页,链接到这个新站点后三四个月才开始寻找其他链接。这样可以确保新站已经有了不错的PR值,而且已经被搜索引擎收录了大部分网页,其他站长看了你的网站,不会觉得链接到你有什么危险。
新站点刚一开通的时候,不要太着急。
登录分类目录
网站分类目录,网址站等就是要收录其他网址,所以从分类目录得到链接相对比较容易。
除了大型的分类目录,像开放目录,雅虎,好123等,互联网上还有很多行业分类目录,地方政府分类目录和个人的小型站点站等。花点时间找到这些目录登录。
当然前提是你的网站至少看起来应该不错,大部分分类目录也不会收录看起来就像垃圾站的网站。
写博客
博客社区和普通网站的一个很大分别就是经常更新,而且经常互相引用。只要你的博客内容有特色,其他写博客的人很容易就链接到你的网站。
先链接到别人
要想得到必须先要付出。而且导出链接也不是什么坏事,只要不要链接到垃圾站点。
链接到别人后,点击一下这些链接,让对方能够发现你已经链接到他们了。大部分站长都有检查日志的习惯,他们会发现你的网站已经链接到他了。
我几乎每天都会看日志,从日志中发现很多链接过来的网站,很自然的就会看一下。如果这些网站有好的内容,我会收藏,观察一段时间,真正质量好的,我会自动链接回去。
先做非商业性网站
一个完全商业性的电子商务网站确实很难从其他站点得到链接。设想一下,我为什么要平白无故链接到一个卖化妆品的网站呢?除非是朋友帮忙。
可以尝试先把网站的非商业性部分,比如行业知识,使用窍门等建立起来,然后在同一个站点再发展商业部分,或干脆建另外一个商业网站,然后从非商业网站再链接到商业网站。
与其他站长保持友好关系
和同行业内的其他站点多多交流,不一定一开始就以交换链接为目的。交流一下心得体会,行业新闻等对双方都有好处,时间长了成为朋友,再提交换链接的事情就容易多了。
作者: http://www.chinamyhosting.com/seoblog/

网页的重要性-权威度-能量

现在很多人相信搜索引擎都给网页赋予一个权威度值,名称有不同的看法,不管叫重要性值,还是叫信任级别,还是叫权威度,还是叫强度,或者叫能量。甭管叫什么,很多排名的研究表明,网页本身除了PR值之外,还有一个综合了很多因素所构成的一个与搜索词无关的权威度值。

前几天SEOmoz开发出一个测量网页权威度值的工具,他把它叫Page Strength,大家可以测一下自己的网页能量值是多少。
这个工具采集几个数据:
雅虎所收录的指向这个URL的链接数
雅虎收录的指向这个域名的反向链接数
反向链接数还是各个搜索引擎非常看重的一个因素,是和PR值最有关联的一个因素。
网页标题中前四个单词在Google的排名情况

一般来说标题Title前面的词就是这个网页的目标关键词。那么这个网页在Google中搜索目标关键词时的排名自然是这个网页权威度的指标。
但有时候这个指标也不准,因为有的网页可能把关键词放在标题的靠后,有的时候取前四个单词反而由于分词不同破坏了关键词。
域名年龄
不过这个域名年龄指的不是域名注册时的年龄,而是Wayback Machine所收录的网页第一次出现的时间。
从.edu和.gov来的反向链接
前面说过很多人认为搜索引擎给.edu和.gov域名更大的权重,因为这两个域名都不是一般人所能注册的,所以有更高信任度
Alexa排名
尽管Alexa排名太容易被作弊了,但到目前为止也还是唯一一个能大致判断流量的指标。
在Google数据库中你的域名被提到的次数
这里指的并不仅仅是反向链接,也包括不是链接的只是提到你的域名的情况。
内部链接的情况
你的整个域名指向这个所测试的URL的链接比例,如果是主页的话,一般都是百分之百。这是看你网站的内部链接结构把这个所测试的页放在一个什么重要的程度。
网摘del.icio.us出现URL的次数
前面说过搜索引擎现在越来越看重用户行为模式,网摘,书签等就是用户行为方式的重要指标之一。
是否被收录进开放目录
雅虎和开放目录是两个最大的由人工编辑的网站目录,由人所判断的网站质量和重要性比机器自然要准确。
在wikipedia中出现URL的次数
同样也是用户行为方式之一。

最后一个才是Google PR值

二级域名还是一级目录

都说子站包围主站会很有利,想问一下关于子站的问题
子站(二级域名)相对于网站的一级目录来说,权威性是不是要大些?
搜索引擎是把子站作为独立的一个站来看待?还是也算为一级目录来看待?
如果是作为独立的一个站来看待,那主站的内容就少了,那流量会算进主站吗?

这是一个很好的问题,要做好搜索引擎优化,就是要在这种细节的地方多下功夫。

搜索引擎会把二级域名当作一个独立的站点来看待,也就是说

http://www.xxx.com

http://news.xxx.com

是两个互相独立的网站。

当然一级目录(分目录)

http://www.xxx.com/news/

就纯粹是它的上级目录网站

http://www.xxx.com

的一部分了。

顺便说一句,www.xxx.com其实是xxx.com的二级域名。

如果抛开其他因素只看这两个URL,

http://news.xxx.com

http://www.xxx.com/news/

那么二级域名

http://news.xxx.com

的权威度稍微高一点,因为搜索引擎会把这个URL当作是网站的首页。另外很多人观察到主域名很多时候会传递一小部分信任度(是信任度,不是PR)给二级域名。

所以单就URL来看,二级域名比一级目录天生的信任度稍微高一点。

但从搜索引擎排名的角度看,我建议尽可能使用分目录,而不是二级域名。

二级域名和主域名是两个完全不同的网站,你要推广的是两个网站,所有的网络营销工作都要多做一遍,网站PR值信任度都会被这两个独立的网站所分散。

二级域名的使用会使网站变多,但同时使网站变小,分目录会使一个网站越做越大。以前提过搜索引擎优化很重要的一点就是网站内容和网站自身的质量和强度,网站的大小就是其中很重要的一个指标。网站越大,包含的内容自然就越多,对用户的帮助就越大,它所累积的信任度就更高。

所以我倾向于在做网站时尽量使用子目录。前提是整个网站主题是紧密相关的。

当然这只是就搜索引擎排名而言。在很多时候出于其他考虑,也不得不使用二级域名。比如说公司的产品线比较多,而且产品线之间的差异性比较大,那么不同的产品系列可以用不同的二级域名。

也有的时候国际性公司会在不同的国家使用不同的二级域名,比如中国分公司就使用cn.xxx.com,新加坡分公司就使用sg.xxx.com。

对一个中小企业来说,我的建议是尽可能把所有内容放在目录下,形成一个大的网站。 问:请问,使用独立服务器肯定比虚机有优势,现在的问题是,对于独立服务器而言,因为ip是固定的,那么网站结构是使用分目录好还是二级域名好?IP地址对这种情况没有什么影响,一般我还是会用分目录。

Google打不开的解决方法和IP地址表

 本文将给出一些能够正常访问被屏蔽的Google搜索引擎的常用方法以及Google的IP地址表。
  在Google.com里面进行搜索的时候,经常会遇到突然出现“该页无法显示”的提示,并且之后的十多分钟都无法正常连接Google,这里给出一些方法,可以解决大部分Google无法访问或进不去的问题。
  1、如果是搜索过程中出现“该页无法显示”的提示,接着就无法访问Google,那么对于ADSL用户,可以尝试断开网络连接,然后重新拨号上网,这样你的IP地址就发生了变化,这时候就可以正常访问Google了。(其原理是防火墙只是针对IP封用户,而不是针对独立电脑)
  2、如果一开始就无法访问Google,那么请把下面这一行:
  216.239.63.104 www.google.com 或者 64.233.171.99 www.google.com 或者 216.239.53.99 www.google.com
  添加到:C:\WINDOWS\system32\drivers\etc\hosts文件里,就着访问Google看看是否正常。(其原理是提供较为少用的Google镜像访问)
  3、使用附录中的Google的镜像IP地址来访问Google,那么多的IP,应该不至于全都封了吧。
  4、使用Google.cn来访问Google,不过请注意,Google.cn服务器也在美国,因此搜索词语的时候也会出现“该页无法显示”的可能。
  5、如果碰到DNS劫持的封锁方法,那么需要选择正确的DNS服务器,将主DNS设置成国外根服务器的DNS,然后辅助DNS设置成国外的DNS。具体做法:在拨号网络或网卡属性里设置,主DNS设成 202.12.27.33,辅助DNS:202.216 .228.18(日本DNS)大家还可以自己找一些快的国外DNS。 (其原理是DNS劫持只能够控制国内的DNS服务器,而对于国外的DNS服务器则无能为力,因此只要不使用国内的DNS即可)
  6、对于GMail,使用http访问访问的话最好不要选择“带有聊天功能的标准视图”,否则容易被封。
  7、尽量使用https://mail.google.com/ 来访问GMail,这将极大提高访问的稳定性,并且在GMail里使用GTalk也不会被封。(其原理是对于加密的https,防火墙无能为力)
  8、使用加密的代理服务器软件来访问Google,当然目前的一些加密的代理服务器都不是很稳定,速度也不是很理想。
  当然,上面的方法有时可能会实效,我觉得最简单的方法应该是来自Google的,就是提供一个支持https版本的Google搜索,这可以一劳永逸地解决目前几乎所有的问题,而且我知道增加这个版本对于Google来说应该是举手之劳的事情,并且GMail都已经提供了,那么为什么对于我们用的更多的Web搜索不提供呢?https是安全访问网站的一个重要的方法,目前还没有看到能截获https的加密数据的防火墙,那么与其提供Google.cn,其实还不如提供一个https的Google更实用。
  当然,在大多数国家,使用https访问Google都显得很多余,但请Google理解https对于中国用户的重要性,并且实现https访问也是轻而易举的事情,又何乐而不为呢。
  附录:Google的IP地址一览表:
http://216.239.37.103/
http://216.239.57.99/
http://64.233.187.107/
http://216.239.37.105/
http://216.239.59.103/
http://64.233.187.89/
http://216.239.37.106/
http://216.239.59.104/
http://64.233.187.99/
http://216.239.37.107/
http://216.239.59.105/
http://66.102.11.104/
http://216.239.39.100/
http://216.239.59.106/
http://66.102.11.105/
http://216.239.39.102/
http://216.239.59.107/
http://66.102.11.106/
http://216.239.39.103/
http://216.239.59.147/
http://66.102.11.107/
http://216.239.39.106/
http://216.239.59.98/
http://66.102.11.99/
http://216.239.39.107/
http://216.239.59.99/
http://66.102.7.104/
http://216.239.51.100/
http://216.239.63.104/
http://66.102.7.105/
http://216.239.51.103/
http://216.239.63.91/
http://66.102.7.106/
http://216.239.53.102/
http://216.239.63.93/
http://66.102.7.107/
http://216.239.53.103/
http://216.239.63.99/
http://66.102.7.147/
http://216.239.53.104/
http://64.233.161.104/
http://66.102.7.18/
http://216.239.53.106/
http://64.233.161.105/
http://66.102.7.19/
http://216.239.53.107/
http://64.233.161.106/
http://66.102.7.89/
http://216.239.53.99/
http://64.233.161.107/
http://66.102.7.91/
http://216.239.55.102/
http://64.233.161.89/
http://66.102.7.95/
http://216.239.57.103/
http://64.233.163.104/
http://66.102.7.99/
http://216.239.57.104/
http://64.233.163.106/
http://66.102.9.104/
http://216.239.57.105/
http://64.233.163.99/
http://66.102.9.105/
http://216.239.57.106/
http://64.233.183.91/
http://66.102.9.106/
http://216.239.57.107/
http://64.233.183.93/
http://66.102.9.107/
http://216.239.57.147/
http://64.233.183.99/
http://66.102.9.147/
http://216.239.57.98/
http://64.233.187.104/
http://66.102.9.99/

http://blog.pcstars.tk/2007/06/googleip.html

robots.txt中支持加入sitemaps

  作为一个日渐被大多数主流搜索引擎接受的标准Sitemaps(xml)在SEO方面的重要性越来越大,不仅可以帮助搜索引擎收录、索引网站内的页面,同时,明确的更新状态也让搜索引擎在网站内爬行时有的放矢,降低来自搜索引擎的访问压力。
  一般而言,网站需要至Google网站管理员中心或Yahoo! Site Explorer中提交sitemaps (xml) 文件的url,告知搜索引擎sitemaps文件的位置,今后则可免去这一步骤。根据Google Webmaster Central 官方Blog上的说明,Sitemaps引入了一个名为“autodiscovery”的扩展支持,即网站可以直接在robots.txt中加入Sitemaps链接地址,这样,支持sitemaps协议的搜索引擎便能自动找到相应的sitemaps,而不必向多个搜索引擎分别提交。——目前支持Sitemaps的搜索引擎包括Google、Yahoo!、Live Search及Ask.com,大部分国产搜索引擎似乎并无相应的计划。
  要让搜索引擎找到网站的sitemaps文件,只需在robots.txt中加入类似如下的一行:
Sitemap:http://www.pcstars.tk/sitemap.xml
  注意,url必须使用绝对路径,并且,不能省略“http://”。

如何写robots.txt

在国内,网站管理者似乎对robots.txt并没有引起多大重视,应一些朋友之请求,今天想通过这篇文章来简单谈一下robots.txt的写作。

robots.txt基本介绍
robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。
当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。
另外,robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
robots.txt写作语法
首先,我们来看一个robots.txt范例:http://www.csswebs.org/robots.txt
访问以上具体地址,我们可以看到robots.txt的具体内容如下:
# Robots.txt file from http://www.csswebs.org# All robots will spider the domain
User-agent: *Disallow:
以上文本表达的意思是允许所有的搜索机器人访问http://www.csswebs.org/站点下的所有文件。
具体语法分析:其中#后面文字为说明信息;User-agent:后面为搜索机器人的名称,后面如果是*,则泛指所有的搜索机器人;Disallow:后面为不允许访问的文件目录。
下面,我将列举一些robots.txt的具体用法:
允许所有的robot访问
User-agent: *Disallow:
或者也可以建一个空文件 “/robots.txt” file
禁止所有搜索引擎访问网站的任何部分
User-agent: *Disallow: /
禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *Disallow: /01/Disallow: /02/Disallow: /03/
禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBotDisallow: /
只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: CrawlerDisallow:
User-agent: *Disallow: /
另外,我觉得有必要进行拓展说明,对robots meta进行一些介绍:
Robots META标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。
Robots META标签的写法:
Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。
INDEX 指令告诉搜索机器人抓取该页面;
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;
Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。
这样,一共有四种组合:
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”><META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”><META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”><META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>
其中
<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:
<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>
表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。
特别说明,本文章的写作参考了一些网络信息,robin只是按照自己的思路对信息进行整理。
http://www.dunsh.org/2006/08/02/robotstxt/

Google Sitemaps使用指南

 Google Sitemaps是Google的一个和网站管理员相关的工具,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通知”Google,方便Google进行索引。
  初步使用了一下Google Sitemaps,用法非常简单。
  首先在自己网站根目录上上建立一个名为GOOGLE11e5844324b7354e.html,文件本身可为空。然后在Google Sitemaps主页上单击验证按钮。Google会验证这一文件。如果验证通过,Google会显示一个已验证状态,并提供一个指向用户网站统计信息的链接。经过验证后,用户随时可以通过单击“网站概述”页上的链接来查看自己网站的统计信息。
  接下来,建立Sitemaps文件。Sitemaps文件是XML格式的,Google建议使用Sitemaps协议格式的文件。不过使用BLOG的RSS甚至纯文本文件也都可以。XML Sitemaps 格式其实也很简单,建议多花几分钟转换为XML Sitemaps 格式后再提交Google。Sitemaps协议是XML的变种,用于概括与Web抓取工具相关的Sitemaps信息。对于每个网址,都可以加入抓取“提示”(如最后修改日期和近似更改频率)。Sitemaps协议以 开始标记开始,以 结束标记结束。 每个网址包含一个作为父标记的 条目。 每一个 父标记包括一个 子标记条目。是网页文件的网址。此网址应以http开始并少于2048个字符。 表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。其他的可选项可以不加。
  最后,在Google Sitemaps的提交页面填写你生成的Sitemap地址,并提交即可。
  过了几个小时后,再登录Google Sitemaps,可以看到功能菜单。
  Google Sitemaps还提供了Google Spider对用户网站访问情况的说明报告,如:查询统计信息、抓取统计信息、网页分析、索引统计信息等信息。“查询统计信息”中,有列出几个进入你网站的热门搜索关键字。在“抓取统计信息”中,可以看到Google Spider抓取网站的概要统计和抓取错误的地址。实现了网站主和Google Spider的信息交互。

http://blog.pcstars.tk/2006/06/google-sitemaps.html

Google开始提供免费网站统计功能

 周一在纳斯达克股票交易市场上,在其主要竞争对手Google宣布将免费提供网站使用情况追踪软件Google Analytics之后,WebSideStory公司股票在午后交易中急剧下跌2.1美元,跌幅为12%,至15.90美元。
  位于美国圣地亚哥的WebSideStory提供一种追踪并分析浏览网站用户的服务,Google Analytics,它的功能与WebSideStory提供的这种服务有点类似。
  分析人员说:“当你某天早上醒来,忽然发现你所出售的东西人家在免费提供……那么后果可想而知。”
  Google总是在给对手带来恶梦,目前世界上唯一可以和Google抗衡的恐怕就只有微软了。
  这项免费服务有简体中文版,我今天去申请了一个,Google会给出一段JavaScript代码,放在网站上后就可以进行统计了。统计不是实时的,需要12个小时后才能有结果,所以现在我还看不到其效果。
  就像其他产品一样,Google Analytics虽然会免费提供,但是对于没有Adword帐户的用户可以每月免费统计500万个页面。我于是使用自己的Adword帐户来申请Google Analytics,看看以后会是什么效果。
  放了Google Analytics的代码几个小时了,初步感觉,其会使得网站打开变慢,其分析的主机有时候不通,不知道什么原因。
  Google分析的主页是http://www.google.com/analytics,想申请的朋友可以通过这个链接访问。

http://blog.pcstars.tk/2006/01/google.html