標籤彙整: Web

网址缩略服务被指大幅降低网速

新闻来源:新浪科技
荷兰创业企业WatchMouse对14家较受欢迎的网址缩略服务进行了一个月的研究后发现,这种服务 会大幅降低网页加载速度。网 址缩略服务是广泛应用于Twitter等微型博客中的服务。由于微型博客通常都将信息长度限制在140个字符以内,因此无法容纳较长的网址,而通过 网址缩略服务则可以将较长的网址缩略成较短的网址。但使用缩略后的网址时,需要经过重新定向方可加载目标网页。

为了对具体效果进行衡量,WatchMouse每隔五分钟便从遍及全球的监测站中选择一台对所有网址缩略服务进行一次检查。在研究过程 中,WatchMouse只会对重新定向的过程进行监测,而不会统计目标网页的实际加载时间。

瑞典IT服务公司Pingdom也曾于2009年8月进行过类似的研究,对网址缩略服务的速度和稳定性进行了衡量。但该服务只对独立的网址缩略服务进行了 监测,并未包含微软、Facebook和谷歌的相应服务。

WatchMouse的研究显示,谷歌旗下网址缩略服务Goo.gl和YouTu.be均表现不俗,但仍然需要花费约三分之一秒来处理页面。如果考虑到全 天的网址处理量,仍然会对网速产生极大的影响。而Facebook的FB.me在本次研究中表现最差,平均会为网页增加2秒的加载时间。

另外一个有趣的发现是,只有少数几个网址缩略服务针对国际用户进行了优化,例如,有些网址缩略服务需要花费0.5秒的时间才能够查找到目标网页的IP地 址。

就网址缩略服务的可用性而言,多数产品的表现都不错,即使是表现最差的snurl.com正常运行时间也超过98%。Facebook的FB.me表现倒 数第三,但其正常运行时间也达到99.5%。

尼尔森公布全美2月份网站流量排名 谷歌第一

据国外媒体报道,市场研究公司尼尔森当地时间3月15日发布了2010年2月美国互联网市场 报告,谷歌是第一大互联网公司,独立访问用户超过1.63亿,平均每名用户访问时间超过1小时47分钟。排在第二位的是微软,独立访问 用户近1.44亿,平均每名用户访 问时间超过1小时49分钟;雅虎以约1.36亿独立访问用户排在第三位,平均每名用户访问时间超过2小时17分钟;Facebook独立访问用户超过 1.18亿,平均每名用户访问时间超过6小时27分钟。 閱讀全文

一个即将到来的实时的 Web

实时的 Web 离我们还有多远?WordPress.com 刚刚宣 布,其托管的一千多万个博客已经全部实现基于 PubSubHubbub 的实时聚合,Wordpress 上任何新发布的博客文章将实时出现在诸如 Google Reader, Bloglines, Friendfeed 以及 Netvibes 一类的服务中。Wordpress 还推出 PuSH 插件 实现任何 WordPress 博客的实时推送。 閱讀全文

Adobe试图颠覆HTML5:做自己应该做的事

HTML5规范的编辑者之一,现供职于Google的Ian Hixie在个人博客上声称,尽管Adobe的多位巨头都曾公开表示支持HTML5,但是现在Adobe却在阻止HTML5规范的发布。 这不奇怪,因为HTML5规范中视频标签(video tag)的部分是不利于Adobe利益的,今天Adobe不颠覆HTML5,回头HTML5就会颠覆Adobe Flash技术,Adobe要是这么痛快就对HTML5点头就怪了。 閱讀全文

谷歌Buzz服务刚推出即成为垃圾邮件攻击目标

据安全公司Websense称,尽管谷歌的“Google Buzz”服务本星期才刚刚推出,但是,垃圾邮件制造者已经把谷歌的社交网络服务“Google Buzz”当作攻击的目标。
Websense 称,Twitter网站在推出一段时间之后才成为垃圾邮件制造者的攻击目标。然而,垃圾邮件制造者已经学会了如何滥用社交网络,他们仅用两天时间就开始攻 击谷歌的“Google Buzz”服务。Websense安全研究经理Carl Leonard说,令人担心的事情是垃圾邮件制造者最近已经改善了社交网络的知识,从而使他们能够迅速对“Google Buzz”等新的服务进行攻击。

Leonard说,要安全地使用“Google Buzz”等社交网络服务,企业需要使用一个安全解决方案保护自己和员工。这个安全解决方案要能够实时跟上社交网站不断变化的内容。

Websense称,Web 2.0网站让用户生成的内容成为网络犯罪分析和垃圾邮件制造者的主要攻击目标。研究发现,博客、聊天室和信息栏中用户生成的评论有95%是垃圾信息和恶意 信息。

而且,在2009年下半年,81%的电子邮件保护恶意链接。

Websense称,当前新兴的威胁经常侵入传统的杀毒和安全解决方案领域,表明了对统一的网络、数据和电子邮件安全的需求。拥有正确的技术支持,Web 2.0将为提供真正的业务好处开辟许多新的机会。

Websense劝告网络用户在点击不明的链接的时候要非常谨慎。它还说,谷歌要准备好应对这项新的服务将产生的大量的垃圾信息。

Firefox、Chrome跑JavaScript几乎一样快

在SunSpider上检测JavaScript效率的测试结果显示,最新版Google Chrome浏览器的执行速度只比Mozilla的Firefox稍稍慢了一点。测试报告的重点还包括:Firefox的SunSpider测试结果仍以2,110分维持领先,但Chrome的得分正急起直追,以2,140分拉近了差距。分数愈低表示效率愈好。由于几次测试下来的结果不一,所以我引用的数据是数次测试结果的平均值。

市 面上的浏览器不只Firefox和Chrome两种,但拿这两种做比较很有意思。理由如下:一,两者都是开放原码软件,都意在以新的浏览体验挑战 Internet Explorer浏览器;二,基于上述理念,这两种浏览器可能吸引勇于抢先采用的使用者;三,两者都有新的 JavaScript引擎,Chrome的V8和Mozilla的TraceMonkey,在新beta测试版的预设状态下都是启动的。

JavaScript用来打造功能复杂的网站,例如Gmail或Google Docs,但也用于比较平常的运作。所以,JavaScript效率的速度加快是好事。Google曾提出一种可能性,就是未来网路应用程式也许能完全不 用JavaScript、直接采用Google新开发的原生用户端(Native Client)软件–这项研究计划宣称,可让架构在网路上的软件跑起来几乎像在电脑上执行一样快。

Chrome在的JavaScript效率测试中一直都在进步,Firefox的表现则时好时坏。

不过,SunSpider只是其中一项测试;在Google自己的JavaScript效率测试中,Chrome大获全胜。第一个Firefox beta版有瑕疵,妨碍我在Google的效率测试上做检测,但新的beta版产生的分数是182分,比先前的Firefox 3.1 beta版的235分低,所以或许仍有些地方有偏差。无论如何,这结果都跟Chrome 0.4.154.33版的2,635分相差甚大。

要注意的是:你的测试结果可能跟我的不同。我的上述测试是在双核心联想Lenovo T61笔记型电脑上做的,搭配的是3GB内存与Windows XP。JavaScript只是网页浏览器效率的一个方面,而且,这软件现在只是beta版而已,尤其Chrome还只是developer beta。最后,我得向部分读者说声抱歉,因为时间限制,我无法测试最新的WebKit builds和 Opera。

根据Google Chrome计划经理Mark Larson的说法,Chrome 0.4.154.33修正了先前的软件错误,包括在64位Windows开启选项(Options)对话框时会宕机,以及使用Hotmail时遭遇的一些 问题。但Larson说:「Hotmail仍无法妥善辨认Google Chrome。」

中国政府网率先启用”政务”专用中文域名

新闻来源:新华网
记者日前从中央编办政务和公益机构域名注册管理中心了解到,中国政府网已率先开始使用“中国政府网.政务”专用中文域名。
据了解,中国政府网还使用了“中国政府.政务”、“国务院.政务”、“国务院办公厅.政务”、“中央人民政府门户网站.政 务”等多个专用中文域名,网民今后就可以通过这些专用中文域名直接访问中央政府门户网站。 中 国政府网是我国最高级别的中央政府门户网站,是国务院和国务各部门,以及各省、自治区、直辖市人民政府在国际互联网上发布政府信息和提供在线服务的综合平 台。中国政府网专用中文域名的开通标志着我国政府网站域名规 范工作又迈上了一个新的台阶,对于进一步加强政府网站建设管理工作具有十分重要的意义。

在采访过程中,一些网民表示,以往我国政府网站在使用英文域名时很难做到非常规范,有的网站使用英文,有的使用汉语拼音,或者仅是几个字母的缩写,很难准确记忆,同时从域名上看也无法反映网站主办者的机构性质。

调查显示,我国的普通网民很少有人能够准确记忆10个以上的政府网站的英文域名,如何能使习惯于使用中文的我国网民用最直接的方式准确找到政府网站,政务专用中文域名的设立为此建立了一条绿色的通道。

另外,一些政府网站的管理者表示,“政务”、“公益”专用中文域名的设立和应用为政府网站在互联网中建立了一个明确的标识,便于网民准确识别,能够有效避免假冒网站所带来的社会危害,同时也对于保护政府部门和公益机构的合法权益具有十分重要的意义。

Web 设计:实现干净代码的12条定律

新闻来源:Smashing Magazine
漂亮的代码是漂亮网站的基础,优秀的 CSS 只存在与同样优秀的 HTML 之上,干净的,语义的 HTML 代码让一个网站更健壮。本文讲述了12个实现干净 Web 设计代码的定律,适合于任何从事 Web 设计的人。

1. Strict DOCTYPE
要做就做对的。不管是 HTML 4.01 还是 XHTML 1.0,它们都提供 Strict 模式,使用 Strict 模式可以保证我们的代码不隐藏任何错误。

参考资料:

2. 字符集声明,特殊字符进行编码处理
字符集声明应当放在 <hea> 部分的最前面,以便让浏览器知道如何显示网页中的所有内容,包括标题。另外,一些特殊字符,如 & 最好用 &amp; 代替,这是一种最安全的方法。

参考资料:

3. 恰当的锁进
缩进不会影响网页的渲染,但会明显改善阅读源代码时的体验。缩进没有特定的规则,但始终保持一致是个好习惯。

参考资料:

4. 将 CSS 和 JavaScript 放在外部文件中
将 CSS 和 JavaScript 放在外部文件中引用,不仅减低单个网页的尺寸,而且意味着其它网页也可以共用这些代码,另外,浏览器的缓存机制可以很好地降低对相同代码的重复下载。

5. 正确地嵌套 Tag 标签
如下图,第一行代码中,<h1>标签嵌套在 <a>标签中,尽管多数浏览器会正确渲染,但这不是好的习惯, 标签是 block 对象,而 是 inline 对象,inline 对象不应该容纳 block 对象。


6. 消除不必要的 <div>
<div> 常被滥用(尤其在我们现在所处的 DIV+CSS 神话中 – 译者),人们希望把任何东西都放在 <div> 中以便为它们分配 CSS 式样,这种滥用会导致的臃肿。

参考资料:

7. 使用更好的命名规则
如下图,Cat 的 CSS 类被命名为 red italic,暗示着 Cat 使用红色斜体,如果你想将 Cat 改成兰色的粗体呢?

8. 尽量使用 CSS 控制文字的排版
如下图所示,不要直接使用大写,用 CSS 对这些文字排版方面的格式进行控制,这样会更灵活。

9. 为 <body> 分配独立的 class/id
为 body Tag 分配一个独立的 class/id,可以很好地定位页面中任何对象,因为页面中所有对象都位于 body 中。

参考资料:

10. 验证
无需多言,你应当尽可能对网页的代码进行验证,尽管有些代码错误浏览器能自动更正,但有些错误是会带来不好的后果的,尤其当你位于 Strict 模式下。即使什么都不为,看到那个绿色的 W3C 验证标志至少可以让自己舒服一些。

W3C 验证是否通过并不一定要什么拘泥,Web 设计中存在更多的考量,只拘泥 W3C 验证结果,可能影响一些更重要的因素,比如,IE6 在 W3C 标准方面存在不少 BUG,如果你为了100%通过 W3C 验证而宣布自己的网站不支持 IE6,至少在国内会得不偿失的 – 译者

参考资料:

11. 合理的结构次序
将网页结构保持一个合乎逻辑的次序。

12. 尽你所能
如果你从零开始写,保持以上的原则当然要容易的多,如果要修改旧的代码,将会很痛苦,一些 CMS 系统拙劣的编码会让你陷入泥沼,或者你的网站规模宏大要改动的东西太多,不管怎样,始终保持良好的习惯非常重要。

更多阅读:

本文国际来源:http://www.smashingmagazine.com/2008/11/12/12-principles-for-keeping-your-code-clean/

Web 设计工具箱:130 个 Web 设计工具

新闻来源:mashable.com
这是 Mashable 搜集的 130 个 Web 设计工具,涵盖了从初学者到高级 Web 设计人员需要的各种工具和资源。这是第一部分。同时请参阅 Web 开发工具箱:120个 Web 开发工具的第一第二部分。 初学者资源

YAML Builder – 简单易用的 YAML (Yet Another Multicolumn Layout – 做栏布局)XHTML/CSS 站点布局
Sky CSS Tool – JavaScript CSS 工具
The Box Office – 文字围绕图片的 CSS 格式工具
CSSTXT – 在线 CSS 文字式样生成器

izzyMenu.com – 免费 CSS 菜单

pForm – HTML 表单生成工具

Roxer – 拖放式网站设计工具

Wirenode – 创建移动站点

doodlekit – 在线网站设计及 CMS 系统,含表单生成器,Paypal 构物车,可互换的布局与图片,内置图片库

dotemplate – 可定制的网站模板

templatr – 创建网站模板的在线工具

Agency of Record – 面向创意设计者的网站设计与托管平台。

Typechart – 字样与 CSS 式样

CSS Type Set – 创建个性化 CSS 字体式样

CSSType – 试验各种 Web 安全的排版风格并获得相应 CSS

CSS Builder – 快速生成 CSS

Firdamatic – 不使用 table 设计2或3栏博客版面

PsycHo – 博客模板设计

folionow – 简单易用用便宜的网站设计工具

CSStxt – 自定义 CSS 文字式样

Viviti – 易用的网站设计工具

ComfyPage – 简单易用的免费网站设计工具,可定制模板,并添加任意多页面

LetsEat.at – Free website builder and hosting for restaurants that includes customizable menus, daily specials, printable coupons, and more.用于酒店宾馆的免费网站设计工具。包含可定制的菜单,每日特价,优惠券等。

webon – 免费的,不含广告的网站设计工具,可用来设计博客,像册,视频站

infogami – 快速设计网站,含可定制的模板。

edicy – 创建网站,并使用你自己的域名上线

Jimdo – 网站创建工具,集成了各种图片,视频等

Webnode – 免费创建个人或公司网站,拖放式操作,标签,免费托管


iompi – 创建电子商务网站

easysite.com – 网站创建工具,含照片,视频,博客,免费电话支持

myfamily.com – 免费的,不限空间的家庭网站创建

MomentVille – 免费婚礼网站创建工具

SeeYouThen! – 婚礼网站创建工具,含高分辨率照片交换,私人消息,客人资料等

GoHoster – 支持子域名的免费网站创建工具

BlinkWeb – 免费的拖放式网站设计工具,含电子商务选项

Macrocasa – 房地产行业网站创建工具,包含中介消息系统及客户管理系统

Pixie – 免费的,开源网站创建工具,含直观的界面,容易安装部署

Squarespace – 一个强大网站创建工具,含 XHTML 验证,所见即所得编辑器,博客平台。

NicEdit – 跨平台内容编辑器,可以在浏览器中直接编辑网站内容

WordPress Theme Generator – 使用该工具你可以创建完全定制化的 WordPress 主题

高级专业设计者资源

CSS Superdouche – 净化 CSS 以降低其复杂性

Code Beautifier – CSS 代码格式与优化

CSSFly – 在浏览器中编辑 CSS 和 XHTML

CSS Drive CSS Compressor – CSS 压缩工具

Clean CSS – CSS 净化与优化工具

EM Calculator – 将基于 px 的尺寸转换为 em

CSS Redundancy Checker – 清除未使用 CSS 选择器,检查 CSS 中多余代码

GrayBit – 将彩色网站转换成灰度级以测试其可访问性

ProtoShare – 创建网站模型,从团队获取反馈,创意与建议

Most Sliced – 图片切片服务列表,含评测与用户评分

Inserit – 一个用于 Web 设计师的 CMS 系统

LightCMS – CMS 系统

clickbooq – 网站创建与管理工具

jumpchart – 网站规划程序,可输出干净的 CSS/XHTML

inblogit – 博客工具,可以集成到任何网站

Reflect – 网站设计与托管平台

Carbonmade – 让设计者们在线展示自己的作品

ThemesPress – 将 Template 文件转换成 WordPress 主题

Feng GUI – 这是一个很有趣的工具,它模拟人类在5秒钟内看到一个网页画面时的印象,分析你网页中最容易被人注意的热点位置。

Text GeneratorLorem Ipsum 傀儡文字的替用品

webvanta – 商业网站创建与托管

Tuplix – 直接在网页上更改内容

FolioSnap – 创意设计者用来展示作品的工具

Frontfriend – 供网站设计者使用 CMS 系统,可以创建表单和模板,供最终客户填写

Web 2.0 峰会:Google 与 Wikipedia 谈垃圾过滤

在好莱坞如果你被狗仔队盯上上,说明你是成功的,在硅谷,如果你被垃圾信息盯上,也说明你是成功的。周三上午,在 Web 2.0 峰会( Web 2.0 Summit),来自 Google, Reddit, Pramana 以及 Wikipedia 的代表畅谈了如何抵制垃圾信息。

Google 的反垃圾信息团队的主管 Matt Cutts 说,如果你提供链接相关的服务,就难免遇到垃圾信息。Cutts 谈到了3种类型的垃圾信息,Spammer 们用来推广站点的垃圾链接;向那些允许用户提供反馈的网页提交垃圾内容;从一些老的 CMS 系统中发现漏洞将垃圾信息注入受害者网站。

针对垃圾信息,Cutts 建议使用 Akismet 一类的信息过滤服务,部署 CAPTCHA,勤打补丁,甚至对注册收费等手段进行应对。他建议人们跳出思维圈子,使用一些意料不到的方式对付垃圾信息。如果你让垃圾信息发布者产生挫败感,比向他们收费还有效。

Reddit 的创始人 Steve Huffman 谈到了他们使用的一些方法,对垃圾信息发送者进行误导。他表示,Reddit 是一种类似 Digg 但比 Digg 更好的服务,Digg 允许用户提交他们喜欢的内容的链接,并对发布的内容进行投票,获得投票数越多的内容被阅读的几率越大。

但 Reddit 有所不同,在 Reddit,有些投票不被计算。一旦 Reddit 探测出某人是在发送垃圾信息,他的帐户会被抵制,但 Reddit 不会通知发垃圾信息的人,他的提交还正常进行,但他提交的内容不会发布。Huffman 表示,我们使用一些技巧让垃圾信息发送者以为他们的伎俩得逞。

Jonathan Hochman 是 Wikipedia 的管理员,他谈到了 Wikipedia 应对垃圾信息和蓄意破坏时使用的一些策略。他说,我们花费了很多时间让 Wikipedia 保持干净。Wikipedia 中 20% 到 30% 的编辑操作是蓄意破坏以及对蓄意破坏的修复。

Wikipedia 是一个允许任何人参与编纂的在线百科全书,但少为人知的是,这个站点依靠的是计算机自动编辑,Hochman 解释道,一些自动程序参与了编辑工作。

比如 ClueBot,它参与了大约80万篇文章的编辑,ClueBot 做了大量文章复原与修复工作,如果有人不断地对某个页面进行破坏,它会通知人进行干预。

Praman 的 CEO Sanjay Sehgal 则讲述了他们的 HumanPresent 技术,该技术用来保护他们刚刚发布的,尚未命名的海量玩家游戏,他说,CAPTCHA 不起作用,因为很容易被破解。

Pramana 的技术会尝试辨别真正的用户与自动程序。一个游戏中有太多机器人玩家会让游戏崩溃。这个技术不仅仅用于阻止 Spam,还帮助改善用户体验,提供流量数据。自从使用了 HumanPresent 技术,Pramana 发现 12% 到 15% 的流量来自机器人程序

JavaScript可能会成为新的黑客攻击点

随着Web 2.0的发展,互联网的互动性已经越来越强,不过据IT安全公司Radware安全运营中心主管Itzik Kotler的警告。JavaScript可能会成为新的黑客攻击点。
Kotler除了为Radware扫描软件开发新的签名和分析工具之外,也在寻找新类别的安全漏洞。据他发现,使用JavaScript中的一个安全漏洞,可以使黑客从客户电脑拷贝走文件而不容易被检测到。 < 在本周伦敦进行的RSA安全会议上,Kotler演示了这种黑客方法,他同时展示了如何通过在浏览器中执行HTML代码来检测防病毒软件的存在。 Kotler表示,这种新的攻击方法因为以下两种优势将吸引网络罪犯,一、这种方法不容易被检测,二、可以跨平台跨浏览器。

他得出的结论是,虽然这种攻击方法尚未被黑客采用,不过浏览器厂商和安全公司必须确保浏览器在更加灵活的同时不给黑客打开后门。

网站改版在优化的方面应该注意的几点

针对目前竞争日益激烈的网络营销这块。企业在获得了针对性的网站流量以后。怎么让进入网站的用户最大可能的成为客户,让有限的流量带来更大的客 户,提高网 站的客户转化率成为网站需要解决的问题之一。从而不免的会出现网站的版面为了适用潮流变化及更好的达到ue(用户体验度).不断的出现改版的情况。

问题也就随之而来。网站的改版必将在网站的的关键字布局及网站的关键字密度等各方面出现改变。从而对于网站的se排名也会出现波动。更有甚者,讲使网站出现降权和网站被拔毛的显现。为了将损失降到最低。网站在改版的时候就需要注意一些优化的要点。绝对不能盲目的进行!

首先,我觉得最重要的就是head部分千万不能在改版的时候出现任何的变化。在 body部分上面出现了大规模的改动的情况下。网站的head也变化的话。网站已经可以说是面目全非了。造成se对网站短暂的不信任考核期。网站权威自然 会受到影响。排名的变化肯定也会是很大。所以在版面变化的情况下,竟可能使变化合理的过渡。慢慢的改变。肯定对于排名是有很好的稳定下效果。

其次,某些网站的改版。连程序都换了。在这里我们就需要提醒下操作者。对于原来的程序及生成的静态页面应尽最大可能保留。避免蜘蛛根据se的网站索引数据库入口进入网站,出现404网页不存在的情况。

再次,改版过程中的外部连接也要全部都转移到新的网站上面。这个既是职业的道德问题;也是为了链接方检查链接时发现我方删除了他的链接,而删除我们的链接的情况出现。

最后,网站改版后,在外链的导入方面可以适当加大点速度。吸引蜘蛛尽快将新页面抓取及刺激新页面尽早进入排名数据库。

当然,在具体的操作中。根据不同的情况还有其他的需要注意的因素。这就有具体问题具体分析了。

11个处于悬崖边缘的 Web 公司

新闻来源:webware.com
“我们将要失去一些优秀的公司”,最近,一些科技公司的投资者们发出这样的惊呼。他们中的一些我们并不会惋惜,但很多我们深爱的 Web2.0 公司也已处于悬崖的边缘。
问题是,深受喜爱和并不意味着一定成功,还记得 Kozmo 吗,这个上一次网络炮沫时代的即时通讯工具,任何使用它的人都喜欢这个工具,这个公司在初期忙于建立用户基础,却一直赔钱,当它终于可以赚钱的时候,已经太晚了,那是个悲剧。

Twitter
虽然很多人在使用,而且很多人依赖这个工具,然而 Twitter 仍然没有找到盈利模式,Twitter 的用户不会轻易离开,它应当尝试一点广告,很多人会希望看到这个公司赚钱,否则就太晚了。
Meebo
这是一个非常 Cool 的在线服务,但它的在线聊天服务的收入不可能总是那么理想,Meebo 位于 Facebook, 微软等大公司的旗下,但它高昂的估价与整个行业收购的下滑,将对它的继续发展带来障碍。
TripIt
一个用来管理旅游信息的,非常有用的服务。但等一下,在这个经济低迷的时代,谁还会频繁出游?人们都希望呆在家里把钱坐在屁股底下,用远程会议代替出差,要旅行?直接在自家的后院转转算了。
Zillow
地产网站的收入模式就是广告。地产广告或银行广告。然而在目前的经济形式下,人们都不会轻易出手自己的房子,会牢牢地抱住(说的是美国)
Pandora
人们喜欢这个产品,他们用它寻找自己喜欢的音乐。但它的问题是什么?过高的版权使用费会让它的运营成本非常高。它能否生存要看接下来和唱片公司的谈判,但这个公司太张扬了。
Second Life
代表 Web 界面与社会网络的未来,但运行太昂贵,而且很难用。
Skype
这个被 eBay 收购的革命性的 VOIP服务有一天也会遇到麻烦。Skype 不是 eBay 的核心业务,eBay 可能会将该业务剥离,但谁会出一个令 eBay 和自己都满意的价钱?
Ask
它为什么还没死?Ask 是个很好的搜索引擎,然而活在三个搜索巨头(Google, Yahoo!, Live)的阴影下肯定日子不好过,它的竞争成本将非常高。(其实 Ask 走的是知识搜索路线,属于人力搜索领域,这一点和目前的搜索三巨头并不十分冲突,请参阅:人力搜索的未来 – 译者)
DailyMotion
这个在欧洲流行的视频分享站点还没有找到可以用广告收入抵消其宽带开支的方式。
Netvibes
Netvibes 的小竞争对手 Pageflakes 于今年初被收购,这个应当发生在 Netvibes 身上才好。那些 Netvibes 的潜在收购公司,受萎缩的广告市场的影响,可能预告 Netvibes 的死期。
MySpace
虽然很赚钱,而且由 Rupert Murdoch 一手扶持,但这个以冷酷著称的商人很可能随手就将这个左日的社会网络公司摆脱掉。

本文国际来源:http://news.cnet.com/8301-17939_109-10063020-2.html?tag=newsLeadStoriesArea.0
中文翻译:COMSHARP CMS

关于Web,你可能不知道的

Web,全称为 World Wide Web,是 Internet 上最重要和最为人们所熟知的应用之一。Web 是指 Internet 上所有基于 http 协议的 html 网页、图像、音频、视频等内容的集合。虽然 Web 可能早已成你每天日常生活的一部分,但相信你对 Web 背后的秘密仍然很感兴趣。本文向大家展示了关于 Web 的一些通常不为人所知而又有趣的细节。

1. Web的流量

虽然Internet(包括其前身ARPANET等)的历史比Web要长的多,但直到 Tim Berners-Lee 爵士于1989年设计出Web并在1991年开始实际运行之后,Internet才逐渐大众化并开始流行。自1995年开始,Web占据了整个 Internet的大部分流量,而成为Internet上最重要的一项应用(注意不是“之一”)。

这种影响一直延续到今天:在日常生活中,我们一般甚至不 区分“Internet”和“Web”,而“上网”这个词在很多情况下指的就是浏览Web。Web在流量上的主导地位自2000年起受到以napster为始祖的P2P的挑战。相比Web来说,P2P在大型文件的传输上具有很大优势,因此虽然从广度来说Web仍然是主导,但在流量上自2002年起被P2P应用超过。下图显示了自1993年到2004年Internet上重要协议的流量变化。

但这种状况在2007年发生了逆转。随着网络带宽的增加,以 YouTube 为首的在线视频网站开始流行,使得Web的流量迅速增长并重新超过了P2P流量,尽管这个“优势”很微弱。总结一下,仅从流量的角度看,目前的Internet可以说是Web和P2P各占半边天,而其余应用所占的比重是越来越小。关于Web和P2P流量更详细的分析可以参考这篇文章

2. Web的规模

Web的规模定义为Web上包含的有效网页的数量。Google最近宣称已经索引了1,000,000,000,000个网页, 不过Google显然不敢宣称已经索引了Web上全部或绝大部分的网页,可以预计,Web的规模已经远远超过了上面这个数值。顺便提一句,“有效网页的数 量”严格来说其实是个伪命题,因为:1. 很多网站在被请求了不存在的页面时会返回一个友好的提示而非404错误(可以测试url:http://live.aulddays.com/ 后面跟上任意的文件名),理论上说它们仍然是“有效”的网页;2. 很多网页可以根据输入参数的不同而返回不同的结果(Google目前正着手解决的 Deep web 就是属于这种情况)。从这个意义上说,说Web的规模是无穷大的…

退而求其次,我们可以来估计一下有多少网页是Google没有索引到的:假设我们知道了两个不同的搜索引擎 A 和 B,它们索引的网页数量分别是 s(A) 和 s(B),A&B为两个搜索引擎的交集,那么根据容斥原理,所有被它们(中至少一个)索引的网页数量就是 S=s(A)+s(B)-s(A&B);这个公式还可以推广到多个搜索引擎的情况,则此时S会越来越靠近真实的 Web 的规模。不过很遗憾,这个公式很不实用:-( 虽然 Google 不久前迫于 Cuil 的压力公布了自己的索引量,但其他几大搜索引擎仍习惯于对这个数据秘而不宣;更糟的是,Google 或是 Yahoo! 显然不可能把自己的索引库共享给对手以求得 s(A&B) 这项。不过,Bharat 和 Broder 在1998年基于统计学原理提出了一个很巧妙并且很著名的解决方法:记 Pr(A) 为某个元素属于集合 A 的概率,Pr(A&B|A) 为已知一个元素属于 A 时而它同时属于两个集合的条件概率。 则可以推出:Pr(A&B|A)≈s(A&B)/s(A),Pr(A&B|B)≈s(A&B)/s(B),即得 s(A)/s(B)≈Pr(A&B|B)/Pr(A&B|A)。而 Pr(A&B|B)、Pr(A&B|A) 都可以用随机采样的方法根据一系列精巧构造的搜索用例通过实际的搜索实验估计出来,从这两个值还可以用来估算出 s(A&B) 的大小。再进一步,从语言学模型中可以估计出之前构造的搜索用例在整个语言文本中出现的概率,从而估计出 s(A) 和 s(B) 具体的大小。

现在的问题就集中在3点:搜索用例的独立性、搜索用例的覆盖性、和结果检验的完整性(搜索结果集可能很大,如果只看靠前的部分,通常这部分的 rank 会比较高,因而被同时索引的概率也会偏高,参考下面的Web的结构一 节)。Bharat 和 Broder 构造的方法着重解决了前两个问题,他们报告当时(1997年底)的几大搜索引擎HotBot, AltaVista, Excite, Infoseek (其时 Google 还未正式发布) 的索引覆盖率 (占整个已被索引的 Web) 分别为:48%, 62%, 20%, 和 17%,而 Web 的总规模约为 220,000,000。值得注意的是,他们的结果还显示各引擎的重合率 (即 s(A&B)) 很低,平均只有 1.4%,可见当时的索引水平也还处于较低的阶段。到了 2005 年,Gulli 和 Signorini 改进了结果检验完整性的问题并在新的搜索巨头 Google, Yahoo!, Ask/Teoma, MSN 上进行了测试,结果它们各自的覆盖度分别为 76%, 69%, 58%, 62%,Web的总规模达到了约 11,500,000,000。2006 年 Bar-Yossef 和 Gurevich 进一步优化了随机采样的理论,根据他们的结果,当时 Google, Yahoo!, MSN 的覆盖率大约为:64%, 65%, 50%,重合率平均为 44%,比1997年有很大提高。他们并没有给出估计的Web总规模,不过这组覆盖率数值应该比较接近目前的水平,因此结合上面 Google 最新的索引数量,相信大家不难估计出当前 Web 的总规模。

3. Web的结构

上面讨论了Web的规模。我们知道,Web的特点是各个网页之间由超链接互相连接而形成的网状结构,那么这么大的一张网具有什么样的特点呢?

Andrei Broder等人在2000年比较早的研究了这个问题,他们的研究基于两个Web爬虫各自爬取的超过2亿个网页和15亿个超链接,他们认为这些网页具有一种类似“领结(bow tie)” 的结构。领结的形状大致是中间一个大的“结”以及两边各一个三角形的“花”,在每个“花”上面附着了一些穗状的“花边”,而两个花之间还有一条长的“项圈 ”让领结可以套在脖子上。中间的“结”是由约5600万网页组成的SCC(strong connected component,强连接组件),左边和右边的花分别是IN组件和OUT组件,分别包含4400万网页。剩下的4400万网页则是花上的穗状物 (TENDRIL组件)。在SCC组件中,任意两个网页都可以通过很短的有向链接路径到达彼此,它们是整个Web的核心部分。IN组件里的网页可以链入 SCC,但无法从SCC链回来,这些一般是比较新的网页还没有被大家所发现并链接到。OUT组件则是可以从SCC链入但不包含链回SCC的链接,这些可能 是一些只包含内部链接的企业网站。TENDRIL组件则是和IN或OUT组件相连但并不和SCC组件有较直接联系的网页,有趣的是,TENDRIL组件中 的一小部分可以联系IN和OUT组件而形成的“项圈”部分。还有很少一部分的网页是不被链接到的,不属于以上任何一个组件。这项结果中最令人惊奇的部分是 它显示SCC部分(整个 Web 中相互链接最稠密的部分,因而通常也是最经常浏览的部分,参考 PageRank 的基本原理,它们通常具有较高的 rank 值)的大小只占整个 Web 的一小部分,这暗示Web上可能大量充斥的是那些没多少“价值”的网页

当然上面的是2000年的情况,在最近几年中Web的结构可能发生了变化,因此一些新的理论也被提了出来。2005年 Debora Donato 等人研究后认为,Web的结构已逐渐转变成一个类似“菊花” 的形状:在 IN 和 OUT 组件内部出现了很多符合 IN-OUT-SCC 关系的细微结构,因而 IN 和 OUT 可以进一步被细分而形成围绕在 SCC “花心”周围一圈大小不一的“花瓣”。不过在他们的结果中,SCC 的比例有所扩大,在部分数据集上甚至达到了 72.3%,这也让后来的研究者对他们的数据集覆盖性产生了一些怀疑,或许有一些较深的弱链接网页没有被他们索引到。另外,他们的结果还显示,不同语言的 Web 子集其结构有相当大的区别,其中最突出的特点是英语的页面无疑是 Web 的核心,其他语言的网页有很多指向英语网页的链接,而反过来的情况则相当的少。最后是中文 Web 的情况,今年 Jonathan J. H. Zhu 等的分析将中文 Web 形容为“茶壶”的结构:相比 IN 组件,OUT 组件的变小了很多,因而在 SCC 两侧构成了一大一小形如“把手”和“壶嘴”的结构,而游离的 TENDRIL 组件则很像壶中滴下的水滴。

Opera:拉美成移动 Web 增长最快的地区

新闻来源:VentureBeat
近日,浏览器开发商 Opera 的一份报告称拉 美地区是移动电话用户持续增长的地区之一,它的三个主要经济体,巴西,墨西哥,委内瑞拉同时是移动 Web 增长最快的地区。Google 是该地区被访问最多的网站,紧随其后的是一些颇受欢迎的社会网络,如 Google Orkut (巴西),hi5 以及一个被称作 metroFLOG 的区域版,Facebook 的访问量也在攀升。

閱讀全文

拥抱Web 3.0

Web 3.0的最大价值不是提供信息,而是提供基于不同需求的过滤器,每一种过滤器都是基于一个市场需求。如果说Web 2.0解决了个性解放的问题,那么Web 3.0就是解决信息社会机制的问题,也就是最优化信息聚合的问题。
Web 3.0
《纽约时报》商业栏目记者John Markoff曾在一篇文章中写道:“人们对Web 3.0或者说是语义网的商业兴趣正在凸现。”这句话虽未对Web 3.0给出明确定义,但不管怎样,语义网这一概念在《New York Times》商业栏目中的出现,我们也看到了未来的发展趋势。

语义网(Semantic Web)之路

简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。

语义网将使人类从搜索相关网页的繁重劳动中解放出来。因为网中的计算机能利用自己的智能软件,在搜索数以万计的网页时,通过“智能代理”从中筛选出相关的有用信息。而不像现在的万维网,只给你罗列出数以万计的无用搜索结果。

目前,在RDF(Resource Description Framework,资源描述框架)和OWL(Web Ontology Language,网络实体语言)的支持下,语义网已经成为能够牢牢嵌入现有网页并且能完善RDF知识储备的新科技,而其理念雏形可追溯至10年之前。

1998年,Tim Berners-Lee就提出了语义网的理念。一些人认为它是关于AI(人工智能)的,另一部分人认为它更多是关于语言学的,还有一些人则认为它是关于数据注释的。而维基百科对语义网给出了这样的定义:一种使用可以被电脑理解的方式描述事物的网络其实,作为AI的一部分,语义网涉及的范围应该是围绕着对自我的理解和对与我们相关数据的理解。所以,人们可以在开发Web或研究AI的过程中不断地学习和理解语义网。

在Web上,我们已经看到了一些成功的商业模式,如Netscape建成的一个资源互享环境,Amazon和eBay的市场优势,以及Yahoo和 Google的网站广告模式。资源共享带给我们前所未有的改变,不过这种分享精神也可能导致所谓的长尾现象。举个买书的例子,在各大网站显要位置推荐的都 不会是最好卖的书籍,但过段时间,这些书的销量就会直线飙升,甚至远远超过一些畅销书籍。在这一过程中,链接是真正让搜索引擎工作的发动机,AI应用程序 必须与其他事物联系起来才能为我们创造财富。如果仅将其视为一种工具,将很难得到用户青睐。因此,对AI来说,智能设备具有划时代意义,而如何使用这些工 具将变得更加重要。

也许很多人认为Web 2.0已乏善可陈,但Web 2.0的动向曲线中还是可见不少有趣现象。总的来说,Web 2.0是网络科技的社会进化,它去掉了网络上合作性质的信息发布,加入了Tagging(标签)和Microformats(微缩过程)的技术,使得信息 的产生和选择升级至一个新阶段,这是Web 2.0的本质。可以预见,在未来几年中,Web 2.0将完成向Web 3.0,即语义网的转变。

web3.0带来新体验

在过去一年中,语义网概念更加深入人心,这得益于RDF语言和能够支持RDF语言的科技的成熟。

与传统结构的数据库相比,RDF数据库拥有诸多优势。针对这些优势,微软于2006年12月在其连接服务框架(Connected Services Framework 3.0)开发者指导中指出,RDF数据库让用户能够灵活地在计划图表中存储当初设计图表时没有考虑到的数据。不仅如此,RDF还可以帮助开发者拉近Web 与数据之间的距离,而这些都是传统的关系数据库做不到的。随着人们对RDF更多的认可,RDF自然成为了最重要的标准查询语言。

在所有服务中最重要的无疑就是信息搜索服务,作为对RSS高度整合的Web 3.0,搜索也被高度整合。人们只需要输入自己的需求,就可以迅速得到所需信息,甚至一套完整的解决方案。例如,在计算机中输入:“我想带我11岁的孩子去一个温暖的地方度假,我的预算为3000美元。”计算机能自动给出一套完整方案,这一方案可能包括度假路线图、适合选择的航班、价格适宜的酒店等。可以预见,承接Web 2.0的以人为本理念,Web 3.0模式中将会出现各种高度细分领域的平民专家。

即将到来的时代

中国互联网自进入Web 2.0时代后,在近3年内获得了高速发展,这种发展呈现出两种趋势,第一种趋势是基于用户的一个需求点,力图在一个平台上整合所有互联网服务。如博客中国 向综合门户阵营的靠拢,腾讯转型为综合门户。但这些转变更多的只是为了增加流量和提高用户黏性。

第二种趋势是在用户个别的需求点上进行深度挖掘,纵深发展。如淘宝、奇虎和Donews等。这类公司目前仅仅是业务领域的细分,并没有根据人群进行细分, 因此为了提升关注度,他们同样在做综合门户所做的事情,于是纷纷被打上Web 2.0标签,但信息依然散乱,用户依然海量而缺乏细分,而广告主依然因不知该在哪里投放广告而大伤脑筋。可以说,即便借助Web 3.0,这些公司的运作模式依然还是2.0思维。

真正的Web 3.0不仅止于根据用户需求提供综合化服务,创建综合化服务平台,关键在于提供基于用户偏好的个性化聚合服务。在Web 3.0时代,同一模式化的综合门户将不复存在,如人们看到的新浪新闻首页将是个人感兴趣的新闻,而那些他不感兴趣的新闻将不会显示。当然,这种个性化的聚合必须依赖强大的智能化识别系统,以及长期对于一个用户互联网行为规律的分析和锁定,它将颠覆传统的综合门户,使得Web 3.0时代的互联网评价标准不再是流量和点击率,而是到达率和用户价值。

因此,Web 3.0时代能够赢得用户青睐的公司,一定是基于用户行为、习惯和信息的聚合而构建的,人性化、友好界面、简单易用一定是其核心元素,基于用户需求的信息聚合才是互联网的趋势和未来。

文/中国计算机报

Javascript 2 前途尘埃落定

新闻来源:webmonkey.com
作为 Web2.0 时代众多 Web 功能动力源泉的 Javascript 技术,以及其规范标准 ECMAScript ,曾一度被指出需要做出改进, 这一改进曾由两个工作组并列进行,一是由 Adobe, Mozilla, Opera, 以及 Google 等主导的 ECMAScript 4 小组,另一个是 Microsoft 和  Yahoo! 主导的 ECMAScript 3.1 小组。日前,这两个小组达成一致,推出 ECMAScript Harmony 项目,旨在对这两个工作组各自的 ECMAScript 标准进行统一,以共同推动 Javascript 2 的发展。
JQuery 的创始人,Mozilla 公司的 John Resig 在其博客中对 ECMAScript Harmony 项目做了详细解释。

ECMAScript Harmony 最大特点是,Javascript 2 中很多被期待的,非常重要的改进都被取消,比如,类似 Python 的 package 与 namespace 功能,关于 ECMAScript 4 (Javascript 2 的基础)的详细功能清单,请参阅 Google 一份文件

尽管取消了很多功能,Resig 认为,ECMAScript Harmony 项目的方向是对的,在 ECMAScript 上有话语权的众多公司(Mozilla, Microsoft, Apple, Opera, Google, Yahoo)之间达成一致意见,对用户来说是有好处的。

ECMAScript Harmony 项目将实现以下目标:

  1. 在各方的参与下,将重点放在 ECMAScript 3.1,并于明年初推出两个可以共存的版本。
  2. ECMAScript 3.1 的后期扩展工作,新工作将比 ECMAScript 4 更保守一些。
  3. 一些 ECMAScript 4 中的功能将被取消,如 package, namespace。
  4. ECMAScript 4 中的一些想法被重新设计以保持同 ECMAScript 3.1 的一致。

JavaScript 并非唯一基于 ECMAScript 标准的语言,Adobe 的 ActionScript  也基于 ECMAScript ,但 ECMAScript Harmony 项目对 ActionScript 是否带来影响目前还不得知。

语义一致与合理命名,及常见错误

转自http://www.junchenwu.com/2006/01/buttoninput.html

一句话概括主题:<button>具有<input type="button" ... >相同的作用但是在可操控性方面更加强大。

HTML 4.01规范Forms部分指名表单有以下几种控制类型:buttons, checkboxes, radio buttons, menus, text input, file select, hidden controls, object controls. 其中除了buttons/menus/object controls之外,都是由<input>完成。

我这里说的是<button><input>

<button><input>

规范中指名:可以用<button><input>来做表单按扭。不同的按钮类型请参考这些元素的详细定义。要注意的是<button><input>支持更丰富的表现功能。

一些区别

大家都知道<input>可以这样用(实际上是一定要这样用):<input type="submit" value="OK" />,一定要这样闭合。而不是:<input type="submit" value="OK" ></input>。因为起始标签为必须,而关闭标签是禁止的。

<button><input>更厉害的地方就在于它可以包含内容。它的值并不是写在value属性里,而是包含在标签中。如:<button>OK</button><button>的起始标签和关闭标签都是必须的。这样你便获得了样式化的主导权。

你可以这样写:<button><strong>OK</strong>, I do.</button>,甚至是插入图片:<button><img src="button.gif" alt="" />, it's great.</button>。有点类似于<input type="image">,但是显然强大多了。

最后要注意的是,被<button>包含的图片,不能使用热点地图,即不能<img src="foo.gif" usemap="..." />,这是不合法的。当然也不能再包含诸如input, select, textarea, label, button, form, fieldset, iframe,和isindex(不推荐使用)元素了。

(X)HTML Strict 下的嵌套规则

下面是一份在 HTML 4 Strict 和 XHTML 1.0 Strict 下必须遵守的标签嵌套规则,比如你不能在 <a> 里面再嵌入一个 <a> 这样的约定。

说明:

  • 为了方便读者阅读,本文中的标签使用了大写(根据 XHTML 的规则,元素名必须小写,比如 <html> 而不应是 <HTML>
  • 小写的单词表明一组或一系列 HTML 标签
  • 每一项条目(标签)后都跟随一组标签列表,如果没有这个列表,那么表明该条目(标签)内部不允许包含任何标签。这意味着该条目内部只能包含纯文本内容(#PCDATA,见下文)。如果注明 (empty),这意味着该条目内部不允许包含任何形式的内容。对于 flow,inline,block,OBJECT 和 BODY,其内部允许包含的内容在文中会单独给出。
  • #PCDATA 的意思是“parsed character data”,即纯文本内容(不包括任何 HTML 标签,但是转义内容可以存在,比如 &auml;&#228;
  • CDATA 的意思是“character data”,这意味着不包括转义内容的纯文本内容,详细内容可以参考CDATA Confusion
  • excluding … 意即不得直接或者间接的包含所列的元素
Allowed Nesting of elements in (X)HTML Strict

allowednesting

注1. 以上内容基于 [HTML 4.01 Specification] 的 Strict DTDJunChen 翻译自 Allowed nesting of elements in HTML 4 Strict (and XHTML 1.0 Strict)

注2. 对于 XHTML 1.0,基本上一致,不同点如下:

  • 对于 <script><style> 的内容,在 HTML 4 里是 CDATA 而在 XHTML 里是 #PCDATA
  • 在 XHTML 中,<table> 标签后可以紧跟一个 <tr>,而在 HTML 4.01 里,不允许这样,不过 <tbody> 标签又是可以省略的。意思就是说,如果代码中的 <table> 后紧跟 <tr>,对于 HTML 4.01,会隐性的生成一个 <tbody> 标签,而在 XHTML 里面就没有。这会影响到样式表使用 tbody 作为选择器。

欢迎来到Web 3.0:现在你的其它的电脑就是一个数据中心

原文作者:Marc Benioff
原文链接:Welcome to Web 3.0: Now Your Other Computer is a Data Center
翻译:bill.chen
从10年前一直到现在,我们一直在见证一场决定性的变革:从客户端-服务器的软件到作为服务的软件。Google, eBay, 和 Amazon.com等企业在消费市场建立了互连网应用程序的价值,同时salesforce.com,Google,和其它一些公司也一直在证明相同的 模式也会在企业级市场取得成功。

到目前为止基于Web应用程序的转型已经产生了两个强烈的浪潮。现在我们看到了第三个,我们称之为Web 3.0,它可能会证明相对于传统软件产业它是最重要一个。

世界不需要另外一句行话,我想说的是新生代的企业家,开发者,和传统的独立软件开发商,都需要抓住Web 3.0的巨大机遇,它可能创造机会,变革。Web 3.0是关于使用基于服务的软件平台来替换现有的软件平台。

为了详细说明Web 3.0,我们需要仔细回顾Web历史上的重要浪潮。它们不是严格按时间定义的,而是交叉重叠在一起的。

Web 1.0: 任何人可以交易

Web 1.0 是关于来自一些主要的公司,如:eBay, Amazon.com, and Google 的杀手级的应用程序的出现。我们一直认为它们仅仅是网站,但它们实际上是一些令人惊讶的应用程序:功能丰富,容易上手,扩展性强,这些特性以前很少被普通 消费者看到过。交易,不仅仅是针对货物的,还有知识的,变的普遍和即时。效率,透明,这个曾经是全球金融市场的领域,现在被个人消费者和商业者占领。 Web 1.0在今天依旧是很大的推动力并且在将来持续很长时间。

Web 2.0: 任何人可以参与

Web 2.0是关于互连网上的下一代应用程序,特点是用户产生内容,合作化,社区化。任何人可以参与到内容的创建中。在YouTube上上传一个视频,在 Flickr上上传参加聚会的照片,或者在Blogspot上写自己的政治见解,所有这些都不需要专门技术,仅仅需要连接上互联网。参与改变了我们对于内 容的理解:内容不是固定在发布商那里,它是活动在任何地方的。Google的AdSense带来了一个即时的商业模式,尤其对于博客作者,并且视频共享网 站已经重写了流行文化和内容过滤的规则。

当你围绕Web1.0或者2.0创业的时候,建设一个安全的,可扩展的数据中心并不是一项容易的工作。对于进入把软件当成服务的行业,大量的时间和资本依 旧是进入的一个门槛。而且,传统的客户端-服务器的软件开发依然复杂。并且创建一个成功的应用程序还需要辛勤的部署和维护。

Web 3.0: 任何人可以创新

Web 3.0通过改变传统软件行业的技术和经济基础来改变现有的一切。新的Web 3.0强调的是任何人,在任何地点都可以创新。代码编写,协作,调试,测试,部署,运行都在云计算上完成。当创新从时间和资本的约束中解脱出来,它就可以欣欣向荣。

对于企业来来说,Web 3.0意味着SaaS程序可以比传统的C-S软件更快,更高效的开发,部署,升级。

对于开发者来说,Web 3.0意味着他们需要创建一个理想的应用程序东西需要的仅仅是一个想法,一个浏览器。因为世界上的每一个开发人员都可以访问强大的云计算,Web 3.0是全球经济的推动力。

对于独立软件开发商,Web 3.0意味着他们可以花费更多的时间专注提供给客户的核心价值上,而不是支持它的基础架构。因为代码生长在云计算上,全球的精英可以为它做贡献。因为它运行在云计算上,全球的市场都可以把它作为服务来订阅。

问问我的朋友Jeremy Roche,CODA 公司的CEO,CODA是欧洲第二大ERP软件供应商。CODA成功从大型主机转型到客户端-服务器模式,但是现在它面临着一个更大的转型到SaaS上。 建立基础架构,不仅仅是数据中心,而是整个软件堆栈,将花费2亿美金和几年的时间。Jeremy正在使用我们的Force.com平台来来开始转变。他们 的系统工程师不需要维护服务器,负载均衡,网络交换机,而是找很少的人来调试维护他们。软件开发人员不需要开发安全和共享模型,数据库和工作流引擎-他们 只需要用我们的。同时,Jeremy的团队可以专注于他们擅长的:建立一个杀手级的会计软件。CODA2go将会在这个秋天发布,从而让Jeremy在竞 争中领先一步。

创造价值

Web 3.0将带来多大的改变?检查一下工作中的技术变革将带给我们一些好的线索:

Vic Gundotra,Google工程副总裁,在最近的salesforce.com会议上提出了这个有趣的观点。Vic回顾了计算机的历史,从大型主机的时代开始。

客户端-服务器时代在两种情况下都导致了极性的反转。计算能力非常容易访问到但是限制于使用的范围。有很强的功能,但是部署非常的困难。Vic说Web 3.0时代消除了这些缺点并潜在的最大化了计算能力,访问,容易部署,功能的深度。就像Vic所说,关键在于行业的领导者,如:Google, salesforce.com和其它的公司应该使运计算更容易访问和更具可编程性,保持深入的连通性,并且使客户端更强大。

在我们看来,从大型主机到客户机-服务器的迁移对于像IBM,DEC这样的公司是非常痛苦的,但是同时也为新一代的公司,如Microsoft, Oracle, PeopleSoft, and SAP创造了大量的财富。Web 3.0威胁着 Microsoft的.net,BEA和WebSphere。我期待Amazon.com,Facebook, Google, and salesforce.com将会做的更好,我认为能利用上 Web 3.0的公司分布会更为广泛,并且他们可以创造更多的财富和创新。

我们的一个程序员在他的个人电脑上有一句话生动的描述了Web 3.0精髓。是这样说的:”我的其他电脑是一个数据中心”。说明世界上的任何一个程序员可以创造。并且这就是革命的意义。

网络流行术语的起源

blog(博客)、browser(浏览器)、software(软件)、wiki(维基)和World Wide Web(万维网),这些词语大家今天已经是再熟悉不过了。网络的今天全得仰赖这些历史并不悠久的技术,以及给这些技术命名的人。那么你知道这些术语的来源么? 这些术语的背后,又有着怎样的故事?
BLOG(博客):这是“weblog”(网络日志)的简写形式,该词的最早出现似可追溯至1997年由Jorn Barger创办的“机器人智慧”网站。Barger在网站上开设了“logging the Web”(网络日志)栏目专门用来记录他在网络上无意间收集到的各种信息。而Peter Merholz则被认为是首次完整使用了这个术语的人。1999年,他在自己的weblog中写道:“我决定把‘weblog’读为‘wee-blog’,或者采用其简写形式‘blog’。”

BYTE(字节): 1956年,Werner Buchholz在IBM Stretch计算机的设计阶段采用了这个术语用来衡量计算机的信息存储容量。他是根据“吃下(bite)”这个词杜撰出来的,意思是一台计算机到底能“吃下”多少数据。不过需注意这个词的拼写,不要和“bit”相混淆。

BROWSER(浏览器): 经常被称为“Web之父”的Tim Berners-Lee在1989年开发出了他称为“WorldWideWeb”的软件。不过Berners-Lee说,“browser”这个词要早于Web,是作为“超媒体浏览器”而出现的。 

CELL PHONE(手机): 一般认为,是AT&T贝尔实验室的工程师William Rae Young首先提出了蜂窝移动电话的六角形蜂窝小区的概念。Young所做的工作在1947年与Douglas H. Ring合写的一份内部文件中提到过,该文论述了如何构建广域的蜂窝通信服务。用移动电话所拨打的第一个电话是1946年6月17日从圣路易斯的一辆行进的汽车中打出的,不过这部移动电话的形状和我们今天所见到的手机相差甚远。这部电话重约80英镑,采用的是AT&T的服务,(massive party line),每个月的服务费30美元,每打一次本地电话再加30到40美分。可惜,贝尔实验室却未能争得“手机之父”的美名。这个名头被摩托罗拉通信系统部的总经理Martin Cooper夺走,1973年4月3日,他携带着一部大块头的手机穿越纽约城,用这部电话给他在贝尔实验室的竞争对手Joel Engels打了一通电话。

CIO(首席信息官): 根据美国计算机历史博物馆的记载,任命IT人员担任高级职位是从军队和政府开始的,然后普及到工业界。William Synnott和William Gruber在1981年首次获得这一头衔。

COMPUTER VIRUS(计算机病毒): 这个术语今天被广泛用来描述可自我复制的和恶意入侵的软件,发明此术语的人是Leonard Max Adelman,他在1984年参与了“计算机病毒实验”的研究,并向研究人员Fred Cohen建议使用这个术语。Adelman还是RSA(Rivest-Shamir-Adelman)密码系统的联合发明人之一。

HYPERTEXT(超文本): Ted Nelson在1965年杜撰了”hypertext”和”hypermedia(超媒体)”这两个术语,1968年他与Andries van Dam一起在布朗大学共同开发超文本编辑系统。这些术语的前缀“hyper”的词义出自希腊语的“超越、超出”一词。所谓超文本就是计算机使用者通过超链 接和其他人共享文本信息的一种文本。超文本的首次实际使用是上世纪60年代Douglas Engelbart在斯坦福大学开发的“On-Line系统”上进行的。Engelbart还与Bill English共同发明了电脑鼠标。

INTERNET(互联网): 根据美国计算机历史博物馆的记载,这个术语是在论述TCP/IP组网的文献中首次出现的,目前能够查到的包含此术语的最早文献是IETF RFC675,此文献即是由Vint Cerf、Yogen Dalal和Carl Sunshine共同撰写的《互联网传输协议编程规范》,发表于1974年。

MAINFRAME(主机): 起源无法确定,但是美国计算机历史博物馆则相信,“main frame”这个术语的出现要早于计算机,是在机械和电话时代出现的。而当它在上世纪60年代上半叶再次出现时,是用来指称计算机的中央处理器,或者更经常地被用来指称不带外设的计算机。到了上世纪70年代,组合词”mainframe”则主要用来称呼小型机。根据计算机历史博物馆的记载,“今天,被大多数人视为主机制造商的IBM,在上世纪80年代之前并未将这个词作为计算机的一个分类词来使用。在1964年IBM System/360的操作手册中你肯定找不到‘主机’这个词。”

MALWARE(恶意软件): 这是用来称呼大量恶意代码的术语,首先使用它的人是Yisrael Radai,时间是1990年7月4日,在一封公开邮件中他写道:“特洛伊木马只是恶意代码(我杜撰了这个词来称呼特洛伊木马、病毒、蠕虫等等)中极小的一部分。”不过Chris Klaus则被认为是在论述中广泛使用该术语的第一人。

ONE-TRANSITOR DYNAMIC RAM (单晶体管动态RAM,简称DRAM): 今天,几乎所有的电脑芯片都在使用动态随机存取内存(DRAM),存储在一个内存单元中的每个信息比特都是由一个单晶体管和一个微电容构成的。IBM的研究员Robert Dennard为此在1968年申请了美国专利(专利号:#3387286)。今天的DRAM芯片一般可存储64Mb,是电脑和电器的一个关键部件。

PUBLIC KEY, PRIVATE KEY(公钥、私钥): Whitfield Diffie说,是他在1975年春杜撰了“公钥”一词来描述他作为“巡游密码专家”所采用的一种加密方法。

今天,Diffie富有远见的公钥加密概念已被普遍认为是数据安全领域的一次灵感爆发。使用者不必交换密钥就能彼此加密或解密信息。而且,信息接收者的公钥可以向全世界公布,只不过与此相关的还有一把密钥——Diffie称其为“私钥”——有了私钥和公钥,接收者便可解开加密的数据。Diffie在1976年的美国国家计算机学会上发表了他的公私密钥转换概念,并在同年与斯坦福大学的Marty Hellman教授一道发表了论文《加密学的新方向》。

Diffie认为,在公钥-私钥对的精心研制过程中,Hellman所做出的贡献和他自己的一样多。Diffie并不完全满 意“私钥”一词中的“私”字,因为“私密一词有多重含义。”但他补充说,全世界都应该感谢他的妻子Mary Fischer,在他们35年的婚姻生活中,Mary在他发明公钥的早期艰难岁月中给了他很多的灵感和支持,堪称是“公钥加密学之母”。 

PUNCH CARD(穿孔卡片): 早期的计算机输入指令用的一种纸质卡片,这个术语源自Herman Hollerith,他在1890年为美国人口局设计了电子制表系统,采用了穿孔卡片。

REDUCED INSTRUCTION SET COMPUTING(精简指令集计算,缩写为RISC):根据IBM科学家John Cocke在上世纪70年代初的发明,RISC被广泛用来描述一种CPU的设计方法,即利用简化的指令仍可提供较高的性能,随之出现的“RISC体系架构”则描述的是某些计算机是如何工作的。

ROUTER(路由器): 我们无法找出到底是哪个人发明了这个术语,但是在上世纪80年代的TCP/IP社区中,很多互联网先驱都称此设备为“gateway(网关)”,思科在某个地方甚至称其为“终端集线器”。部分是为了和其他也被称为网关(例如邮件网关)的设备有所区别,有一些早期的开发人员开始采用“router”这个词。 Noel Chiappa在1980年开始研制多重服务路由器,1987年6月,他在IETF RFC #1009中通篇都使用了“路由器”这个术语。从那时起,将“网关”改名为“路由器”就似乎被正式确定下来了。

SOCKET(套接字接口): 术语“socket”在组网领域的首次使用是在1970年2月12日发布的文献IETF RFC33中发现的,撰写者为Stephen Carr、Steve Crocker和Vint Cerf。根据美国计算机历史博物馆的记载,Croker写道:“命名空间的元素都可称为套接字接口。一个套接字接口构成一个连接的一端,而一个连接可完 全由一对套接字接口规定。”计算机历史博物馆补充道:“这比BSD的套接字接口定义早了大约12年。”

SOFTWARE(软件): 是由计算机执行的一组指令,和运行它们的物理设备即硬件相对应。这个术语是统计学家、普林斯顿大学教授兼AT&T贝尔实验室研究员John Wilder Tukey在1958年创造的,Tukey还在此之前12年杜撰了术语“bit(位)”(二进制位的缩写)。

WIKI(维基): Ward Cunningham说,为他在1995年开发的软件取名WikiWikiWeb的灵感来自一次夏威夷之旅,当地土语“wiki”的意思是“快捷”,他当 时乘坐的巴士就叫“Wiki Wiki巴士”。WikiWikiWeb后来简写成了“Wiki”。今天,一个“wiki”网站意思就是指一个凝聚了集体智慧的网站,众多的写手都可以为 该网站提供内容或编辑内容,这类网站中最有名的就是Wikipedia。

WORLD WIDE WEB(万维网): Web之父Tim Berners-Lee在W3C(万维网联盟)的网站上曾经描述过他发明Web时的初期工作。“第一个Web浏览器被称为‘WorldWideWeb’, 它毕竟是在上世纪90年代编写的,在当时是浏览Web的唯一方法。数年后这个浏览器又被命名为‘Neus’,是为了不至于混淆浏览程序和被浏览的信息空间。如今,‘World Wide Web’只用来称呼存储信息的空间了。” 

面向站长和网站管理员的Web缓存加速指南[翻译]

原文(英文)地址: http://www.mnot.net/cache_docs/ 版权声明:署名-非商业性使用-禁止演绎 2.0

这是一篇知识性的文档,主要目的是为了让Web缓存相关概念更容易被开发者理解并应用于实际的应用环境中。为了简要起见,某些实现方面的细节被简化或省略了。如果你更关心细节实现则完全不必耐心看完本文,后面参考文档和更多深入阅读部分可能是你更需要的内容。 閱讀全文

基于反相代理的Web缓存加速——可缓存的CMS系统设计

内容摘要:
对于一个日访问量达到百万级的网站来说,速度很快就成为一个瓶颈。除了优化内容发布系统的应用本身外,如果能把不需要实时更新的动态页面的输出结果转化成静态网页来发布,速度上的提升效果将是显著的,因为一个动态页面的速度往往会比静态页面慢2-10倍,而静态网页的内容如果能被缓存在内存里,访问速度甚至会比原有动态网页有2-3个数量级的提高

后台的内容管理系统的页面输出遵守可缓存的设计,这样就可以把性能问题交给前台的缓存服务器来解决了,从而大大简化CMS系统本身的复杂程度。
閱讀全文

每个 Web 站点都必需的十余个文件

原文链接: http://www.ibm.com/developerworks/cn/web/wa-webfiles/index.html

David Mertz, Ph.D (mertz@gnosis.cx), Old Schooler, Gnosis Software, Inc.

2007 年 9 月 24 日

不管开发 Web 站点所用的是何种内容管理系统或 Web 应用程序框架,都应该涵盖一些基本要素。能提供精致的用户界面和丰富的内容固然很棒,但在那之前,首选应该提供用户能查找到并能明了地表达该站点用途 的基本文件。

引言

有几个标准的文件是每个 Web 站点都必需的,但在很多时候它们却会被站点忽略。大多数这种文件都与约定有关,而非技术上的要求,但如果不能提供这些文件,就会使站点创建误入歧途。除了 URL 可以通过猜想尝试得到,通常用户很难通过猜想找到其他想要的东西。本文将对这些标准文件逐一简述。

给定的资源究竟如何提供决定于所使用的 Web 服务器层和 Web 应用程序层。在诸如 Apache 这类 “传统” 的、接近静态的服务器内,这些资源很可能就是服务器上的文字文件。但在不同的配置中,它们也有可能是数据库中的某些条目、配置文件中的某些行、服务器进程中的某些类等。本文重点放在用户最终所见之上,而非该如何让其发生。

404.html

当用户使用您的 Web 站点,他们不可避免地都会找寻一些不存在的资源。比起其他原因,这类寻找更多地是由于 URL 的拼写错误而致,但链接过时、后端的错误配置、不同点的 URL 残缺等因素也不容小觑。当资源不可用时,一个很好的做法是提供某种回转页面以协助用户导航到其他有用的页面。一个普通的 “没有找到” 虽然可以让用户知道资源不可用,但却无法帮助他们解决 “下一步如何做” 的问题。

警告:在创建定制的 404.html(或 Web 服务器用来发布定制 “没有找到” 消息的任何其他机制)时,太多的 Web 站点都会被错误地配置成发送 “soft 404” 消息。换句话说,它们会发送一个带常规的 “200 OK” 标题的页面,这仅仅说明了文本的某个地方“不可用”,也许还提到(但不经常)此处有 “404 Error”。应该避免这样做。相反,应该让用户(和他们的 Web 浏览器以及其他工具)省些事,使用确切的状态标题。

about.html

那么,究竟为何要创建 Web 站点呢?没错,需要用一个首页来回答这个问题。但更可能的情况是,首页并不提供这类信息,而只是让用户能够登录、突出站点的 “卖点”、显示某些花哨的内容等等。也许还需要让用户能够从首页导航到 “关于” 页面,如果真是这样,请务必让该信息能够从 http://mysite.example.com/about.html 获得。有些人习惯从此页寻找这类信息。

一个好的 about.html 页面应该能够提供有关站点功能、创建此站点的意图以及用户为何要关注此站点的总览,而且还有可能会有几个链接能够帮用户导航回站点的核心功能。此页无需、而且通常也不应该十分华丽。只需让它保持务实且准确,以便用户能够利用站点所能提供的所有功能。

contact.html

那么,如何联系您呢?借助 about.html,用户可以通过在现有主页上的多次单击获得此信息。不要让用户费太多力气才能找到此信息:将其放置于 http://mysite.example.com/contact.html。为相同的页面同样使用 contacts.html。请引入 .htm 扩展名。名称易得易用。当然,也可以将此信息留在这些单击产生的连串导航屏幕的最后;但为寻找资源提供冗余方案的做法也不错。

copyright.html

网站的版权归谁所有?有可能内容属于您,但您又是谁呢?个人?公司?合伙人?政府机构?如果内容属于公共领域或在自由内容许可的范畴内,那么可能需要告知用户这一点。时下,几乎任何内容都有各自的版权归属:如果您的内容遵从不同的原则,那么就请告知用户。但目前费心提供这类信息的网站还不够多,但为何不将它添加到自己的网站呢?因为总会有些用户会关注这方面的信息。

很明显,不同的页面或资源可能有不同的版权信息。请利用这个页面为用户提供有关如何确定那些个别差异的信息。如果有商标方面的问题,请一并提供。

index.html(和 index.htm)

并不是每个 Web 服务器都实际使用 index.html 文件来描述其主页。根据设置的不同,可能会有 URL 重写、依路径名动态生成等手段。但用户并不关心这些细节!只需让 http://mysite.example.com/index.html 指向主页,即便是为了实现这一目的而必须要使用简单 HTML 重定向。

对了,既然如此,那么就索性让老的 .htm 扩展名也生效吧。如果还觉得不够,就对 index.cgi 也如法炮制吧。

index.rss

很多 Web 内容都可通过 RSS 提供。虽然此种做法并不适用于所有 Web 站点,但对大多数站点而言还是比较有效的。让 RSS 内容独立于特定于用户的配置选项、登录或为特定的信息付费的做法极其合理。因为 RSS 也不能面面俱到。

虽然如此,如果有些东西 可以作为 RSS 提供,那么请尽管这么去做。也许,在 index.rss 给出的不过是 “广告” 内容,有时还会一并提供如何利用 RSS 提要的种种优势的老生常谈。有时又或许是有关 RSS 为何与您的 Web 站点不相关的一个说明。

privacy.html

一旦想要收集用户信息(即使只有用户名或流量日志),就要告知用户您打算如何处理这些信息。围绕 Web 站点创建者和/或用户的权力和责任的法律问题十分复杂 — 我不是一名律师,更无法解决 法律方面的问题。不过,若能考虑到用户的个人私隐,用户还是会感觉到的。而且也许您 应该在此时与律师 商谈一下该如何处理用户的数据。

robots.txt

如果不想让 Web 站点上的所有资源都能被自动工具编入索引,就请在 robots.txt 文件内加以说明。但如果确实 想让内容都编入索引,也请如实说明。Robots Exclusion Standard 指令并不强制用户:如果的确 不想让某些东西可见,就请不要将其放到站点,或者要确保其后有足够的许可保护。不过,所有主要的合法 Web 爬虫引擎都会遵从 robots.txt 内的要求。因此请尽量明确地说明您的意图。

security.html

security.html 的使用并不强制。但如果站点存在安全性问题(比如,从用户那收集了任何敏感的信息),为安全性流程建立文档说明(至少给出大致的概括)不失是个很好的做法。请在此页给出联系信息以防用户存在任何疑问或想要给出如何改进的建议。寻找这些信息应该遵从网站导航选项的整体组织。既然如此,不妨在这个 URL 也放上该资源。

站点地图

如何显示整个 Web 站点的地图还未完全标准化。为制作站点地图而提供的某些东西 总是很有用的,但这些东西究竟详细到何种程度取决于站点的动态程度(或动态的方式)。而且,想要为用户显示的内容也依赖于站点的意图。比如,如果用户没有对资源 X 的使用权限,那么让用户知道资源 X 的存在可能根本就不合适。请根据自己的判断和具体情况,设法提供一些东西

对于很多站点,提供站点地图只不过是对诸如搜索引擎这类自动机制的支持和友好。Google 在 robots.txt 约定的基础上发布了一个新的约定。总之,可以创建一个 XML 文件来给出站点所提供的所有资源。这有点像一个 “包含列表”,充当了 robots.txt 的 “排除列表” 的补集。

电子邮件地址

只考虑 Web 上的东西还不够。有时 Web 站点的导航工具并不能尽入人意(或者有的用户可能会对您的优雅设计不理解),因此最好让用户也能通过电子邮件联系到您。

请务必在 Web 站点的 contact.html 或其他地方显著地公布联系信息。但也请确保发到一般性的电子邮件地址的邮件能够送达给合适的人员。这至少包括 postmaster@mysite.example.com、 webmaster@mysite.example.com 和 security@mysite.example.com。对于那些 “老辈人”,可能需要让发给 root@mysite.example.com 的邮件也能转达到合适之处(但出于安全性原因,可能不是到 “root”)。请加入少许对电子邮件转发进行说明的文字,这些文字应该能清楚表明站点目的。电子邮件地址就像 Web 服务器目录中的符号链接一样易得易用。

参考资料