(一)RIA对于搜索引擎是一个挑战
所谓RIA (Rich Interface Applications富界面应用),即具有许多复杂功能的多媒体客户端,例如最为常见的有Flash动画,Javascript脚本构建的AJAX技术,以及还在襁褓之中的SilverLight。这些技术的兴起,是因为古老的HTML(HyperTextMark-upLanguage)已经无法满足当前Web客户端的多样化需求。HTML的本质是静态内容载体,它是由一系列描述标签组成的文本文件。本身并不具备动态执行脚本的能力,因此动态的生成内容必须借助其他的动态语言,比如ASP(Active Server Page)、PHP、Python、JavaScript等。这些动态脚本之中,ASP和PHP之类都属于服务端的语言,运行在服务器。它们执行的最后结果都输出为HTML页面,也就是说无论脚本如何复杂,最后还是回归到HTML,因此,服务端的语言基本上不存在优化问题,唯一产生的问题就是URL网址,后面经常带着一串用来传递数据的编码,导致同一个页面拥有许多不同的网址。
Google等搜索引擎,很早以前已经能够正确处理这些动态网址中的动态变量。但动态网址只不过是动态脚本带来的一个小麻烦。真正的问题,来自Flash和JS开始大规模应用。因为Flash和JS都是动态脚本,并且是运行在客户端的,换句话说,它们都运行在网站用户的浏览器之中,不再是单纯的HTML内容了。光是网址已经如此让搜索引擎头痛,那么面对整个脚本语言,搜索引擎又拿什么来吃透它呢?为什么网站要大量使用Flash和JS,无需争辩,这已经成为一个事实,并且他们占据了WEB内容的相当一部分,最典型的就是视频网站,它们的视频播放都是基于Flash的。现在要做的,就是正视这富客户端媒体带来的优化问题,尽力让他们对搜索引擎友好,使得网站内容在保持功能的同时,又能保证大部分内容能被检索收录。这些RIA的出现,对搜索引擎的蜘蛛是一巨个大考验。因为搜索引擎处理的页面,都是上亿的数量级,然而RIA却要求这些引擎对每个页面付出更多资源,来处理这些既动态又复杂的新媒体。
(二)关于单个Flash和整站Flash的优化进度
前段时间Adobe宣布了Google和Yahoo将获得官方提供的Flash解析能力,我曾经认为那是Flash的春天来了。后来才发现,问题比我想像的要严重。早在2005年9月Flash 6的时候,Adobe已经推出了一个SDK包,专门用来增强SWF文件的搜索引擎索引。有兴趣的可以搜索“SWF2HTML”,参见这个页面:http://kb.adobe.com/selfservice/viewContent.do?externalId=tn_16603,现在Adobe已经不再提供了这个SDK包下载了,只跳转到一个搜索的FAQ:http://www.adobe.com/devnet/flashplayer/articles/swf_searchability.html。网上可以找到更多关于这个SDK的资料,尤其是那些英文文章对它的描述分析不少。顾名思义,SWF2HTML,也就是Swf to HTML,能够把Flash动画转化为HTML内容,显然会过滤掉大量的动态脚本。而最后留下什么字符,也是有规则的,比如单引号/双引号内的http开头的字符,或者ActionScript2中,用getURL() 方法打开的网址(在AS3这个命令发生了变化,转为URLRequest类)。搜索引擎费尽力气,只为了能从SWF文件中得到一点可怜的索引信息,来分析整个网站的结构。
尽管费力,但结果依然不讨好。我们所知道的,Google能解读AS2版本的Flash动画已经有很长时间了。但是它们从SWF里面读到什么好东西了吗?没有。从我分析的几十个Flash来看,蜘蛛非常挑吃,位置比较深点的文字,它都无法消化。更不用说根据这点可怜的信息来描绘爬行路线。因为有ActionScript这样的动态脚本存在,一个Flash动画产生的结果几乎是无限的。它所获得的,不过是一些静态文字和注释罢了。
在应用Flash的众多网站之中,有少数网站整站都是Flash,这是Flash这个异类中的极端。这类网站与传统的网站不同,首页就是一个Flash,没有其他分页列表、内页之类的概念。尽管它也具有完整的数据库和服务端运行能力,但是这种整站Flash,所有的东西都通过Flash来展现。小从文字消息,大到文章视频,全部都成为这个Flash的一部分。尤其是Flex的出现,近期更是把Flash WebSite推到顶峰。对Flex有兴趣的,可以看看这篇文章《11个100%用Flex构成的网站》(http://ntt.cc/2008/04/05/the-list-of-creative-well-designed-and-100-present-pure-flex-websites-over-11.html)。其中就包含了迪士尼和惠普这样的巨头,还有,我的印象之中,似乎Nike的在线商店也是Flex构成的。在讨好用户还是讨好搜索引擎之间,企业还是最重视的还是用户上帝。
尽管我不知道最近Adobe到底为Google和Yahoo提供了些什么东西,但是Flash的SEO前景依然是一片暗淡,还有大量的工作要做。短期内还是不适合作为主力产品的,依然需要和HTML混合,以HTML带动Flash的方式去解决搜索友好性问题。反过来,运用得当的话,Flash又能增强SEO的力量,其中奥妙也不算是什么秘密了。
(未完待续,第二部分将谈谈AJAX以及RIA面向搜索的结论对策)
