Archive for August 1st, 2006

快评kooxoo.com

Tuesday, August 1st, 2006

之所以要“快评”,因为到了该上床睡觉的时间了。

KesoKooxoo(酷迅)的评价很高。我读书的时候看过陈华关于北大天网FTP搜索引擎设计和实现的论文,印象挺深。搞技术的就需要这样上得厅堂、下得厨房的人。

Kooxoo应该算是个比较购物,与FroogleMysimon很像。Mysimon这个东东我早年仔细研究过,后来XML, Web services火了以后就对通过wrapper解析HTML的技术淡了许多。

如果索引的最小单位是页面,那么如内容保护和page ranking相对都比较简单;Kooxoo实际上挖的是网上服务提供商的关系数据库,而且是在没有ODBC/JDBC data source的前提下通过HTML/HTTP尽可能的发现非精确接口,然后通过定制wrapper精确化后做内容提取。所以Kooxoo的研究的最小单位不是页面,而是一个HTML table的每一行tr/td数据,这些数据基本上没有reference可供rank,实时性又很强,能抓到已属不易。

当你要把对方数据库里的东西抓出来放到自己的搜索结果里面,会有多少问题,不知道。小网站能获得更多的关注度,可能很happy;大网站觉得注意力分流,并被匿名的参与到集体比价的行列中,也许不happy。在Kooxoo默默无闻的时候天下会很太平(其实Google的Froogle到现在也是很成功的),可在国内互联网大环境下,”借腹生子”发家会被”万人大签名”讨伐的(参见迅雷事件)。

在分类信息检索的基础上,希望Kooxoo能提供论坛的实时检索,奇虎们可提高的地方还有很多。

20年前的IBM和现在的MS

Tuesday, August 1st, 2006

好像一夜之间,大家都不觉得微软可怕了,甚至有点同情它了。就好比一个和自己较量几十年的对手,突然开始变得行动迟缓、风光黯淡,反而觉得有点失落。

在这篇”Microsoft’s Current Situation: Like IBM in the ’80s” 博客文章中,把80年代失去个人操作系统业务的IBM与现在的微软做了一个对比,分析的很透彻。我欣赏的一些评论有:

“…The “toys” made by competitors just do stuff that users want. And they do it fast. And the users vote with their dollars…”;

“…In fact, it’s hard to find any example of buying into a market yielding a profitable long-term business. Subsidies kill innovation…”;

“…It (Microsoft) is too rich and comfortable to move quickly and win in new markets without its monopoly to prop it up….”

在大企业工作的人可能对这几点评论都有着深刻的理解。我长久以来的一个观点是,既便是Google这样工程师文化驱动的企业,当规模超过几万的时候,类似的毛病同样会出现。一旦1万个爱因斯坦在一个组织内一起工作的话,可能就有成百上千的爱因斯坦开始花更多时间考虑量子力学以外的东西了。