Categories
Technology

百度博客搬家服务

百度开出博客搬家服务,我一点不觉得奇怪,倒是它提供的无需密码验证的“搬家”让我觉得很新奇。

在我写了blogChina搬家到WordPress攻略不久,就收到百度工程师的邮件讨论博客搬家的话题。现在看来百度提供的对MSN Space和新浪博客搬家手段可能是完全基于HTML的extract和parsing,而不是blogger API(写入到百度自己的博客系统可以用blogger API或者直接写DB),这就能解释它不仅支持搬自己的家,连别人的家一样搬。来自百度空间的说明基本能证实这一猜测:

在搬家过程中有可能会有部分文章、评论丢失、文章格式发生变化。如有少部分文章丢失、格式变化,您可手工将其搬入空间内进行调整

百度的crawler这么强,到网上搬点东西实在易如反掌。我猜百度内部应该有一个generic的Web crawler和多份customized crawlers,各个instance独立运行。博客搬家crawler跑到MSN,Sina上下载页面,抽取页面,扔掉所有外部链接,用广度优先的方法递归爬行,然后导数据。搜索引擎就是这样用别人的数据给自己赚钱,当然前提是提供了内容增值(数据可访问性),不好说这样以披着搜索引擎的外衣拷贝博客文章到自家的做法外人有没有想法,不过过去的众多经验表明粘着点原罪的第一枪往往会成为成功的催化剂。

Categories
Technology

On-line transaction? forget Firefox.

虽然我自己是Firefox的忠实用户,但是如果要在网上进行交易、支付、财务相关业务时,尤其是基于目前国内网站对Firefox的支持水平,还是得老老实实回到IE,少给自己找麻烦。自打我在Chinapay上吃过苦头后,这个弦就一直绷的很紧,特别是各个银行的网银业务,基本是Firefox的禁区。

即使是IBM,已经基本实现了内部主要Web应用对Firefox的支持,偶尔也会出点兼容性的小毛病。比如出差申请系统,如果用Firefox填表,生成表单的ID号就是空的,除非换成IE。

今天在家里做了三笔网上交易,也都是用的IE:去上海移动网站把今年的2000分积分兑换成50块话费;在网上订阅了2007年度的程序员IT时代周刊。 这两本杂志在浦东的报亭里不太容易买得到,如果漏买了的话我一般去来福士对面福州路、西藏路口或者吴江路、南京西路地铁口旁边的两家大报亭补买。

这是dW上介绍从IE到Firefox移植的经验和技巧如何兼容两种浏览器的文章,希望更多的公共事业、金融服务网站能够更好的兼容新兴浏览器。

Categories
Technology

vertical->horizontal

Tom Friedman在IBM townhall meeting上的手势让人记忆犹新:世界正从vertical走向horizontal。

从垂直到水平的转变,还发生在处理器身上。《程序员》第11期的译文“The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software” ,讲了同样的事情。这篇有关处理器发展的文章传达的核心思想是:由于电气物理特性的限制,无限制提高CPU主频进而提高软件执行效率的时代已经一去不复返了;未来提高处理器性能的方式将是多核;CPU处理能力的扩展由纵向增长转变为横向扩张。对于软件开发者来说,简单依靠升级CPU方式提高性能(免费午餐)已经结束,如果在软件开发上不考虑多处理器、多线程、并发的话,你的软件运行速度将在未来的计算机硬件升级的道路上原地踏步。

ecosystem,这无疑会是处理器厂商们的法宝:必须打造一个大环境,围绕在多核CPU周围,从OS, 编译器优化, 平台软件优化, 应用开发工具包等等都需要提供完整的支持(自己做;第三方做;自己和第三方一起做),否则高难度的、支持并行处理软件开发的高门槛终将被CPU厂商的低出货率所吸收。

先修地铁再造房,轨道交通与房地产开发的和谐发展,应用在上述领域的原厂商身上可能表现为软硬结合、新业务、新部门的出现,并可以用来解释一些看起有点蹊跷的新产品线和新的战略部署。

程序员们要辛苦了。

Categories
Technology

Evolution of JBuilder

1997年3月,JBuilder 1.0;

1998年4月,Jbuilder 2.0;

2006年11月,JBuilder 2007.

颠峰时刻的JBuilder,曾经每半年发布一个新版本,搞的群众意见很大。在经历了这两年在两条IDE战线上的失利、调整和重组,这次Borland CodeGear在Eclipse IDE上的发挥,很值得关注。虽然无论它到底表现如何我都会继续使用Rational IDE,在开源平台上的创新和Borland这个让人尊敬的对手都会让这场比赛变得更好看。

Categories
Technology

Programmable gaming console

作为本周抢购风潮中把无数人挤的人仰马翻的主角 – 索尼PS3游戏机,携带了由索尼,东芝和IBM共同开发的CELL处理器。虽说纵观目前游戏机市场的CPU份额,IBM以100%占有率暂时无人能及,可要更好的普及多核的CELL处理器,为游戏开发商(也包括其他基于CELL的应用)提供高效便捷的运行库迫在眉睫。

在本周《三联周刊》特别报道中回顾了当年阻碍世嘉土星销售的原因之一是采用了双CPU的土星,软件开发很困难,导致游戏开发商拒绝跟入。

在中国,IBM开发中心和IBM研究院,新成立了相关开发部门从事CELL库的开发工作,并将与国内高校一起合作。此前,在alphaWorks和dW上已经公布了CELL Brandband Engine的开发工具和相关入门文章

Categories
IBM Technology

第二条命

IBM刚刚公布的10项创新计划中,其中一个是”3D互联网“。在昨天下午的员工大会上,首席执行官Sam利用3D技术和主管创新与科技的副总裁Irving进行了虚拟对话,而这个平台正是Linden Lab的Second Life

第一次听说Second Life是不久前在一本杂志上,文章作者代表此杂志进驻SL;第二次是在昨天下午的IBM townhall meeting;第三次是今天早上在IBM dogear social bookmark里;第四次是在今天晚上Irving的博客里。到处都是Second Life,逃也逃不掉。

在去SL注册前,我阅读了wikipedia上有关SL的描述,对理解这个虚拟社区很有帮助。而虚拟世界里的”L币“,一种可以和美元互换的虚拟货币,让人联想到咱们腾讯的Q币,还有它不久前惹上的那堆麻烦。

由于免费用户只能选择名,不能选择姓,于是选用了”Ling Iceberg”做用户名。登录后,除了可以四处行走外,SL里的居民还可以像鸟一样自由飞行(下班后在地铁公交里闭眼急车的人,忍忍吧,回家就能飞了。)

如果用关键词”IBM“搜索,能找到不少先期抵达的来自IBM的居民,里面还有我们的CEO 🙂

有部电影叫《The Thirteenth Floor》,说的是在玩虚拟游戏的人发现自己原来也是在虚拟世界里被操作的木偶 (嵌套式虚拟空间),就是咱们庄周梦碟的外国翻版。如果能在SL中下载SL客户端,创建ID,进入SL的SL,该会是什么样有趣的场景。

Categories
IBM Technology

本周大事

Sun open source Java under GPL v2 license (openJDK)是本周一最重要的事情。我阅读了Sun自己有关此事件的几乎所有报道,包括这份“来自世界各地的声音”(里面包括中科院和中国开源联盟的表态),仔细看了TSS, Javabobby等处的群众留言。IBM也在当日发表了一个相对平静的声明,阐述了自己的态度。至于Open source Java与Harmony的关系及影响,可以参考杨普的博客文章。这块石头入水的效力,或许在未来半年后开始显现。

周二,就是今天,IBM中国召开全体员工大会,IBM CEO Sam Palmisano在北京亲临现场。特邀嘉宾,The World is Flat的作者Tom Friedman的精彩演讲,让人折服。我想所有听了他演讲的人都记住了这句话:”What could be done, will be done. The last question: is it by you or to you?”

Categories
Life

徐庆不该走

《创智赢家》第2季今晚正式登场。在积累了美国《学徒》连续5季的收看体验之后,我不得不说这季《创智》比去年上了一个档次,借鉴了很多真人秀节目的best practice,节目好看了很多。

有好就有不好,以下几点是我的一些负面体会:

1. 节目时间太长。7点半开始,10点结束。沿袭了超女、莱卡、好男儿的拉锯战模式,不折腾死观众不罢休,可节目到了下半场的Live 部分几乎没有可看性;

2. 上半部录播编排、组织、剪辑、节奏控制都很好,可看性很强;下半场直播却空前的难看,没有人该知道说什么,皮球踢到谁哪儿算哪儿,冷场的要命。《学徒》最精彩的部分就是最后火药味十足的board room,《创智》则saves the worst for last,遗憾。也许PK采用直播方式并不是一个明智的选择;

3. 袁鸣不应该challenge大众评审团,而且几乎是带着威胁的口吻。 大众评审团每个人都应该可以自由的作出自己的选择而不需要向任何人做任何解释。要向葛优学习,“我相信群众”。

4. 徐庆不该走。徐庆能带动多少收视率,先不用讨论,他的离开让瑞驰(怎么听都像一个汽车品牌)少了生气。实话说,徐庆的综合实力的确不高,表达能力也有欠缺,可和其他竞争者相比,他对于观众具有不可替代性。第一个任务没给他留太多的空间,在直面人群和观众的节目里,他的价值会有表现的机会。徐庆应该走,但不该是在节目一开始。《学徒》每集里都有一个最弱或者争议最大的人物,他们存活的时间反而都挺长,如第一季的Omarosa,第三季的Danny。不知道袁鸣在最后大众评审投票的时候,挤眉弄眼使劲想在提示什么,是不是耳机里导播在说,“把徐庆给我留下来!”。另外,观众投票到底是支持某人还是反对某人,没搞清楚,到最后看到票最多的人站了出来,有人吃惊吗?

也许在下周的《创智赢家》里会打上几个patch,提高观赏体验,满足一下躺在沙发上站着说话不腰疼的观众们的欲望。

Categories
IBM

Technical conference

来北京短暂出差2天,参加大中华区的Technical Conference并主持今天下午的一个session。这次的conference,有很多来自一线的经验分享,那些给客户做solution architect和delivery的同事所带来的实际案例和经验,对我们这些在实验室里从事开发、搞新玩意的、甚至时常拍脑袋的工程师来说是一次很宝贵的分享。

下午我负责的session,讨论题目包括在z/OS上运行WebSphere;enterprise data center provisioning;银行系统的应用案例分析和来自研究中心的网络智能分析。

虽然是第三次来钻石大厦,可进了软件园之后还是迷了路。晚上在水木社区找到一张地图,标识的很清楚,特链接在本贴中供以后参考。

Categories
Technology

Web-based rich text editor

今天和几个同事讨论Blog,wiki在线编辑器的WYSIWYG的Copy & Paste的功能是如何实现的(在Word任意拷贝一段格式化的文字或者表格,可以粘贴到Web 的rich text editor里面,而且格式基本不变),是不是通过JS库自己写程序实现的格式化功能。仔细好像又不太想,JS要做这么复杂的rendoring工作,几十k的代码肯定不够。

花了点时间做了研究,确定是browser本身提供了可编辑的rich text功能。如下代码显示一个文本框,可以在里面粘贴rich text,该example适用于IE 6.0和Firefox 2.0。

Rich Text Editor Example (20行)

Categories
Technology

Make life easier: Mylar and Eclipse Spy

Mylar和Eclipse Spy是为了解决不同问题而独立开发的两个插件,相同的是它们使用了类似的方法达到最终目的。

Mylar可以用作一个Eclipse平台上用户行为分析的工具,它可以将用户与Eclipse交互的过程记录下来,进而分析在一段交互过程中用户的访问习惯和潜在模式,从而为优化workspace设计提供依据。Mylar的输出文件包括了交互过程中调用过的插件信息。 这篇文章介绍了用Mylar做用户使用习惯分析的过程。

虽然我没用过Eclipse Spy,从它的文档可以看出它想到Eclipse plugin开发者的心坎儿里去了。该插件把用户的交互行为所产生的插件调用细节做实时的输出。想知道如何写一个refactoring wizard,只需要跑一个样例然后看spy的输出就知道哪些插件被使用到了,在什么方法上,ID是什么,然后到Eclipse newsgroup上搜一下,开发效率大大提升。

无论产品还是开发工具,向用户隐藏一些细节是必要的;在用户真正需要细节的时候,可以高效、便捷的拿的出来也是很牛的本事。

从另一个角度看,API, 文档, sample project这些传统意义上提供的开发辅助资料,在系统变得日益复杂和庞大的时候(你几乎要成为一个哲学家才能在J2EE技术讨论会上插上话)显得粒度过细,要映射到用户要实现的实际问题,搭积木式搜索、组合、拼凑API显得过于耗时耗力。一些特殊的途径会显得与众不同,这些方法对快速解决问题颇有帮助,尤其是当你绝望的在搜索引擎结果里一页页点下去的时候。

Categories
Social

消费信息

这里“消费”两个字是动词。

很多人常买碟,而买回来之后就放在家里再也不看;下载完mp3就归档到大硬盘或者刻盘,难得去听;看到了新软件新游戏就下载然后按年月分目录刻盘,从不安装;每期杂志买到后高高的堆在床头,上个月的还没看完下个月的就来了;买了最好的、容量最大的硬盘和刻录机,而床头的台灯读书时从来不能直射到书本。我们都是被信息驱赶的人,我们太热爱信息以至于不惜一切代价要去获得,并在获得信息的过程中享受着充分的快乐,这种快乐已经比消费这些战利品来的更有满足感。

可以用下面几个问题来验证验证:

1. 你上次把自己刻录过的CD/DVD重新放入光驱是在什么时候;

2. 你上次欣赏一、两年前拍的数码照片是在什么时候?

3. 上次欣赏自己拍的DV带是在什么时候?

4. 在家电、电子产品论坛花费的调研时间和最终使用购买到的产品的时间那个长?

我似乎已经卷入到这个怪圈里了: 去年买的PDA这几个月用的才多一点(为此花了更多的时间去下载评书mp3);程序员第10期没看完,11期就到了;国庆买的5、6张DVD一张没看过…

有关信息消费,似乎可以得出这个结果:对于非本人制作的信息,永远不需要未雨绸缪,保存、归档、备份都可以省掉;我们繁荣、昌盛、伟大的市场已经可以满足绝大部分苛刻的需求;信息本身的价格和获取的成本越来越低,而消费它们的代价越来越高(时间、精力、心情)。

所以解决信息的consumability的首要问题,是解决人的consumability,人没有消费信息的能量和能力,信息始终是孤独的,而让信息孤独的人是可耻的。

Categories
Life

新上班路线图

世纪大道地铁站已经启动块一个星期了,这几天都是坐4号线转2号线转1号线去上班。与607转2号转1号(去)及789转杨高专线(回)比,速度提高了15分钟左右,票价保持不变仍为4元。

我像一个XML消息包一样,在ESB的总线上被多次路由,从一头到另外一头,享受着有QoS的端到端服务。