Archive for June, 2006

电台DJ的传值与传引用

Thursday, June 29th, 2006

105.7交通台晚上7点钟有档节目叫“淳子咖啡馆”,每期都有个主题,淳子在伤感怀旧一番后放一首歌,叙述一段后继续放歌。我平时能在下班的公交车上听完这个节目的上半部分。

今天晚上听歌的时候忽然想到一个技术问题:这些直播或者非直播的音乐节目中,往往要完整的播上几首歌曲,这些节目的录音资料是仅包含主持人说话的部分呢,还是连这些完整播放的歌曲一起被重新录制进去了。比如一个小时的“咖啡馆”,主持人说话的时间加起来可能只有20分钟,剩下40分钟全是歌曲,这个1小时的节目最后存档或者未来重播的时候是保存了完整的1小时资料,还是仅仅保存主持人的部分,在重新播放的时候由电台调度当场从曲库中找歌来播。

这是个有关存储空间与执行效率的问题,就是by reference和by value的区别。如果是by value,每首被播出的歌会无数次的被复制到各个音乐节目声音资料中,浪费了大量的存储资源(经典热门歌曲可能被复制到成百上千卷的磁带中);如果用by reference,虽然节省了存储空间,但在重播的时候需要有人在主持人话音结束的时候找到CD,定位track,再播放,太复杂了。不用说,电台一定用的是by value的做法,一来容量不是问题,二来资料的整理存档很容易。这好比做一个网页,要链接别人的一段内容,假如仅嵌入一个超链接的话,很难保证这个超链接未来还是否继续有效,与其这样不如copy & paste到自己的页面里,完全脱钩的自主管理和维护。

另外一个引起思考的问题是DJ们如何快速找到CD曲目(尤其是在直播节目中),电台内部是不是有一个可以直接供DJ使用的搜索引擎,根据歌手名、年代、曲名、歌词等搜索??我不知道。昨天中央5套“豪门盛宴”里张路介绍了一个点球技法 - “勺子球”,让我觉得更加有趣:体育部的人如何在这么短的时间内找到了这么多“勺子球”的录像(大概有10个左右),这些录像有的来自联赛,有的来自世界杯,而且不少都上了年头。这些视频资料在电视台是如何管理、分类、标签、检索的呢?可以想到的是给每场球赛加多角度的分类,然后加入一些tag,如“乌龙球”、“误判”等供方便日后检索,但像“勺子球”这样的关键词也会被资料管理员们tagging吗?我很怀疑,难道是全靠懂球的人回忆起来的,没太可能。。。。我猜Web 2.0这些东西,放到中央台估计会被仓库管理员鄙视的。。。

Ding Feng曾经研究过Dublin Core在图书馆学中的应用,现在看至少在视频的metadata标注上还是太粗粒度了。对于球赛来说,要不就把比赛解说词用语音识别转换成文字,然后把这些文字连同录像一起保存归档,文字部分供搜索之用(以后在引用06年意大利vs澳大利亚的录像资料时,只需要输入“灵魂附体”就可以了)。

餐馆点菜系统

Wednesday, June 28th, 2006

晚上去蓝村路、东方路口新开张的可膳茶餐厅吃饭,结帐的时候瞅了眼小票,上面印着一个网址:http://www.canyin.com.cn。回家后登录网站,原来是家叫“世纪领航”的公司,专门提供餐饮专用软、硬件解决方案。以前在北京出差的时候就看到很多馆子用了无线的点菜PDA,上海却很少见到。

“世纪领航”把一些软件放到网上下载,我下载了其中一个压缩包,里面有叫”Mdac_..”的文件,应该是用了微软的数据访问组件。

绑定硬件来销售软件在中国是条不错的出路,虽然严格来将在餐饮领域这两者绑定的并不紧,不过餐厅老板为了完整可靠的解决方案,没什么必要去hack这些PDA搞盗版软件。

“世纪领航”是很好的国内行业软件(我宁愿称它是软件公司)的样本,不盲目玩高科技,抓行业、抓业务,垂直领域内做的风风火火的。

破机器的用途

Tuesday, June 27th, 2006

现在对破机器的定义,就是PIII以下(包括PIII)+512MB内存以下+40GB硬盘以下的电脑。破机器在家庭里基本上不能做什么高级应用了:我自己一台上述配置的机器在BT的时候看DivX延迟很厉害,视频压缩和编辑速度远远不能满足要求(USB 还是1.0)。

这样的机器放在家里可以这么用:

1. 文件服务器。可以挂多个大容量硬盘,通过文件共享或者FTP方式共享数据、音乐、视频等;

2. 光盘刻录机。连接使用便宜的IDE接口的光盘刻录机;

3. 音乐播放器。挂上一个几百块的音箱,放放普通mp3还过的去;

4. 远程Web访问。利用宽带路由器开放出端口,可以远程访问家中文件。或者利用动态域名,搞个个人博客;

5. 专用下载机。FTP, BT都在此机上进行,平时显示器关,用Remote Desktop,VNC等监控;

6. 测试工作站。对于写软件的人来说,用两台物理机器测试某些网络应用程序是很必要的。

7. 给爸爸妈妈打小游戏 - 最佳用途。

所以,不要轻易廉价出售或者丢弃旧PC,尤其是主机。稍微搞一下,还能发挥余热。

IBM Almaden 20 周年

Sunday, June 25th, 2006

IBM Almaden Research Center 20周年:http://www.almaden.ibm.com/almaden20/

听曾经在Almaden工作过的一位虾米说,Almaden campus里面有响尾蛇,新人来报道的时候要提醒以防被咬。这些科学家们就这样长时间的扎根在农村,一门心思搞科研 ^-^

Blogger API

Friday, June 23rd, 2006

收到同事邮件,邀请我加入CSDN IBM开发者圈子。对于这个比较官方的blog,我唯一的顾虑是在选题上的谨慎,谈论的内容要会窄一些,更偏重于技术,尤其是IBM相关技术。

所以我打算同时维护两个博客(CSDN上的尚未开通),把有关技术的内容镜像到CSDN的圈子里;一些闲谈杂想仍旧放在此处。

为了简化镜像的工作量,我花了点时间考察了目前可用的blog客户端工具,这些工具可以离线的写作并自动发布到网站(多个)上而不需要用浏览器登录。blog客户端使用了一些常用的API,如Blogger API,MovableType等。

经研究,博客网(Bokee.com)支持的是Blogger API,其发布URL是http://publishblog.blogchina.com/xml-rpc,详细说明在此

目前可以找到对bokee支持最好的免费工具是blogBuddyZoundry Blog Write。blogBuddy处理Bokee很顺,没有中文编码问题,它最大不足是没有WYSIWYG编辑器和多站点配置功能。Zoundry的功能很全,可偏偏无法正确支持除UTF-8以外的编码(bokee用的是GB2312),此外其发布功能的bug也很多。

图:Zoundry的帐户配置和多协议支持:

对于CSDN Blog,我还不能确信它是否支持某种特定的Blog API(搜索了一圈也没找到)。不过凭CSDN在技术上的偏执,API的事情迟早会解决。

Lotus EasySync 4.2.4 Beta for WM5

Wednesday, June 21st, 2006

在公司内部新闻组上看到Lotus EasySync 4.2.4 for Windows Mobile 5的Beta版在内部开始提供下载。去年底我在Dell X51上装4.2.3报错,在论坛上看到很多人报这个兼容性问题,现在支持WM5的新版本终于出来了。

基于WM5的标准开发工具是VS.NET 2005,它用新的MFC 8.0 for Device代替了老版本的MFC 3.0 for Devices。所以用老版本eVC开发的项目如果引用了MFC 3.0的类库,在移植到VS.NET 2005后就会出现编译错误。而就目前情况看,预装了Windows Mobile 5.0的Pocket PC设备其内置的MFC类库版本仍然是3.0。

从Pocket PC 2003移植到Windows Mobile 5是相当痛苦的过程,尤其对developer来说。

虚拟星空

Tuesday, June 20th, 2006

在这期《程序员》杂志上看到Sourceforge 5月份的最佳项目:Stellarium。Stellarium是和Google Earth反其道而行之的工具,后者是从天上往地上看,前者是从地上往天上看。

在上海看到清朗美丽的夜空太难了,城市内部汇集的光源在夜色中遮蔽了来自太空的光线。有了Stellarium可以坐在家里好好看看星空了。

星空图(缺省位置:上海)

Stellarium对中文支持有点问题,虽然有切换语言的选项但转到中文后所有文字都变成方框。

电视上的企业家

Monday, June 19th, 2006

继《头脑风暴》、《决策》、《财富人生》和《中国经营者》后,SMG旗下第五档面向娱乐的企业家访谈节目《波士堂》亮相东方卫视。

从主持人的选择可以看出《波士堂》的定位更多在于挖掘野史。曹启泰做主持人,其实挺不错,比某些专业主持人舒服的多,不会让人竖寒毛不好意思尴尬的转台。在昨天的节目里,我第一次了解到唐骏从来没被披露的一面,包括旧友和唐骏的老婆、孩子也都上了镜头。

我们的企业家很辛苦,每次上电视都是一个很好的宣传机会。面对主持人,既要谈创业、谈发展、谈原罪,也要谈理想、谈人生、谈家庭,更要小学生一样的拿小题板答题被观众challenge,最后还要准备一、两句人生感言奉献给广大电视观众们。不过这些个小把戏,对我们的企业家来说算的了什么呢?

《波士堂》在节目末尾赠送给嘉宾的礼物明显比《财富人生》的那瓶洋酒有意义的多,每个收到它的人都会很开心的。

这里顺便预测一下,唐骏最终还是会回到微软的,尤其是在人生完整之后。IMHO,People management给他带来的成就感,要高于业绩、高于金钱。

纪念水源电子商务版

Saturday, June 17th, 2006

生:2000年5月21日

发信人: climb (阿痴), 信区: announce
标  题: boo出任电子商务板主
发信站: 饮水思源站 (Sun May 21 22:33:20 2000), 转信

        如题
--
※ 来源:??饮水思源站 bbs.sjtu.edu.cn??[FROM: 202.120.10.99]
卒:2006年6月15日
发信人: ebase(想变变做女人,我要变做你天后...), 信区: announce
标  题: 关闭E_Commerce(电子商务)板
发信站: 饮水思源 (2006年06月15日08:26:04 星期四), 站内信件

    该板长期利用率低下,缺少好的讨论氛围,经板主申请,站务组与
3区区长讨论后,接受关板申请。现关闭该板,相关板面文章和精华区已
经备份到District3。

外网可用的IBM Sametime服务器

Friday, June 16th, 2006

想试试IBM Sametime?可以去公网服务器http://community.ngi.ibm.com/下载ICT 1.7.5或者其他Sametime client,安装后设置Sametime服务器地址:messaging.ngi.ibm.com。

登录需要一个IBM用户名和密码,可以在https://www-900.ibm.com/cn/membership/register.jsp申请(该帐户与https://www.ibm.com/account/profile/cn的帐户好像不一致)。

我用Sametime 7.5 Beta2成功登录到这个外网的Sametime服务器,在添加用户的对话框里列出了好多陌生的用户名,很真实。

我的公网Sametime ID是:zhling@gmail

Update (2006.06.16) 截图:

回复

一封校友信

Thursday, June 15th, 2006

今天收到了一封来自“上海交通大学校友会”寄到公司的平信。打开一看,里面是最近两期的校报,外加一份中国银行的交大校友认同卡(信用卡)申请表。

很高兴能收到来自学校的邮件和那些报纸,非常好。但我也在想,如果里面没有夹带这份信用卡申请表的话,我还有没有机会收到这样的邮件。

这不由让我想到6年前那个火红的年代,几乎所有我认识的同学都收到了来自一个名叫“全校网”的网络公司发来的邮件,地址、班级、姓名完全正确,里面是为每个人预先注册了一个登录全校网邮箱的ID。我听说有人还去了全校网做“实习”:在聊天室里灌水增加人气。那年交大毕业生的纪念T恤的袖口上好像还有campusall.com的标志。

政府、公共机关和事业单位拥有无价的资源,无价到不得不让人想到一些有价的方法去获取。中国银行这次很让我佩服,产品推广做的合情合理、目标用户明确、效率极高(可以批处理),以至于勾起了我办卡的冲动。

蓝海,让中国银行找到了。

回复

机器翻译的收敛性

Wednesday, June 14th, 2006

想到这个题目是因为今天读到一个在中国出差的日本员工在自己博客上写了昨晚看CCTV-5世界杯日本对澳大利亚这场比赛的一些感受。他是用日文写的,我copy下来用在线机器翻译转成了英文,读上去很不通顺,只能抓住几个动词和名词。

这个想法在晚上789路公交上进一步发展,就是如果多次在两种语言之间做机器翻译,翻译结果会一直变化(规律或无规律),还是在双向翻译次数达一定数量时,翻译出的文字内容开始收敛,并最终稳定下来,不再变化。

我做了一个小小的实验(因为实验数据很有限并且只考察了谷歌的在线翻译工具,不足以证明这一命题),摘取了新浪科技上的一篇文章中的几句话,先翻译成英文,再翻译成中文、再翻译成英文…在大概3-4次重复后,结果便固定下来,无论怎样继续,文字不在变化。当增大样本为一大段文字时,基本上5-6次后开始结果开始稳定。

我猜想在机器翻译领域这个问题一定有人研究过,只不过圈外人不知道罢了。

回复

周末电视

Sunday, June 11th, 2006

星期五半夜看完世界杯开幕赛,今天又集中火力看完《Apprentice》第五季最后一集、《越狱》第一季最后4集,和鸟笼山剿匪记。

中国被证明为最成功的商业模式之一:短信投票,终于被Apprentice复制,通过全美短信投票而不是Donald Trump选出了新的学徒。《越狱》属于那种不一口气看完觉都睡都不好的电视剧,我拖拖拉拉看了一个礼拜才看完,算慢的了。

周日打算看完最近一期由Kevin Spacey主持的Saturday Night Live,还有丹泽尔华盛顿06年新片Inside Men。任务很重。

IBM System Journals – XML 10周年

Saturday, June 10th, 2006

本期System Journals的主角 – XML。XML与数据管理、XML与Web services、XML与集成。最新发布的IBM DB2 9.0 (Viper)提供了纯XML数据管理功能,这部分功能以前是由部分原生XML数据库厂家提供,如TaminoiPedo等。

最新版DB2 9.0试用版下载地址:http://www-306.ibm.com/software/data/db2/v9/index_download.html?S_TACT=105AGX11&S_CMP=VIPER

Dojo Toolkit

Friday, June 9th, 2006

Dojo Toolkit是一套纯JavaScript的函数库,提供了基于JS的widget和AJAX类库。IBM目前是这个open source JavaScript 类库的支持者之一,并且已经或即将贡献部分代码给Dojo。

Dojo的widget很cool,尤其是那个FishEye,很炫。这里之所以没有直间给出FishEye demo的链接,是我想谈的另外一个问题,就是大量的JavaScript造就了许多1 page网站:除了首页外无法看到当前内容的URL,所有都是JS代码动态加载的,想copy个link发给别人也做不到。这好像是昨天那个内容隐藏的又一个解决方式。

我喜欢AJAX,但也喜欢完整、可复制、长期稳定、可以从地址推测出内容的URL。没有URL的网站和HTTP协议一样,是无状态的,如果没有cookie,所有对话都要重来。还是多给AJAX几块甜饼吧。

隐藏、再隐藏

Thursday, June 8th, 2006

本来想去6rooms.com上看看胡戈最新的“鸟笼山剿匪记”,发现正式的视频版还没出,只有Flash。在顺便点击其他视频的时候,我注意到6rooms对自己的视频文件进行了特殊保护,防止用户使用下载工具下载并离线观看。

6rooms的手段其实很简单,当用户要观看视频的时候,首先下载一个Flash,这是个Flash版的媒体播放器支持.flv格式的视频文件。当该Flash在浏览器上初始化后,它发送HTTP请求给Web server以获取真正的视频文件。由于这个过程用户无法控制并得到真正的完整URL,所以只有等视频文件通过Flash下载后“准”在线的观看。一旦关闭浏览器,想再看的话只能重新刷新页面,重新下载视频。

我用了一个HTTP proxy捕获下了Flash播放器和Web server间的对话,实际上当Flash播放器请求文件的时候6rooms服务器返回一个HTTP 303并提供了重定向的绝对URL – 真正的视频文件。

这让人联想到最近的迅雷事件。如果网络资源的URL任意传播,会伤害内容提供商,因为不会有人想看那些在线广告和花花绿绿的banner。其实可以用临时sessionID的方法确保用户是通过浏览器访问,保证广告商和自身利益,同时允许用户在建立session后下载需要的东西。6rooms这样的做法虽然可以保护文件,但对用户来说极其不方便,无形中是在驱赶用户。以我自己为例,我基本上不在线看Flash和视频,都是“View Source”后抓文件URL,然后扔到下载工具里慢慢爬,以后想什么时候看都行。

想到的都来了

Wednesday, June 7th, 2006

如果我没记错的话,20多年前Lotus是从speadsheet产品Lotus 123开始步入主流软件开发商的行列,之后才有了WordPro (Ami Pro)和幻灯片软件。

我不知道微软office套件各产品的开发顺序,根据我从《微软的秘密》以及《微软项目开发丛书》中了解到的情况,Excel是Office软件中组件化最好、质量最佳的产品,总体水准比Word要高。Word产品经历过的失败(Word 4.0 for Mac)没有在Excel身上发生过。

现在,谷歌在线电子表格程序(http://www.google.com/googlespreadsheets/tour1.html)终于在人们的猜测和企盼中来了,像王菲家的二女儿一样,众目睽睽之下却又悄然无声的降临了。

还会有什么呢,word processor, presentation, gigabyte online storage?…太阳微系统10年前”Network is computer”的梦想要由谷歌添砖加瓦来实现了。

回复

– 评论人:davission
  2006-06-08 11:05:17   

看看 AdventNet 公司的 Zoho系列如何:http://www.zoho.com/

– 评论人:davission
  2006-06-07 09:31:19   

试验了一把,upload了俩excel文件,一个把一个spreadsheet给识别成俩表,另一个把表的后一半的前景色和背景色搞成一样的,乍一看以为没了呢。

2006 IBM UIMA Innovation Award

Tuesday, June 6th, 2006

今天偶尔上MSN,得知原来同实验室的学友现哈工大深圳研究生院副教授叶允明博士获得了今年IBM UIMA Innovation Award

UIMA是IBM设计开发的一套有关信息检索、自然语言处理的软件框架,提供了丰富的接口供开发者扩展。UIMA可以在alphaWorks上下载

Congratulations, Jacky!

回复

– 评论人:boo
  2006-06-05 23:45:03   

他在ETI做了1年多吧,时间不短了。

– 评论人:Terry
  2006-06-05 22:44:10   

叶允明这个名字很熟悉,听好几个人提起过,看了简历才知道原来他在ETI做过RA,呵呵。

地球上的一点

Monday, June 5th, 2006

中午,我用PDA加上GPS卡测量了我所在小区的经、纬度值。刚开始站在二楼阳台,用VisualGPSCe只能找到一颗卫星,无法定位。然后下楼找了一块比较开阔的空地再次测量,这次找到了8颗星。

测量结果如下:

纬度:31 12′ 55”N    经度: 121 31′ 37”E   海拔: 76.6 米

在Google Earth里输入“31 12′ 55”N, 121 31′ 37”E”可以精确定位到我家的位置,可惜这块区域目前提供的分辨率有限,看不大清楚。

回复

– 评论人:boo
  2006-06-05 20:40:34   

是的,靠近杨高南路

– 评论人:爱拉芳
  2006-06-05 14:48:48   

咦?在杨高路附近呀?Google Earth能看清楚偶家那幢楼的房顶,hoho

zhuaxia上看到一篇关于Google Earth的奇趣截图,呵呵,挺好玩的。http://www.kenwong.cn/post/funny-google-earth-pics.html

第一次上镜

Monday, June 5th, 2006

上星期五,IBM企划传播部的同事找我拍了一小段录像,准备用在公司内部的电视节目里。找到我的原因是因为我的博客和有关关于IBM紫禁城项目的评论。

录像的过程蛮简单,我坐在会议室里,面前架了个摄像机。主持人问了我四、五个问题(当然事先我都是知道的),每个问题回答几句话,期间NG了几次,不过总的还算顺利。

坐着面对镜头,两手放在桌上,我其实很想说:市民朋友们,因有重大外事活动,本月14到16日全市放假三天,请大家尽量减少出门,呆在家里看世界杯…

呵呵

回复

– 评论人:Peter
  2006-06-04 22:49:56   

haha,you are TV star now :)