自己写了程序,把博客网上(http://zhangling.bokee.com)三百多篇文章搬到了本网站上,老贴的标题、内容、时间、评论和贴图都完整的保存下来。
写Java搬家程序花了1天半,最终的乾坤大挪移花了10分钟。
稍后介绍一下博客搬家的实现方法和技术细节。
自己写了程序,把博客网上(http://zhangling.bokee.com)三百多篇文章搬到了本网站上,老贴的标题、内容、时间、评论和贴图都完整的保存下来。
写Java搬家程序花了1天半,最终的乾坤大挪移花了10分钟。
稍后介绍一下博客搬家的实现方法和技术细节。
即将发布的新一期IBM System Journal (上图外文期刊阅览室有订阅)的一组Model Driven Development的文章:
http://www.research.ibm.com/journal/sjpip.html
毛新生是我们CDL(中国软件开发中心)SOA设计中心主任,IBM中国本土成长起来的第一位STSM (Senior Technical Staff Member)。我和新生有过不多的聊天,他是一个真正的thinker,视野广阔,思维活跃。
这里是毛新生的博客:http://mxs.blog.ccidnet.com
还有这段CSDN的SOA访谈录像:mms://61.186.252.133/CSDN_Live_13/CSDN_Live_13_A.wmv
今天休假一天。
早上4号线转26路去上海图书馆看书。在3楼外文期刊阅览室翻出了过去几个月的技术类期刊,还有一些网络休闲类读物。我在3月份英国出版的.NET杂志上看到了国产“后舍男孩”的网络截屏,还有Moto请他们为手机宣传的报道,文中还提到了那个在打CS的背影。
从上图出来去了著名的DZMZ(大自鸣钟),这是坊间流传的上海淘碟圣地。关于大自鸣钟的位置,网上有不少指示,就是靠近长寿路,西康路,宜昌路,还靠近轻轨的一个破旧的大楼里。经过实地勘查,确定大自鸣钟的物理位置是:(31°14’48.86″N 121°25’45.25″E)。请淘碟者自己mark吧。今天DZMZ场子里没什么人气,完全没有想象中的热烈,甚至不如蓝村路西段,比较失望的说。可能是因为没到双休日,不过摊子上中年妇女的一句话让我确信这里的确有一定权威性 - “问:某某碟有吗?答:网上碟报出了,但还没到”。
该去照二代身份证照片了。
105.7交通台晚上7点钟有档节目叫“淳子咖啡馆”,每期都有个主题,淳子在伤感怀旧一番后放一首歌,叙述一段后继续放歌。我平时能在下班的公交车上听完这个节目的上半部分。
今天晚上听歌的时候忽然想到一个技术问题:这些直播或者非直播的音乐节目中,往往要完整的播上几首歌曲,这些节目的录音资料是仅包含主持人说话的部分呢,还是连这些完整播放的歌曲一起被重新录制进去了。比如一个小时的“咖啡馆”,主持人说话的时间加起来可能只有20分钟,剩下40分钟全是歌曲,这个1小时的节目最后存档或者未来重播的时候是保存了完整的1小时资料,还是仅仅保存主持人的部分,在重新播放的时候由电台调度当场从曲库中找歌来播。
这是个有关存储空间与执行效率的问题,就是by reference和by value的区别。如果是by value,每首被播出的歌会无数次的被复制到各个音乐节目声音资料中,浪费了大量的存储资源(经典热门歌曲可能被复制到成百上千卷的磁带中);如果用by reference,虽然节省了存储空间,但在重播的时候需要有人在主持人话音结束的时候找到CD,定位track,再播放,太复杂了。不用说,电台一定用的是by value的做法,一来容量不是问题,二来资料的整理存档很容易。这好比做一个网页,要链接别人的一段内容,假如仅嵌入一个超链接的话,很难保证这个超链接未来还是否继续有效,与其这样不如copy & paste到自己的页面里,完全脱钩的自主管理和维护。
另外一个引起思考的问题是DJ们如何快速找到CD曲目(尤其是在直播节目中),电台内部是不是有一个可以直接供DJ使用的搜索引擎,根据歌手名、年代、曲名、歌词等搜索??我不知道。昨天中央5套“豪门盛宴”里张路介绍了一个点球技法 - “勺子球”,让我觉得更加有趣:体育部的人如何在这么短的时间内找到了这么多“勺子球”的录像(大概有10个左右),这些录像有的来自联赛,有的来自世界杯,而且不少都上了年头。这些视频资料在电视台是如何管理、分类、标签、检索的呢?可以想到的是给每场球赛加多角度的分类,然后加入一些tag,如“乌龙球”、“误判”等供方便日后检索,但像“勺子球”这样的关键词也会被资料管理员们tagging吗?我很怀疑,难道是全靠懂球的人回忆起来的,没太可能。。。。我猜Web 2.0这些东西,放到中央台估计会被仓库管理员鄙视的。。。
Ding Feng曾经研究过Dublin Core在图书馆学中的应用,现在看至少在视频的metadata标注上还是太粗粒度了。对于球赛来说,要不就把比赛解说词用语音识别转换成文字,然后把这些文字连同录像一起保存归档,文字部分供搜索之用(以后在引用06年意大利vs澳大利亚的录像资料时,只需要输入“灵魂附体”就可以了)。
晚上去蓝村路、东方路口新开张的可膳茶餐厅吃饭,结帐的时候瞅了眼小票,上面印着一个网址:http://www.canyin.com.cn。回家后登录网站,原来是家叫“世纪领航”的公司,专门提供餐饮专用软、硬件解决方案。以前在北京出差的时候就看到很多馆子用了无线的点菜PDA,上海却很少见到。
“世纪领航”把一些软件放到网上下载,我下载了其中一个压缩包,里面有叫”Mdac_..”的文件,应该是用了微软的数据访问组件。
绑定硬件来销售软件在中国是条不错的出路,虽然严格来将在餐饮领域这两者绑定的并不紧,不过餐厅老板为了完整可靠的解决方案,没什么必要去hack这些PDA搞盗版软件。
“世纪领航”是很好的国内行业软件(我宁愿称它是软件公司)的样本,不盲目玩高科技,抓行业、抓业务,垂直领域内做的风风火火的。
现在对破机器的定义,就是PIII以下(包括PIII)+512MB内存以下+40GB硬盘以下的电脑。破机器在家庭里基本上不能做什么高级应用了:我自己一台上述配置的机器在BT的时候看DivX延迟很厉害,视频压缩和编辑速度远远不能满足要求(USB 还是1.0)。
这样的机器放在家里可以这么用:
1. 文件服务器。可以挂多个大容量硬盘,通过文件共享或者FTP方式共享数据、音乐、视频等;
2. 光盘刻录机。连接使用便宜的IDE接口的光盘刻录机;
3. 音乐播放器。挂上一个几百块的音箱,放放普通mp3还过的去;
4. 远程Web访问。利用宽带路由器开放出端口,可以远程访问家中文件。或者利用动态域名,搞个个人博客;
5. 专用下载机。FTP, BT都在此机上进行,平时显示器关,用Remote Desktop,VNC等监控;
6. 测试工作站。对于写软件的人来说,用两台物理机器测试某些网络应用程序是很必要的。
7. 给爸爸妈妈打小游戏 - 最佳用途。
所以,不要轻易廉价出售或者丢弃旧PC,尤其是主机。稍微搞一下,还能发挥余热。
IBM Almaden Research Center 20周年:http://www.almaden.ibm.com/almaden20/
听曾经在Almaden工作过的一位虾米说,Almaden campus里面有响尾蛇,新人来报道的时候要提醒以防被咬。这些科学家们就这样长时间的扎根在农村,一门心思搞科研 ^-^
收到同事邮件,邀请我加入CSDN IBM开发者圈子。对于这个比较官方的blog,我唯一的顾虑是在选题上的谨慎,谈论的内容要会窄一些,更偏重于技术,尤其是IBM相关技术。
所以我打算同时维护两个博客(CSDN上的尚未开通),把有关技术的内容镜像到CSDN的圈子里;一些闲谈杂想仍旧放在此处。
为了简化镜像的工作量,我花了点时间考察了目前可用的blog客户端工具,这些工具可以离线的写作并自动发布到网站(多个)上而不需要用浏览器登录。blog客户端使用了一些常用的API,如Blogger API,MovableType等。
经研究,博客网(Bokee.com)支持的是Blogger API,其发布URL是http://publishblog.blogchina.com/xml-rpc,详细说明在此。
目前可以找到对bokee支持最好的免费工具是blogBuddy和Zoundry Blog Write。blogBuddy处理Bokee很顺,没有中文编码问题,它最大不足是没有WYSIWYG编辑器和多站点配置功能。Zoundry的功能很全,可偏偏无法正确支持除UTF-8以外的编码(bokee用的是GB2312),此外其发布功能的bug也很多。
图:Zoundry的帐户配置和多协议支持:
对于CSDN Blog,我还不能确信它是否支持某种特定的Blog API(搜索了一圈也没找到)。不过凭CSDN在技术上的偏执,API的事情迟早会解决。
在公司内部新闻组上看到Lotus EasySync 4.2.4 for Windows Mobile 5的Beta版在内部开始提供下载。去年底我在Dell X51上装4.2.3报错,在论坛上看到很多人报这个兼容性问题,现在支持WM5的新版本终于出来了。
基于WM5的标准开发工具是VS.NET 2005,它用新的MFC 8.0 for Device代替了老版本的MFC 3.0 for Devices。所以用老版本eVC开发的项目如果引用了MFC 3.0的类库,在移植到VS.NET 2005后就会出现编译错误。而就目前情况看,预装了Windows Mobile 5.0的Pocket PC设备其内置的MFC类库版本仍然是3.0。
从Pocket PC 2003移植到Windows Mobile 5是相当痛苦的过程,尤其对developer来说。
在这期《程序员》杂志上看到Sourceforge 5月份的最佳项目:Stellarium。Stellarium是和Google Earth反其道而行之的工具,后者是从天上往地上看,前者是从地上往天上看。
在上海看到清朗美丽的夜空太难了,城市内部汇集的光源在夜色中遮蔽了来自太空的光线。有了Stellarium可以坐在家里好好看看星空了。
星空图(缺省位置:上海)
Stellarium对中文支持有点问题,虽然有切换语言的选项但转到中文后所有文字都变成方框。
继《头脑风暴》、《决策》、《财富人生》和《中国经营者》后,SMG旗下第五档面向娱乐的企业家访谈节目《波士堂》亮相东方卫视。
从主持人的选择可以看出《波士堂》的定位更多在于挖掘野史。曹启泰做主持人,其实挺不错,比某些专业主持人舒服的多,不会让人竖寒毛不好意思尴尬的转台。在昨天的节目里,我第一次了解到唐骏从来没被披露的一面,包括旧友和唐骏的老婆、孩子也都上了镜头。
我们的企业家很辛苦,每次上电视都是一个很好的宣传机会。面对主持人,既要谈创业、谈发展、谈原罪,也要谈理想、谈人生、谈家庭,更要小学生一样的拿小题板答题被观众challenge,最后还要准备一、两句人生感言奉献给广大电视观众们。不过这些个小把戏,对我们的企业家来说算的了什么呢?
《波士堂》在节目末尾赠送给嘉宾的礼物明显比《财富人生》的那瓶洋酒有意义的多,每个收到它的人都会很开心的。
这里顺便预测一下,唐骏最终还是会回到微软的,尤其是在人生完整之后。IMHO,People management给他带来的成就感,要高于业绩、高于金钱。
生:2000年5月21日
发信人: climb (阿痴), 信区: announce 标 题: boo出任电子商务板主 发信站: 饮水思源站 (Sun May 21 22:33:20 2000), 转信 如题 -- ※ 来源:??饮水思源站 bbs.sjtu.edu.cn??[FROM: 202.120.10.99]
卒:2006年6月15日
发信人: ebase(想变变做女人,我要变做你天后...), 信区: announce 标 题: 关闭E_Commerce(电子商务)板 发信站: 饮水思源 (2006年06月15日08:26:04 星期四), 站内信件 该板长期利用率低下,缺少好的讨论氛围,经板主申请,站务组与 3区区长讨论后,接受关板申请。现关闭该板,相关板面文章和精华区已 经备份到District3。
想试试IBM Sametime?可以去公网服务器http://community.ngi.ibm.com/下载ICT 1.7.5或者其他Sametime client,安装后设置Sametime服务器地址:messaging.ngi.ibm.com。
登录需要一个IBM用户名和密码,可以在https://www-900.ibm.com/cn/membership/register.jsp申请(该帐户与https://www.ibm.com/account/profile/cn的帐户好像不一致)。
我用Sametime 7.5 Beta2成功登录到这个外网的Sametime服务器,在添加用户的对话框里列出了好多陌生的用户名,很真实。
我的公网Sametime ID是:zhling@gmail
Update (2006.06.16) 截图:
今天收到了一封来自“上海交通大学校友会”寄到公司的平信。打开一看,里面是最近两期的校报,外加一份中国银行的交大校友认同卡(信用卡)申请表。
很高兴能收到来自学校的邮件和那些报纸,非常好。但我也在想,如果里面没有夹带这份信用卡申请表的话,我还有没有机会收到这样的邮件。
这不由让我想到6年前那个火红的年代,几乎所有我认识的同学都收到了来自一个名叫“全校网”的网络公司发来的邮件,地址、班级、姓名完全正确,里面是为每个人预先注册了一个登录全校网邮箱的ID。我听说有人还去了全校网做“实习”:在聊天室里灌水增加人气。那年交大毕业生的纪念T恤的袖口上好像还有campusall.com的标志。
政府、公共机关和事业单位拥有无价的资源,无价到不得不让人想到一些有价的方法去获取。中国银行这次很让我佩服,产品推广做的合情合理、目标用户明确、效率极高(可以批处理),以至于勾起了我办卡的冲动。
蓝海,让中国银行找到了。
想到这个题目是因为今天读到一个在中国出差的日本员工在自己博客上写了昨晚看CCTV-5世界杯日本对澳大利亚这场比赛的一些感受。他是用日文写的,我copy下来用在线机器翻译转成了英文,读上去很不通顺,只能抓住几个动词和名词。
这个想法在晚上789路公交上进一步发展,就是如果多次在两种语言之间做机器翻译,翻译结果会一直变化(规律或无规律),还是在双向翻译次数达一定数量时,翻译出的文字内容开始收敛,并最终稳定下来,不再变化。
我做了一个小小的实验(因为实验数据很有限并且只考察了谷歌的在线翻译工具,不足以证明这一命题),摘取了新浪科技上的一篇文章中的几句话,先翻译成英文,再翻译成中文、再翻译成英文…在大概3-4次重复后,结果便固定下来,无论怎样继续,文字不在变化。当增大样本为一大段文字时,基本上5-6次后开始结果开始稳定。
我猜想在机器翻译领域这个问题一定有人研究过,只不过圈外人不知道罢了。
星期五半夜看完世界杯开幕赛,今天又集中火力看完《Apprentice》第五季最后一集、《越狱》第一季最后4集,和鸟笼山剿匪记。
中国被证明为最成功的商业模式之一:短信投票,终于被Apprentice复制,通过全美短信投票而不是Donald Trump选出了新的学徒。《越狱》属于那种不一口气看完觉都睡都不好的电视剧,我拖拖拉拉看了一个礼拜才看完,算慢的了。
周日打算看完最近一期由Kevin Spacey主持的Saturday Night Live,还有丹泽尔华盛顿06年新片Inside Men。任务很重。
本期System Journals的主角 – XML。XML与数据管理、XML与Web services、XML与集成。最新发布的IBM DB2 9.0 (Viper)提供了纯XML数据管理功能,这部分功能以前是由部分原生XML数据库厂家提供,如Tamino,iPedo等。
最新版DB2 9.0试用版下载地址:http://www-306.ibm.com/software/data/db2/v9/index_download.html?S_TACT=105AGX11&S_CMP=VIPER
Dojo Toolkit是一套纯JavaScript的函数库,提供了基于JS的widget和AJAX类库。IBM目前是这个open source JavaScript 类库的支持者之一,并且已经或即将贡献部分代码给Dojo。
Dojo的widget很cool,尤其是那个FishEye,很炫。这里之所以没有直间给出FishEye demo的链接,是我想谈的另外一个问题,就是大量的JavaScript造就了许多1 page网站:除了首页外无法看到当前内容的URL,所有都是JS代码动态加载的,想copy个link发给别人也做不到。这好像是昨天那个内容隐藏的又一个解决方式。
我喜欢AJAX,但也喜欢完整、可复制、长期稳定、可以从地址推测出内容的URL。没有URL的网站和HTTP协议一样,是无状态的,如果没有cookie,所有对话都要重来。还是多给AJAX几块甜饼吧。