由 拾豆文档 发表于2010-07-16 21:40:03

——专访汤森路透集团企业架构师刘晓晖

记者 / 郑柯

说起来路透,很多人知道世界四大通讯社之一路透社,却并不知道它背后的路透集团在2008年4月与加拿大媒体巨头汤姆森集团合并,成为汤森路透集团,英文名Thomson Reuters,一跃成为全世界占有市场份额最多的金融信息服务提供商。

2006年,路透集团在中国北京中关村软件园成立了软件研发中心,目前已有700余人的研发队伍,负责研制、开发、维护汤森路透全球金融系统的数据采集、处理、发送任务,完成了纽约证交所,纳斯达克等交易所的升级与软件移植,欧共体多市场的金融报价系统。除了金融市场战略事业部,集团还拥有法律事业部,税务财务事业部,科学研究事业部,医疗健康事业部,汤森路透集团为全球上百万的专业人士提供高质量和智能化的信息服务,北京的软件研发中心现致力于为集团旗舰产品的研发做出贡献。
刘晓晖,是汤森路透软件研发中心内资深的企业架构师。1991年开始进入IT行业,多年来扮演过程序员、团队主管、经理等各种角色,最后成为架构师,也有六七年的时间了。

由 拾豆文档 发表于2010-06-05 16:20:01

在我们公司ChinaNetCloud,见过多种不同类型的网站和系统,有好也有差。其中有些系统拥有良好的服务器/网络架构,并且进行了合理的调整和监控;然而一般的系统都会有安全和性能上的问题,不能良好运行,也无法变得更流行。

由 拾豆文档 发表于2010-06-02 15:09:45

淘宝网,是一个在线商品数量突破一亿,日均成交额超过两亿元人民币,注册用户接近八千万的大型电子商务网站,是亚洲最大的购物网站。那么对于淘宝网这样大规模的一个网站,我猜想大家一定会非常关心整个网站都采用了什么样的技术、产品和架构,也会很想了解在淘宝网中是否采用了开源的软件或者是完全采用的商业软件。那么下面我就简单的介绍一下淘宝网中应用的开源软件。

由 拾豆文档 发表于2010-05-28 14:54:25

1.MemcacheDB
MemcacheDB = Memcached + Berkeley DB
大家可能知道memcached的数据是缓存在内存中的,优点是速度非常快,缺点是数据不能够持久存储,为此新浪在Memcached及Berkeley DB的基础上开发了MemcacheDB,作者是新浪的工程师Steve Chu,他写的MemcacheDB手册是全英文的,能看得出来他的英文水平比较不错,至少比我好多了,看他经常在Google Group里面解决国外用户问题,所以有时候没有必要完全崇洋眉外,国内也是有不少高手的。

MemcacheDB is a distributed key-value storage system designed for persistent. It is NOT a cache solution, but a persistent storage engine for fast and reliable key-value based object storage and retrieval. It conforms to memcache protocol(not completed, see below), so any memcached client can have connectivity with it. MemcacheDB uses Berkeley DB as a storing backend, so lots of features including transaction and replication are supported.Via

2.MemcacheQ
MemcacheQ是个消息队列服务,处理高并发的数据非常有用。新浪微博中就用到了MemcacheQ,可以看看新浪微博的技术架构师杨卫华在Qcon2010 Beijing上演讲的ppt

3.ncache
ncache是基于Nginx的缓存系统,据说比Squid还要高效,在新浪的很多项目中就用到了ncache。
ncache的作者之一现在已经加盟百度了,83年出生的,在新浪时的薪水就挺高,大家看看他的简历就大概知道了。

4.xbaydns
xbaydns是基于BIND 9的Web管理界面,如果你所在的公司有自己的DNS服务器,不妨试试,或许能减轻工作负担。

延伸阅读:http://soft.ccw.com.cn/kaiyuan/htm2008/20080701_456382.shtml

5.sina-sdd
sina-add是新浪分布式key-value系统,类似于Amazon Dynamo的系统。

6.Sina App Engine
Sina App Engine类似Google的Google App Engine,简单理解就是用户利用Sina App Engine提供的api、空间以及带宽,用户开发的应用可以托管在Sina App Engine上面,然后可以访问。

例如可以在这个页面里面找到几个基于SAE开发的项目。

7.新浪微博开放平台
访问地址为http://open.t.sina.com.cn/,不过没有用户名及密码无法登录。

我所知道的就是这些,应该还有一些其它的开源项目及开放平台吧。

原文链接:http://iamcaihuafeng.blog.sohu.com/152170326.html

由 拾豆文档 发表于2010-05-27 18:34:28

今天分享的网站架构来自于Sify.com Architecture – A Portal at 3900 Requests Per Second(该标题有标题党嫌疑),对英文熟稔并不屑于我的中文简述的可以跳过该文。Sify.com是印度的一家portal网站,应该是信息集成类网站。它给出的月 pv是1.5亿次,每秒请求数是3900次(应该是针对所有服务的页面请求,包括异步的,并且是高峰的,否则就和pv对不上了)。按规模来说,算是个中等规模的网站,不过它的架构却是很值得说道的。

由 李敏 发表于2010-05-06 00:07:54

发现问题
生产环境中,w3wp.exe占用cpu很高,一直在90%以上,导致网站整体性能下降,但是此现象在测试环境无法重现,怎么办?

一个办法,在生产环境中定位问题。

定位问题
对付这种情况,我用的是windbg(注:服务器是windows 2003)对线上程序进行调试。

由 拾豆文档 发表于2010-04-22 18:43:31

开发和架构的界限难以捉摸。有些人告诉你它根本不存在,架构只是开发者们所做的设计过程的简单扩展。 另外一些人认为这是一个鸿沟,它只能由那些做到高度抽象,而且不会陷入实现细节的开发者才能跨越。通常,在这两个极端的观点中间某处有个可操作的平衡点;不论如何,怎么从开发转换为架构师都是个有趣的问题。

由 拾豆资讯 发表于2010-03-18 09:10:06

系统架构师的职责:
一、理解系统的业务需求,制定系统的整体框架(包括:技术框架和业务框架)
二、对系统框架相关技术和业务进行培训,指导开发人员开发。并解决系统开发、运行中出现的各种问题。

由 拾豆资讯 发表于2010-01-17 14:53:31

LinkedIn-logo在JavaOne 2008的会议上,著名社交网站LinkedIn的开发者做了2个关于LinkedIn

网站的架构技术的演讲,目前这两个演讲的PPT已经可以下载了。下载地址如下:

LinkedIn – A Professional Social Network Built with Java™ Technologies and Agile Practices

LinkedIn Communication Architecture 需要注册才可以下载,能下载PDF版本。

由 拾豆链客 发表于2010-01-16 17:11:09

鄙人先后在CERNET做过拨号接入,在Yahoo&3721搞过搜索前端,在猫扑处理过mop.com的架构升级,在6.cn视频网站从事开发工作,还在多年的工作中接触和开发过不少大中型网站的模块,因此在大型网站应对高负载和并发的解决方案上有一些积累和经验,希望和大家一起探讨。

一个小型的网站,比如个人网站,可以使用最简单的html静态页面就实现了,配合一些图片达到美化效果,所有的页面均存放在一个目录下,这样的网站对系统架构、性能的要求都很简单,随着互联网业务的不断丰富,网站相关的技术经过这些年的发展,已经细分到很细的方方面面,尤其对于大型网站来说,所采用的技术更是涉及面非常广,从硬件到软件、编程语言、数据库、WebServer、防火墙等各个领域都有了很高的要求,已经不是原来简单的html静态网站所能比拟的。