cu 2010年系统架构师大会参与心得-greendays-ChinaUnix博客

8月28日上午9点，怀着无比期待和激动的心情，进入了系统架构师大会的现场。第一场是《构建基于Oracle的可扩展分布式数据库架构》对Oracle 不熟悉，瞎听了，不过学习了架构图的设计，和逻辑关系，窃喜。第二场《构建基于MySQL 的可扩展性架构设计》新浪研发中心平台部--杨海朝主要讲了如何设计MySQL的高可用备份集群。觉得他在新浪的角色相当于小溪。回头我可以把他的ppt发给小溪，让小溪看看。还有一场百度的《百度分布式数据库应用实践》他们对MySQL做了很多的优化，称查询和写入的效率提高了n多倍。没有现场演示，还有讲了很多理论。觉得没有杨同学讲的实用。

听着听着就到中午了，和朋友一块下楼吃饭。端着自助餐的盘子找了个空位坐下开始狼吞虎咽。此时旁边坐下来3个人，旁边的同学提醒我说：“lvs的创始人章文嵩博士，就他” “哦，！” 抬头看看这个不算魁梧的哥哥。好牛啊，中国开源技术的领军人物。他也冲我笑笑，我们打了个招呼。由于我对集群只是了解，用到的不多。问不出深刻的问题，只有听接着挤过来的几个粉丝提问了。听着他们的对话，学习一点。然后我注意了一下上午演讲的杨海朝。这个哥们无论看上去脸上的表情和微笑，还是他的讲话都充溢着谦虚，踏实的气息。真是一个好同学呀！想着吃完饭去换书，就赶紧把盘子里的饭菜吃完，结束战斗。

长长的领书队伍，本来我想拿一本《架构之美》翻开书看看，讲的内容真空洞。旋即又翻另外一本《监控》扫了几眼，更加失望，居然讲大公司如何监控员工。就拿了一本靠谱的《局域网管理与安全》。接下来开始了下午的讲座。下午第一场《门户运维那些事》--搜狐运维体系规划窦喆好激动，这个就是 cu上大名鼎鼎的南非蜘蛛。刚开始学Linux就晓得此人。他讲的很全面，很实用很好。其中，他说小的公司是靠人管，大的公司是靠制度和流程管。嗯以前听bill说过。他讲到做pxe 大批量自动安装系统的时候觉得很棒，回去以后我也要做一个，让赵可同学的工作更加轻松。他们的服务器都安装了远程控制卡，这个我们也要学习。他们的机房内做了3个网，一个外网、一个内网、一个管理网。外网就是所有的服务器对外的ip,内网就是每个服务器设置的内网ip做的局域网，管理网就是基于远程控制卡做的网，最后一个技术实现不清楚。我认为以后也要研究一下远程控制卡的使用。他讲到机房的筛选，机房的选择是一个大事，如果选择了不好的机房，常常网络升级，受攻击，迁移机房等将会非常痛苦。丫的，这点是切身体会。蜘蛛兄讲的是兄弟们的心里话呀。降到运维部门的人员如何管理，小公司靠人管，如果才开始就用很多制度（也不现实，才开始的时候制度还没制定。当然也可能是搬别的公司现有的制度），大家会觉得很约束，没有激情和动力。那就人管了，找时间一块吃个饭，经常给兄弟们聊聊职业的规划，发展规划。效果会很好。等到公司发展大了。就一步一步根据公司的具体情况制定一系列的制度和流程，按照流程走。这样不容易出差错，不是因为人水平的问题，而是人多了容易信息不同步，沟通不够。要用流程来规范实施的步骤，这样效果会很好。讲到运维部门的流程他介绍了ITIL。这个东西百度也在用，搜狐目前这个机制也不完善。还处在摸索阶段。百度好几个同学站起来问这个问题，蜘蛛做了保留的回答。这个东西以前也有所了解，虽然目前还用不上，但是得研究一下。他讲完我没有过去找他聊天，觉得他比我大太多，他10多年的工作经验，我这刚刚入行的小弟估计人家看不上。不过我也不担心，我朋友在搜狐工作，在他办公室隔壁，真想结识他还不容易，所以专心听下一场《系统安全与服务监控》--盛大网络应华 10分钟之后，就知道应华是个好同学。这场演讲太好了，不枉此行。盛大的运维架构是运维和运维的系统开发分开了。就是运维有两层：第一层是技术支持系统开发部，第二层是主体运维部。可能比较难理解哈。但是我认为这是公司运维的发展趋势。技术支持系统开发部是一个团队，专门开发运维用的系统和相关扩展。这样他们的监控等系统的功能更强，可视化等效果更好。通俗一点的例子就是：vpls系统钻石查询，小溪和我共同完成。但是小溪开发上面的。盛大做的就好像是小溪那边分出来两个人在运维组一样。

我这么理解。接着又一次验证了，制度流程对于公司发展的重要性。尤其是公司大了之后，运维的一切都是按照制度和流程走。同时，制度和流程也在被不断的改进和更新。接着讲了盛大的监控系统。因为他们在监控上投入了大量的开发人力、物力。所以做的比目前公司用的好很多。不用悲观，目前公司的监控也足够用，足够强大。等以后公司大了，我也会建议bill这么做的。他们的监控也是星型网络拓扑，这个星型环网是用heatbeat来实现的。就是为了检验core-到core,core到peer，peer到peer之间的连通性。这个不难实现。接下来是每个机器检查自己的状况，如果出现问题就报警，当然也有监控数据集中汇集等。这个比较难了。盛大有中国移动的SP证书，接口是中国移动专门开的。如果自己实现的话需要n多的飞信号，没法用。

会后和应华在一块详细讨论了这些问题，又问了他盛大服务器的采购情况。没法比，他们有专门的机构。这点公司目前只能找像亚康这样的公司合作了。因为小公司这样做的话既可以采购好的机器，又有快速稳定的售后服务。讨论了服务器环境部署和监控部署的自动分发。就比如有1000台服务器准备上线。要求在2个小时内把所有的环境都配置好。嗯他们用的也是ip-list+shell+perl+svn。在我预想的技术范围之内，受益匪浅。

cu 2010年系统架构师大会 参与心得

文章评论

cu 2010年系统架构师大会参与心得