cu 2010年系统架构师大会 参与心得

1241阅读 1评论2010-08-30 greendays
分类:LINUX

    8月28日上午9点,怀着无比期待和激动的心情,进入了 系统架构师大会的现场。第一场是《构建基于Oracle的可扩展分布式数据库架构》 对Oracle 不熟悉,瞎听了,不过学习了架构图的设计,和逻辑关系,窃喜。 第二场 《构建基于MySQL 的可扩展性架构设计》 新浪研发中心平台部--杨海朝 主要讲了如何设计MySQL的高可用备份集群。觉得他在新浪的角色相当于小溪。回头我可以把他的ppt发给小溪,让小溪看看。还有一场百度的《百度分布式数据库应用实践》 他们对MySQL做了很多的优化,称查询和写入的效率提高了n多倍。没有现场演示,还有讲了很多理论。觉得没有杨同学讲的实用。
    听着听着就到中午了,和朋友一块下楼吃饭。端着自助餐的盘子找了个空位坐下开始狼吞虎咽。 此时旁边坐下来3个人,旁边的同学提醒我说:“lvs的创始人 章文嵩 博士,就他” “哦,!” 抬头看看这个不算魁梧的哥哥。好牛啊,中国开源技术的领军人物。他也冲我笑笑,我们打了个招呼。由于我对集群只是了解,用到的不多。问不出深刻的问题,只有听接着挤过来的几个粉丝提问了。听着他们的对话,学习一点。然后我注意了一下上午演讲的杨海朝。这个哥们无论看上去脸上的表情和微笑,还是他的讲话都充溢着谦虚,踏实的气息。真是一个好同学呀! 想着吃完饭去换书,就赶紧把盘子里的饭菜吃完,结束战斗。
    长长的领书队伍,本来我想拿一本《架构之美》翻开书看看,讲的内容真空洞。旋即又翻另外一本《监控》扫了几眼,更加失望,居然讲大公司如何监控员工。就拿了一本靠谱的《局域网管理与安全》。接下来开始了下午的讲座。下午第一场《门户运维那些事》--搜狐运维体系规划 窦喆 好激动,这个就是 cu上大名鼎鼎的南非蜘蛛。 刚开始学Linux就晓得此人。他讲的很全面,很实用很好。其中,他说小的公司是靠人管,大的公司是靠制度和流程管。嗯 以前听bill说过。 他讲到做pxe 大批量自动安装系统的时候觉得很棒,回去以后我也要做一个,让赵可同学的工作更加轻松。他们的服务器都安装了远程控制卡,这个我们也要学习。他们的机房内做了3个网,一个外网、一个内网、一个管理网。外网就是所有的服务器对外的ip,内网就是每个服务器设置的内网ip做的局域网,管理网就是基于远程控制卡做的网,最后一个技术实现不清楚。我认为以后也要研究一下远程控制卡的使用。他讲到机房的筛选,机房的选择是一个大事,如果选择了不好的机房,常常网络升级,受攻击,迁移机房等将会非常痛苦。丫的,这点是切身体会。蜘蛛兄讲的是兄弟们的心里话呀。降到运维部门的人员如何管理,小公司靠人管,如果才开始就用很多制度(也不现实,才开始的时候制度还没制定。当然也可能是搬别的公司现有的制度),大家会觉得很约束,没有激情和动力。那就人管了,找时间一块吃个饭,经常给兄弟们聊聊职业的规划,发展规划。效果会很好。等到公司发展大了。就一步一步根据公司的具体情况制定一系列的制度和流程,按照流程走。这样不容易出差错,不是因为人水平的问题,而是人多了容易信息不同步,沟通不够。要用流程来规范实施的步骤,这样效果会很好。 讲到 运维部门的流程他介绍了ITIL。 这个东西百度也在用,搜狐目前这个机制也不完善。还处在摸索阶段。百度好几个同学站起来问这个问题,蜘蛛做了保留的回答。这个东西以前也有所了解,虽然目前还用不上,但是得研究一下。他讲完我没有过去找他聊天,觉得他比我大太多,他10多年的工作经验,我这刚刚入行的小弟估计人家看不上。不过我也不担心,我朋友在搜狐工作,在他办公室隔壁,真想结识他还不容易,所以专心听下一场《系统安全与服务监控》--盛大网络 应华  10分钟之后,就知道应华是个好同学。这场演讲太好了,不枉此行。盛大的运维架构是运维和运维的系统开发分开了。就是运维有两层:第一层是技术支持系统开发部,第二层是主体运维部。可能比较难理解哈。但是我认为这是公司运维的发展趋势。技术支持系统开发部是一个团队,专门开发运维用的系统和相关扩展。这样他们的监控等系统的功能更强,可视化等效果更好。通俗一点的例子就是:vpls系统钻石查询,小溪和我共同完成。但是小溪开发上面的。盛大做的就好像是小溪那边分出来两个人在运维组一样。
我这么理解。 接着又一次验证了,制度流程对于公司发展的重要性。尤其是公司大了之后,运维的一切都是按照制度和流程走。同时,制度和流程也在被不断的改进和更新。接着讲了盛大的监控系统。因为他们在监控上投入了大量的开发人力、物力。所以做的比目前公司用的好很多。不用悲观,目前公司的监控也足够用,足够强大。等以后公司大了,我也会建议bill这么做的。他们的监控也是星型网络拓扑,这个星型环网是用heatbeat来实现的。就是为了检验core-到core,core到peer,peer到peer之间的连通性。这个不难实现。接下来是每个机器检查自己的状况,如果出现问题就报警,当然也有监控数据集中汇集等。这个比较难了。盛大有中国移动的SP证书,接口是中国移动专门开的。如果自己实现的话需要n多的飞信号,没法用。
会后和应华在一块详细讨论了这些问题,又问了他盛大服务器的采购情况。没法比,他们有专门的机构。这点公司目前只能找像亚康这样的公司合作了。因为小公司这样做的话既可以采购好的机器,又有快速稳定的售后服务。讨论了服务器环境部署和监控部署的自动分发。就比如有1000台服务器准备上线。要求在2个小时内把所有的环境都配置好。嗯 他们用的也是ip-list+shell+perl+svn。 在我预想的技术范围之内,受益匪浅。
     暂时写这么多,以后想到了再写。写此文的目的是为了备忘,现在和以后自己做系统架构的时候可以查询参考。


上一篇:每隔50行求一次和的shell编程
下一篇:Reverse Mapping Checking - Possible Break-in Attem

文章评论