分类 技术志 下的文章

tony说设计-实践后的体会

入司后连续做过几个项目。最近在做一个新的项目的设计的时候,突然想到是不是该把以前项目中一些好的设计想法应用到新的项目中,并且尽量减少在新的项目中遗留以前的不好的设计呢?那么以前的项目中哪些是值得我去借鉴,哪些又是应该去避免的呢?真的很遗憾,自己并没有系统的反思和总结过,这就是我写下这篇Blog的直接起因。

一直在Unix平台下做设计和开发,所以下面谈的内容可能都有些局限性。作为设计原则本身,某些可能具有很强的通用性,而还有一些可能局限于某个平台、某个领域。这里我想到了以下几个方面(仅仅提出一些观点,而没有太关注具体的解决方法,给大家一个想象的空间^_^):

1、扩展
扩展性在这里被我分为“性能扩展”和“功能扩展”两类。
1) 性能扩展
作为电信级系统,对其的性能要求肯定不会低。那么如何做性能扩展呢?有两种方法:提高单点处理能力(垂直扩展)和平行扩展。
垂直扩展 – 简单说就是一个进程不够,我再加一个进程做同样的处理。问题出现了:如何做进程间的通讯?使用共享内存(最快的IPC)还是其他IPC方式呢?还是一个权衡的过程。
水平扩展 – 简单说就是一台机器不够,我再加一台机器。咱们也时髦一把,弄个分布式。问题出现了:如何做分布式节点之间的通讯?目前流行soap,而且又有开源包,如gsoap,其唯一缺点也是致命缺点就是慢。所以我想大部分开发商还是使用自己的内部协议。另外分布式与钱还是挂钩的。分布式意味着需要更多的机器平台来承载我们的系统,机器是钱,对机器的服务也是钱。看来这也是大家都喜欢分布式的原因。

2) 功能扩展:
做电信软件,其面对的最大的问题可能就是“用户需求变化多端”这个问题,更有甚者就是“用户并不知道需求,需要你去引导用户”,这样就会给项目带来较大的风险。如何能在设计这一层来规避风险或者减小风险带来的损失呢?尽量划分清易变化的需求和较稳定的需求,采用面向接口编程的形式(记住面向接口并不是Java等语言的专利)。比如以动态链接的方式(有点plugin的意思)实现系统中那些易变化的功能模块。一旦用户需求改变,我们需要修改的只是一个动态链接库(即替换一个plugin)。

2、隔离
隔离是为了可测试和好维护。其缺点是可能带来性能上的缺失。
1) 可测试性
可测试性在当前可是衡量一个软件设计好坏的重要标准。大型程序,模块众多。首先应该想到的就是怎么做集成测试?集成测试可能需要把一个模块单独拿出来运行。这就需要我们在设计的时候使模块间的耦合性尽量小,比如我们可以采用文件或者MQ的方式来解除模块间的耦合。这样一旦模块A开发完毕,产生其输入数据的模块B还未完成,我们就可以使用模拟器来产生输入数据即可(生成文件或者手工写数据到MQ中)。

2) 维护性
软件脱离不了服务,服务也是钱,也算在软件的成本中。如果一个软件的维护成本过高,完全可能会使该项目赔本。可维护性高的一个很重要的指标就是能快速定位问题所在。隔离模块可以提高定位错误的效率。因为我们可以将某一模块从系统中拿出来,单独测试定位问题,一个一个的排查,而不是大海捞针般的在系统中胡乱撞。

隔离还有一点很重要,就是尽可能的让每个模块能单独可运行(并不一定是独立程序),而无须依赖其他模块。

3、灵活
在我看来体现一个系统是否灵活,最重要的一点就是其配置文件设计的灵活性和合理性。

1) 配置文件格式
现在Java世界的配置文件基本已经被xml格式所垄断,而在C这边仍旧使用着传统的“key – value”格式。xml的多级配置是传统“key – value”不能比拟的。
例如:

   
   

# in "key – value" format
[mqlist]
name = testmq1;testmq2

在传统配置文件中我们需要对name字串进行解析才能得到各个mq的名字。而且大多数读"key – value"的程序可能都有对value值长度的限制,也就是说我们不能无限制的增加mq的个数。在xml中不存在这样的问题。况且现在像expat这样的开源包对xml的支持也很好。建议在以后设计时向xml格式配置文件转移。

2) 配置方式
一个灵活的配置,会给系统维护和变更带来极大的方便。甚至可以通过修改配置来满足用户新的需求。另外集中配置和分散配置也是需要设计者考虑的问题。比如将整个系统做成一个大程序,并做集中配置,那么除非有动态配置更新程序,否则一旦配置更改,就需要重启整个系统。相反如果系统是一个小程序的集合,采取分散配置,这样针对每个小程序的配置修改只会影响到其自己,只需重启相应的程序即可。

3) 配置粒度
很难用定义解释这个问题,举个例子可能会有更好理解。比如按照一定的配置格式写一个文件(由若干行记录组成)。对文件格式的配置可能如下:
粒度粗的配置

               
               

粒度细的配置

               
               

可以看出“粒度粗的配置”只支持到区分记录间的对齐方式和填充字节的差异性;而“粒度细的配置”则支持到区分字段间的对齐方式和填充字节的差异性。一旦需求发生变化,要求每条记录的字段间的alignment和padding可以不同的话,那么“粒度粗的配置”则不能满足需求,而“粒度细的配置”仅仅通过改变配置即可满足这个需求。从这个例子可以看出配置粒度粗细选择某种程度上可能会影响程序的扩展性,一般来说配置粒度细的程序扩展性要更好些。

4、层次
做设计一定要考虑层次,这里体会不多也就不多说了,总之有一点就是“在做设计的时候心中一定要有层次的概念”。

5、小结
给我的感觉:设计是一门权衡的艺术,相信通过上面的一些文字也可以不充分的论证这一点。本文仅仅是我在做过一些项目后的一些体会,并没有很牢固的理论基础。自己也正在计划着读一些关于架构设计方面的书,来提高一下自己的理论水平^_^。

汇编之路-栈操作与栈帧

结构化程序的一个最基本的单元就是“函数”或者叫“过程”。在汇编这一层自然也相应的有支持这些概念的指令操作,如栈操作和栈帧的概念。

首先这里要为“打开汇编之门”那篇blog补充一点的是:汇编语言是与机器相关,这里的一切都是基于IA-32机器平台的。

1、寻址方式
我们已经知道在操作数表示中有一种是用来指示内存地址的内容的,在GNU Assembly中指示内存地址有多种方式,这些方式被统称“寻址方式”。通用的寻址格式为:“Imm(Eb, Ei, s)”[1]。解释一下:该表达式的计算方式为Imm + R[Eb] + R[Ei] * s,这一串的结果是什么呢?是一个存储器的地址,操作指令通过该操作数表达式计算出来的内存地址来访问内存。

由通用形式演化几种常见特殊形式如下:
1) Imm – 注意与$Imm区别,后者为立即数,而前者是以立即数形式承载的一个内存地址,这种方式叫绝对寻址;
2) (Ex) – 注意与Ex区别,后者为寄存器内容,而前者是以寄存器内容形式承载的一个内存地址,这种方式叫间接寻址;
3) Imm(Eb) – 其表示结果是内存地址为Imm + R[Eb];
4) (Eb, Ei) – 其表示结果是内存地址为R[Eb] + R[Ei];
5) Imm((Eb, Ei) – 其表示结果是内存地址为Imm + R[Eb] + R[Ei]。

2、寄存器使用
在“打开汇编之门”中曾经提过虽然寄存器的专用性已经降低,但是某些寄存器还是有其专用场合的。GNU为我们制定了一个寄存器使用规则,规则规定:“%eax、%ecx和%edx是由调用者负责存储的,而%ebx、%ebi和%esi则由被调用者保护,而%esp和%ebp都是栈操作专用的”。

3、栈操作
栈,实际上是一块儿专用的内存区域,每个进程地址空间都有其专有的栈区。地球人都知道关于栈有两种操作:Push和Pop。相应的GNU Assembly分别定义了“pushl S”和“popl D”分别来完成压栈和出栈操作。每个操作都包含两个步骤:移动栈顶指针和数据传送。
pushl S R[%esp] <– R[%esp] – 4 ;M[R[%esp]]<– S
popl D   D <– M[R[%esp]];R[%esp] <– R[%esp] + 4

4、栈帧的形成
提到函数或者过程调用就不能离开栈操作。而每个函数或者过程调用也都离不开一个叫“栈帧”的概念。栈是用来传递参数、保存返回结果等作用的,而栈帧则是1对1映射到某个过程调用的。栈帧由%ebp来标识。我们来看看一个例子,通过该例子看看栈帧里到底有些什么东西?
void callee(int x, int y) {
 x = 1;
 y = 2;
}

void caller(int m, int n) {
 callee(m, n);
}

翻译为汇编代码为:
_callee:
 pushl %ebp   //保存调用者的栈帧地址
 movl %esp, %ebp  //初始化callee栈帧地址
 movl $1, 8(%ebp)  //获取参数x信息
 movl $2, 12(%ebp)  //获取参数y信息
 popl %ebp
 ret
… …
… …
_caller:
 pushl %ebp   //保存调用者的栈帧地址
 movl %esp, %ebp  //初始化caller栈帧地址
 subl $8, %esp  
 movl 12(%ebp), %eax  
 movl %eax, 4(%esp)
 movl 8(%ebp), %eax
 movl %eax, (%esp)
 call _callee
 leave
 ret
看看callee的汇编码:进入callee后首先保存其调用者caller的栈帧地址,然后读取其调用者caller栈帧中的参数信息进行计算。可以看出一个过程的栈帧中起码包括其上一个栈帧的起始地址,然后是一些参数信息,按照CS.APP说法,栈帧在存储参数信息之前还有可能保存一些本地变量或临时变量等。在每个过程的栈帧的结尾处都记录着过程返回地址,这个返回地址是由call执行时自动加入的。callee都是通过%ebp +/- 偏移量来获取参数信息的。用下面的图可以小结一下栈帧的模样(起始:%ebp所指的字节–> 终止:返回地址所在字节):

+              +
 |               |
+———-+
| old %ebp | <— %ebp
+———-+
| 本地变量 |
+———-+
|   参数n  |
+———-+
|   参数…|
+———-+
|   参数1  |
+———-+
| 返回地址 |
+———-+
|     …        |
|                |<– %esp

[注1]
这里采用了CSAPP中的表示方法,Eb表示基址寄存器,Ei表示变址寄存器,s为伸缩因子。我们使用R来表示引用某个寄存器的值,使用M来表示引用某内存地址。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言精进之路1 Go语言精进之路2 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats