画虎画皮难画骨,编程编码难编译

古语“画虎画皮难画骨”,是说画老虎时要画它的外表很容易,可要将老虎的气势画出来却很难。

10余年的海北州网站建设经验,针对设计、前端、开发、售后、文案、推广等六对一服务,响应快,48小时及时工作处理。网络营销推广的优势是能够根据用户设备显示端的尺寸不同,自动调整海北州建站的显示方式,使网站能够适用不同显示终端,在浏览器中调整网站的宽度,无论在任何一种浏览器上浏览网站,都能展现优雅布局与设计,从而大程度地提升浏览体验。创新互联建站从事“海北州网站设计”,“海北州网站推广”以来,每个客户项目都认真落实执行。

对于现在的程序员来说,似乎也是这样子,可以写出整洁的代码,设计出优异的程序,但却不一定需要知道代码在编译之后的是如何运行的。

但是有时候,能了解表面背后的故事,知道一些程序编译过程,其实对写出一个正确的正确的程序会有很大的帮助,这起源自一段很简单的问题实现:两整数交换。

简单的两数交换不简单

最早学习到的实现方式,就是使用临时变量来保存一个数进行交换:

 
 
 
  1. int main() 
  2.     int a = 21; 
  3.     int b = 7; 
  4.      
  5.     int tmp = a; 
  6.     a = b; 
  7.     b = tmp; 
  8.      
  9.     return 0; 
  10. }

后来不经意间又学习到了不用临时变量,只用算数运算符加减就可以进行交换的方式:

 
 
 
  1. int main() 
  2.     int a = 21; 
  3.     int b = 7; 
  4.     a = a+b; 
  5.     b = a-b; 
  6.     a = a-b; 
  7.     return 0; 
  8. }

这个问题在思想上讲十分的巧妙,不过在计算机的世界里这并不是一个好的方法,考虑一点编译后的问题,我们就会碰到溢出的问题,导致得到错误的结果。

高手们又使用位运算的异或运算来消除临时变量的方法,还不用担心溢出的问题,于是我又学习了:

 
 
 
  1. int main() 
  2.     int a = 21; 
  3.     int b = 7; 
  4.      
  5.     a ^= b; 
  6.     b ^= a; 
  7.     a ^= b; 
  8.     return 0; 
  9. }

甚至有更简短地把三个异或运算写成一行的:

 
 
 
  1. int main() 
  2.     int a = 21; 
  3.     int b = 7; 
  4.      
  5.     a ^= b ^=a ^= b; 
  6.     return 0; 
  7. }

就像我在《这些没有可读性的代码,却又体现出程序员对语言的高度理解力》一文里想表达的,这种写法体现了书写者对运算符顺序的深刻理解,对异或运算符特殊性的充分了解。

两数交换方法的编译后的指令

虎皮画得很精美,根根毛发都细致描绘,但是没有看过老虎骨骼和肌肉,可能就感受不到万兽之王从骨子里散发出的那种无畏的霸气。

没有看过编译后的代码,我才会总不能理解为何那么简短优美还“节省空间”的代码怎么就没有成为一种标准写法呢?好像只是作为偶然拿出来炫给初学者们,让他们惊讶和眼睛一亮的把戏。

在网上搜索了一下有关这方面的问题,在stackoverflow上看到了这样的一段回复:

Using this XOR might actually be slower than the usual two value swap using a temp variable; the fact that you are writing through references suggests you are forcing the compiler to do 3 memory (ok, cache line) writes, whereas temp-style swamp should only do two memory write (any intelligent compiler will put the temp in the registers). Adding the conditional check surely makes it slower. So while this might be fun, it probably isn't a practical thing to do in a sort.

从这句话看出,似乎看出算数法和异或法虽然节省了一个微不足道的空间,但是却会浪费时间。效率上还不及临时变量法,更不要提其中出现的如溢出等隐蔽的问题了。

在学习了一点gcc指令的入门之后,我使用了

 
 
 
  1. Ider$ gcc -S swap.c

来观察了一下从C文件编译出来的汇编指令的代码,才发现:虽然在C种交换都只用了三行,但是编译后的汇编指令行数却不尽相同。

对比三种方式的main的汇编指令:

(每一个注释表示指令所对应的C代码,一行C代码可能对应多个汇编指令,从注释行开始计算,到下一个注释行之前那行都属于那行C代码对应的指令)

Temp

 
 
 
  1. _main: 
  2. Leh_func_begin1: 
  3.     pushq   %rbp 
  4. Ltmp0: 
  5.     movq    %rsp, %rbp 
  6. Ltmp1: 
  7.     movl    $21, -12(%rbp)      ;;int a = 21
  8.     movl    $7, -16(%rbp)       ;;int b = 7
  9.     movl    -12(%rbp), %eax     ;;int tmp = a 
  10.     movl    %eax, -20(%rbp)      
  11.     movl    -16(%rbp), %eax     ;;a = b 
  12.     movl    %eax, -12(%rbp)      
  13.     movl    -20(%rbp), %eax     ;;b = tmp 
  14.     movl    %eax, -16(%rbp) 
  15.     movl    $0, -8(%rbp)        ;;return 0
  16.     movl    -8(%rbp), %eax 
  17.     movl    %eax, -4(%rbp) 
  18.     movl    -4(%rbp), %eax 
  19.     popq    %rbp 
  20.     ret 
  21. Leh_func_end1:

Arithmetic

 
 
 
  1. _main: 
  2. Leh_func_begin1: 
  3.     pushq   %rbp 
  4. Ltmp0: 
  5.     movq    %rsp, %rbp 
  6. Ltmp1: 
  7.     movl    $21, -12(%rbp)      ;;int a = 21
  8.     movl    $7, -16(%rbp)       ;;int b = 7
  9.     movl    -12(%rbp), %eax     ;;a = a+b 
  10.     movl    -16(%rbp), %ecx 
  11.     addl    %ecx, %eax 
  12.     movl    %eax, -12(%rbp) 
  13.     movl    -12(%rbp), %eax     ;;b = a-b 
  14.     movl    -16(%rbp), %ecx 
  15.     subl    %ecx, %eax 
  16.     movl    %eax, -16(%rbp) 
  17.     movl    -12(%rbp), %eax     ;;a = a-b 
  18.     movl    -16(%rbp), %ecx 
  19.     subl    %ecx, %eax 
  20.     movl    %eax, -12(%rbp) 
  21.     movl    $0, -8(%rbp)        ;;return 0
  22.     movl    -8(%rbp), %eax 
  23.     movl    %eax, -4(%rbp) 
  24.     movl    -4(%rbp), %eax 
  25.     popq    %rbp 
  26.     ret 
  27. Leh_func_end1:

XOR

 
 
 
  1. _main: 
  2. Leh_func_begin1: 
  3.     pushq   %rbp 
  4. Ltmp0: 
  5.     movq    %rsp, %rbp 
  6. Ltmp1: 
  7.     movl    $21, -12(%rbp)      ;;int a = 21
  8.     movl    $7, -16(%rbp)       ;;int b = 7
  9.     movl    -12(%rbp), %eax     ;;a ^= b 
  10.     movl    -16(%rbp), %ecx 
  11.     xorl    %ecx, %eax 
  12.     movl    %eax, -12(%rbp) 
  13.     movl    -16(%rbp), %eax     ;;b ^=a 
  14.     movl    -12(%rbp), %ecx 
  15.     xorl    %ecx, %eax 
  16.     movl    %eax, -16(%rbp) 
  17.     movl    -12(%rbp), %eax     ;;a ^= b 
  18.     movl    -16(%rbp), %ecx 
  19.     xorl    %ecx, %eax 
  20.     movl    %eax, -12(%rbp) 
  21.     movl    $0, -8(%rbp)        ;;return 0
  22.     movl    -8(%rbp), %eax 
  23.     movl    %eax, -4(%rbp) 
  24.     movl    -4(%rbp), %eax 
  25.     popq    %rbp 
  26.     ret 
  27. Leh_func_end1:

(对于一行的异或运算交换法,得到汇编指令跟三行的是一样的。)

从汇编指令的行数,可以看出正如stackoverflow上讲的一样,利用临时变量的代码要明显短于其它两个。

对于临时变量法,每次赋值只要读取一个变量的值到寄存器,然后再从寄存器写回到另一个变量中即可。

但是对于运算操作,每次都需要读取两个数据到寄存器种,再进行运算操作。之后把结果写回到变量中。

如果这些指令被优化

其实如果编译后的汇编指令不是每次都把结果写回到变量,而是讲数据保存在寄存器中,把三次运算都执行完后再写回的吧,指令行数就会减少很多。以下就是那幻想出来的方式:

 
 
 
  1. _main: 
  2. Leh_func_begin1: 
  3.     pushq   %rbp 
  4. Ltmp0: 
  5.     movq    %rsp, %rbp 
  6. Ltmp1: 
  7.     movl    $21, -12(%rbp)      ;;int a = 21
  8.     movl    $7, -16(%rbp)       ;;int b = 7
  9.     movl    -12(%rbp), %eax     ;;a ^= b ^= a ^= b 
  10.     movl    -16(%rbp), %ecx 
  11.     xorl    %ecx, %eax 
  12.     xorl    %eax, %ecx 
  13.     xorl    %ecx, %eax 
  14.     movl    %eax, -12(%rbp) 
  15.     movl    %eax, -16(%rbp) 
  16.     movl    $0, -8(%rbp)        ;;return 0
  17.     movl    -8(%rbp), %eax 
  18.     movl    %eax, -4(%rbp) 
  19.     movl    -4(%rbp), %eax 
  20.     popq    %rbp 
  21.     ret 
  22. Leh_func_end1:

如果指令像上边那样执行,我们就明显减少了指令(可惜,即使是如此优化,指令行数还是要比使用临时变量的方式要多一行)。

不过,编译器并没有这么做,因为这样做破坏了编译中很重要的一个概念:序列点。再者这样实现很麻烦,不止要编译当前行,还要预测之后多行可能要做的操作才能决定是否缓存该数据在寄存器中。

而且如果运算法可以优化,那临时变量法也可以优化成:

 
 
 
  1. _main: 
  2. Leh_func_begin1: 
  3.     pushq   %rbp 
  4. Ltmp0: 
  5.     movq    %rsp, %rbp 
  6. Ltmp1: 
  7.     movl    $21, -12(%rbp)      ;;int a = 21
  8.     movl    $7, -16(%rbp)       ;;int b = 7
  9.     movl    -12(%rbp), %eax     ;;int tmp = a, a = b, b = a 
  10.     movl    -16(%rbp), %ecx 
  11.     movl    %ecx, -12(%rbp)      
  12.     movl    %eax, -16(%rbp) 
  13.     movl    $0, -8(%rbp)        ;;return 0
  14.     movl    -8(%rbp), %eax 
  15.     movl    %eax, -4(%rbp) 
  16.     movl    -4(%rbp), %eax 
  17.     popq    %rbp 
  18.     ret 
  19. Leh_func_end1:

用到两个寄存器,读取数据进来,然后写回到对方的变量中。临时变量也省了。

这样看来,要想写出高效又省空间的代码还是要用汇编语言哦。不过,我相信这并不能成为让大家都学习和使用汇编的理由,毕竟现在很多时候追求的不是执行效率,还是开发效率。

说回那个很炫的一行实现的异或交换法。其实已经违背了序列点的要求:在每个序列点,只能对变量进行一次修改。只是凑巧,在C中编译后让程序的得到了正确的结果,但是不是所有编译器都能那么好运的。

另外,在实际中,我还碰到了另一个“不凑巧”的情况:当把它应用在数组中的两个元素时,会得到错误的答案:

 
 
 
  1. #include  
  2. int main() 
  3.     int a[] = {21, 7}; 
  4.      
  5.     a[0] ^= a[1] ^= a[0] ^= a[1]; 
  6.     printf("%d, %d", a[0], a[1]); 
  7.     return 0; 
  8. //output:: 
  9. //0, 21

还是把这段代码转成的汇编指令(不包括printf那行),看看能不能找出其中的缘由

 
 
 
  1. _main: 
  2. Leh_func_begin1: 
  3.     pushq    %rbp 
  4. Ltmp0: 
  5.     movq    %rsp, %rbp 
  6. Ltmp1: 
  7.     movl    _C.0.1462(%rip), %eax 
  8.     movl    %eax, -16(%rbp) 
  9.     movl    _C.0.1462+4(%rip), %eax 
  10.     movl    %eax, -12(%rbp) 
  11.     movl    -16(%rbp), %eax 
  12.     movl    -12(%rbp), %ecx 
  13.     movl    -16(%rbp), %edx 
  14.     movl    -12(%rbp), %esi 
  15.     xorl    %esi, %edx 
  16.     movl    %edx, -16(%rbp) 
  17.     movl    -16(%rbp), %edx 
  18.     xorl    %edx, %ecx 
  19.     movl    %ecx, -12(%rbp) 
  20.     movl    -12(%rbp), %ecx 
  21.     xorl    %ecx, %eax 
  22.     movl    %eax, -16(%rbp) 
  23.     movl    $0, -8(%rbp) 
  24.     movl    -8(%rbp), %eax 
  25.     movl    %eax, -4(%rbp) 
  26.     movl    -4(%rbp), %eax 
  27.     popq    %rbp 
  28.     ret 
  29. Leh_func_end1: 
  30.     .section    __TEXT,__literal8,8byte_literals 
  31.     .align    2
  32. _C.0.1462: 
  33.     .long    21
  34.     .long    7

可以看出,编译对数组做了完全不同的处理。最关键的是,它一共用了4个寄存器,把每次要用到的数组中的变量,都预先读到了每个寄存器中,然后再用寄存器中不匹配的值进行运算。

 
 
 
  1. a[0] ^= a[1] ^= a[0] ^= a[1];

就相当于:

 
 
 
  1. a[0] = 21^7; 
  2.  a[1] = a[0]^7 = (21^7)^21 = 21; 
  3.  a[0] = a[1]^21 = 0; 
  4. he last line is supposed to be  a[0] = a[1]^a[0] = 21^(21^7);

所以以后还是不要用这些看似很炫的方式来做两数交换了,还是老老实实用个临时变量,或者比如在用C++的话直接调用标准库里的swap函数(临时变量实现)吧,这样也省了担心回有不能遇见的问题出现。

最后只感叹一句:

虎皮虽然精美,但是虎骨才是支撑起这张表皮的精髓;

编码虽然重要,但是编译才是让程序能够运行的重心。

标题名称:画虎画皮难画骨,编程编码难编译
网站URL:http://www.mswzjz.cn/qtweb/news48/399248.html

攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能