C语言浓密了然iOS开发中的BitCode效用

前言

做iOS开发的朋友们都晓得,最近流行的Xcode7,新建项目默认就打开了bitcode设置.而且大部分开发者都被这些突如其来的bitcode效能给坑过造成品种编译败北,而这多少个因为bitcode而编译败北的的花色都有一个共同点,就是链接了第三方二进制的库或者框架,而这多少个框架或者库恰好没有包含bitcode的事物(暂且称为东西),从而致使品种编译不成功.所以每当碰到那一个情状时候大部分人都是一向设置Xcode关闭bitcode功效,全体不生成bitcode.也不去研商这一开关背后掩藏的原理.中枪的请点个赞.

LLVM是当前苹果应用的编译器工具链,Bitcode是LLVM编译器的中间代码的一种编码,LLVM的前端可以清楚为C/C++/OC/斯维夫特(Swift)等编程语言,LLVM的后端能够理解为顺序芯片平台上的汇编指令或者可进行机器指令数据,那么,BitCode就是位于这两边直接的中游码.
LLVM的编译工作规律是前者负责把项目程序源代码翻译成Bitcode中间码,然后再遵照不同对象机器芯片平台转换为相应的汇编指令以及翻译为机械码.那样设计就足以让LLVM成为了一个编译器架构,可以一蹴而就的在LLVM架构之上发明新的言语(前端),以及在LLVM架构下边协助新的CPU(后端)指令输出,即便Bitcode仅仅只是一个中间码无法在任何平台上运行,可是它可以转化为另外被援助的CPU架构,包括现在还没被发明的CPU架构,也就是说现在开拓Bitcode效率交由一个App到使用公司,未来假若苹果新出了一款手机并CPU也是崭新设计的,在苹果后台服务器一样可以从这一个App的Bitcode起始编译转化为新CPU上的可执行程序,可供新手机用户下载运行那一个App.

正史回顾

在BlackBerry出来以前,苹果重要的编译器技术是用经过多少改进的GCC工具链来把Objective-C语言编写的代码编译出所指定的机械处理器上原生的可举办程序.编译器发生的可执行程序叫做”Fat
Binaries”–类似于Windows下PE格式的exe和Linux下的ELF格式的二进制,不同的是,一个”Fat
Binary”可以分包同一个主次的多多本子,所以同一个可执行文件可以在不同的总结机上运行.紧要就是其一技能让苹果的硬件很容易的从PowerPC迁移到PowerPC64的微机,以及新兴再迁移到Intel和Intel64处理器.这多少个方案带来的负面影响就是同一个文书中存了多份可进行代码,除了当前机械可实施的那一份之外任何都是不行的,白占空间.
这个在市面上被号称”Universal
Binary”,在苹果从PowerPC迁移到Intel处理器的事体起初存在的(一个二进制文件既涵盖一份PowerPC版本和一份AMD版本).渐渐的新生又扶助同时涵盖Intel32bit和英特尔 64bit. 在一个Fat
binary中,又操作系统运行时依据处理器类型动态拔取正确的二进制版本来运行,不过应用程序要辅助不同平台的处理器的话,应用程序本身要多占用部分空间.当然也有部分瘦身的工具,比如lipo,可以用来移除fat
binary中那一个当前机械中不被帮助的要么多余的可实施代码达到瘦身目标,lipo不会改变程序执行逻辑,仅仅只是文件的大小瘦身.

编译器现状

乘机活动装备移动互联网的深刻发展,现在活动设备中的程序大小变得进一步首要了,首如果因为移动设备中不会有处理器上那么大的一个硬盘驱动器.还有就是苹果已经从原来的ARM处理器迁移到自家设计的A4,A5,A5X,A6,A7,A8,A8X,A9,A9X以及后续的A10总结机,他们的指令集已经爆发了转移和原始ARM设计的有所区别,所有的那多少个生明尼阿波莉斯被iOS操作系统底层以及Xcode/LLVM编译工具向上层程序员一定水平的透明了,编译出来的次第会含有众多推行代码版本.当面对这些问题后,苹果投入大量本钱迁移到LLVM编译器架构并应用bitcode的必要性进一步大.从最起头的把OPENGL编译为特定的GPU指令到把Clang编译器(LLCM的C/OC编译前端)扶助Objective-C的立异并作为Xcode的默认编译器.

LLVM提供了一个虚构指令集机制,它可以翻译出指定的所支撑的总计机架构的执行代码(机器码).这些就使得为iOS应用程序的编译开发一个截然基于LLVM架构的工具链成为可能.而LLVM的这么些编造的通用的指令集可以用很多种意味着格式:

  • 号称IR的文书表示的汇编格式(像汇编语言);
  • 改换为二进制数据表示的格式(像目标代码),这一个二进制格式就是我们所说的bitcode.

Bitcode和历史观的可实施命令集不同,他维护的是函数功用的品种和签署,比如,传统可实施命令集中,一文山会海(<=8)的布尔值可以减小存储到单个字节中,可是在bitcode中他们是分别独立表示的.其余,逻辑运算操作(比如寄存器清零操作)也由她们相应的逻辑表示方法($R=0);当这一个BitCode要更换为一定机器平台的指令集时,他可以用经过针对一定机器平台优化过的汇编指令来取代:xor eax, eax.(这些汇编指令同样是寄存器<eax>清零操作).

但是bitcode他也不是一点一滴独立于电脑平台和调用约定的.寄存器的深浅在命令集中是一个一定关键的特点,众所周知,64bit寄存器可以比32bit寄存器存储更多的数码,生成64bit平台的bitcode和32bit平台的bitcode是家喻户晓例外的,还有,调用约定可以遵照函数定义或者函数调用来定义,这几个足以确定函数的参数传递是传寄存器值吗依旧压栈.
一些编程语言还有部分像sizeof(long)这样的预处理指令,这么些将在bitcode生成以前前被翻译.一般情形下,对于襄助fastcc(fast
calling convention)调用的64bit平台会扭转与其相同的bitcode代码.

苹果的渴求

到此,让我们寻思一下,为何苹果默认要求watchOS和tvOS的App要上传bitcode?
因为把bitcode上传到他自己的中坚服务器后,他可以为对象安装App的装置举办优化二进制,减小安装包的下载大小,当然iOS开发者也得以上传多少个版本而不是包裹到单个包里,不过如此会占用更多的存储空间.
最重点的是允许苹果可以在后台服务器对应用程序举行签约,而不用导出任何密钥到顶点开发者这.

上传到服务器的bitcode给苹果带来更便宜是:
将来新规划了新指令集的新CPU,可以继承从这份bitcode先导编译出新CPU上推行的可执行文件,以供用户下载安装.
而是bitcode给开发者带来的不便之处就是:
没用bitcode在此以前,当应用程序奔溃后,开发者可以遵照取得的的奔溃日志再配上上传到苹果服务器的二进制文件的调剂符号表信息可以过来程序运行过程到奔溃时后调用栈消息,对问题展开稳定排查.不过用了bitcode之后,用户设置的二进制不是开发者这边转移的,而是苹果服务器经过优化后变更的,其相应的调试符号信息丢失了,也就无法举行前面说的回升奔溃现场找原因了.

当前,watchOS和tvOS应用发表必须上传带bitcode版本的包.iOS应用发表对bitcode的渴求是可选的,用户可以在Xcode的门类安装中关闭.
相当于在编译的时候加一个标志:embed-bitcode-marker(调试构建)
embed-bitcode(打包/真机构建).这些在clang编译器的参数是-fembed-bitcode,swift编译器的参数是-embed-bitcode.

实践出真知

咱俩仍旧应当实际弄四个测试代码举行实施和视察一下比较好.做一次测试,第一次准备多个C语言源代码继续测试;第二次把其中一个生成为汇编语言源代码后再一个C代码和一个汇编代码一起重新往日的测试步骤举办自查自纠校验差距.

  • 1 . 如下三个百分之百是Objective-C代码:

test.m :

#import <Foundation/Foundation.h>
void greeting(void)
{
    NSLog(@"hello world!");
}

demo.m :

#import <Foundation/Foundation.h>
void demo(void)
{
    NSLog(@"demo func");
}

用Clang编译成 ARM64 格式且带bitcode的对象文件test.o demo.o:

wuqiong:~ apple$ xcrun -sdk iphoneos clang -arch arm64 -fembed-bitcode -c test.m demo.m

然后把多少个对象文件打包为一个静态库文件:

wuqiong:~ apple$ xcrun -sdk iphoneos ar  -r libTest.a test.o demo.o
ar: creating archive libTest.a

用Shell命令otool查看目的文件中是否包含bitcode段:

wuqiong:~ apple$ otool -l test.o |grep bitcode
  sectname __bitcode
  sectname __bitcode

假若见到输出了2行sectname __bitcode,就是阐明那静态库中的六个对象文件包含了bitcode.

  • 2.上面把里面一个demo.m换成汇编语言再参与编译:

用上边的通令把demo.m的C代码转换为ARM64汇编语言格式demo.s:

wuqiong:~ apple$ xcrun -sdk iphoneos clang -arch arm64 -S demo.m
wuqiong:~ apple$ cat demo.s
    .section    __TEXT,__text,regular,pure_instructions
    .ios_version_min 9, 2
    .globl  _demo
    .align  2
_demo:                                  ; @demo
    .cfi_startproc
; BB#0:
    stp x29, x30, [sp, #-16]!
    mov  x29, sp
Ltmp0:
    .cfi_def_cfa w29, 16
Ltmp1:
    .cfi_offset w30, -8
Ltmp2:
    .cfi_offset w29, -16
    adrp    x0, L__unnamed_cfstring_@PAGE
    add x0, x0, L__unnamed_cfstring_@PAGEOFF
    bl  _NSLog
    ldp x29, x30, [sp], #16
    ret
    .cfi_endproc

    .section    __TEXT,__cstring,cstring_literals
L_.str:                                 ; @.str
    .asciz  "demo func"

    .section    __DATA,__cfstring
    .align  4                       ; @_unnamed_cfstring_
L__unnamed_cfstring_:
    .quad   ___CFConstantStringClassReference
    .long   1992                    ; 0x7c8
    .space  4
    .quad   L_.str
    .quad   9                       ; 0x9

    .section    __DATA,__objc_imageinfo,regular,no_dead_strip
L_OBJC_IMAGE_INFO:
    .long   0
    .long   0


.subsections_via_symbol

下一场删除demo.m这个C源代码,仅留下test.mdemo.s:

wuqiong:~ apple$ rm demo.m

近年来,大家来把test.m其一C源代码和dmeo.s以此汇编源代码来一起带着-fembed-bitcode参数来生成靶子代码并打包为一个静态库:

wuqiong:~ apple$ xcrun -sdk iphoneos clang -arch arm64 -fembed-bitcode -c test.m demo.s
wuqiong:~ apple$ xcrun -sdk iphoneos ar -r libTest.a test.o demo.o

接下来我们再运行otool工具来检查这多少个新的静态库中蕴含的2个对象文件是否都带有bitcode段:

wuqiong:~ apple$ ar -t libTest.a
__.SYMDEF SORTED
test.o
demo.o
wuqiong:~ apple$ otool -l libTest.a | grep bitcode
  sectname __bitcode

很想拿到,这五遍,惟有一行sectname __bitcode输出,这就印证这六个目的文件,有一个不带有bitcode段,哪怕我们在编译的时候指定了参数-fembed-bitcode也不曾用.至于具体是哪一个不带bitcode段,我们必将理解就是特别从ARM64汇编语言编译过来的目标文件不带.

这就是说就查获一个结论,bitcode的转移,是由汇编语言以上的上层语言编译而来,和最前边所说的这样,他是上层语言与汇编语言(机器语言)之间的一个当中码.

当下大家一般的iOS应用开发中,一般不会需要用到汇编层面去优化的代码.所以我们根本关心第三方(开源)C代码,尤其是音录像编码解码这一个总计密集型项目代码,关键总括的代码针对一定平台都有对应平台的汇编版本实现,当然也有C的兑现,然而默认编译一般都是用的汇编版本,这样就会促成我们在编译那个开源代码的时候就是你带了-fembed-bitcode参数也仅仅只是让项目中的部分C代码的目标文件带了bitcode段,而那小数的汇编代码的靶子文件一律不带bitcode段,这样编译出这多少个库交给上层开发者使用的时候,就会师世在包装上传或者真机调试的时候因为Xcode默认开了bitcode功用而链接失利,导致不可以真机调试或者不可能上传应用到AppStore.

此文之初衷

目前在指引自己大卫营战友们做手机音录像直播的App,调试的时候手机采集音录像,视频用h264编码,音频接纳aac编码,通过RTMP探讨往斗鱼直播频道发布媒体流,项目需要用FFMPEGlibx264多少个开源项目,在编译为iOS框架库提供给学生用的时候,他们遭逢了bitcode的问题,尽管可以使用直接关闭bitcode来制止不当,可是战友的求知欲必须满意,格物致知,必须让其知其究竟.

libx264是VideoLan基金会保管的一个录像编解码的开源项目,其大气施用了逐一平台的多媒体汇编指令进行了优化,在编译为不带bitcode的库的时候,完全按官方autotools编译方法是不曾另外问题的;编译全带bitcode的库的时候大家不得不关闭汇编优化,在举行./configure等级可以添加--disable-asm参数来禁用汇编.可是,这么些选项在configure本子中的实现机制有题目.导致其依然调用了汇编的函数,可是汇编的代码却从不编译进去,从而会促成项目为真机构建和打包的链接阶段会透露找不到符号的错误,这样就无法到位两全其美.出于轻微程度的精神分裂症影响,故把以前的FFMPEGlibx264花色的编译脚本举行了改革和打补丁.而明晚已可以形成一键编译出带全体bitcode的FFMPEG和libx264的框架了.

FFmpeg内需依靠libx264.

活动编译脚本项目地方位于github:
https://github.com/Diveinedu-CN/FFmpeg-iOS-build-script.git

由于时间和字数原因,关于任何更多详细的消息就不苗条道来了.

David营教育Slogan: Dive in education!

更多iOS开发精品著作:戴维(David)营技术博客