# 杂项


一些嵌入式软件工程师常用的知识点，以体系结构，OS和编译器为主要内容  

<!-- more -->

# 杂项  

## 硬件  

SOC: system on chip  
电机会有死区电压，表现为电压很低时电机不能启动，死区电压约占额定电压的10%，此时需要给一PWM占空比最小值从而避免死区电压  

![2023-12-20_22-20](assets/113862122249687.webp)
处于三相电PWM调功率中的开关器件(如IGBT)，换相时为防止三相电任意上半桥和下半桥同时开启导致短路，我们要给死区时间，一般会占整个周期的百分之几，但当PWM占空比极小时，死区时间就会产生很大影响，最终影响输出纹波  

常量保存在Flash里，全局初始化非零的变量保存在SRAM的.data段内，静态变量或者全局初始化为零的变量保存在.bss段内。函数和函数内的局部变量保存在栈上**需要注意的是，.bss段内部在运行时不一定始终保持为0。例如如下代码**  
```c
int a[10] = {1, 2};  // 全局数组，未初始化 → .bss
int main() {
    int num；
    scanf("%d", &num);  // 运行时输入赋值
    if (num == 3) {
        a[5] = 4;        // 运行时修改
    }
    return 0;
}
```
**编译链接完成后，数组a的内存存放方式为：a[0]，a[1]存放在.data，a[2]~a[9]位于.bss段，当输入的num==3时，.bss段内的a[5]的值被更改为4**

尽量把数据保存在栈上，这样防止产生内存安全问题，并且栈上访问数据速度更快  
栈是从高地址向低地址增长，堆是从低地址向高地址增长  

![2024-04-09_15-12](assets/326561215267371.webp)

![2024-04-09_10-34](assets/321153610251887.webp)

操作Flash前需要关中断  

计算机底层是小端存储的原因是在C程序员眼里，小端更符合直觉，在不定长的int，char中可以相互转换而不改变变量值(变量长度小于int和char的最小值的情况下)，但是对于传输协议来说，大部分为定长字段传输，而大端存储更符合从左至右的阅读习惯，因此传输协议常使用大端  

## 编译器、C与内核  

### 编译器  

编译器通过前端处理将源文件转换为中间文件，这一步主要进行语法语义检查，而后通过优化器将中间文件进行代码优化，最后由后端将优化后的代码翻译成机器码  

由于gcc的模块化处理的并不好，一个开源的编译器框架就诞生了，这就是LLVM。有了LLVM，我们就可以自己设计语言，只要把设计的语言转换为LLVM能识别的IR中间代码即可，剩下的LLVM会自动处理。Clang编译器就是通过LLVM框架开发出来的

### GNU工具链  

GNU工具集：binutils tools，其中包括
* readelf：查看二进制文件的各个段的信息
* objdump：2进制转16进制，常用于反汇编，当然也可以用来查看文件信息
* objcopy：段的复制

### GCC特性  

#### 结构体初始化  

在Linux内核中会经常看到如下结构体初始化方式：
```c
static struct file_operations led_drv = {
	.owner	 = THIS_MODULE,
	.open    = led_drv_open,
	.read    = led_drv_read,
	.write   = led_drv_write,
	.release = led_drv_close,
	//其他成员自动初始化为NULL或0，不必手动注册
};
```

这里利用了GCC编译器的特性，即采用结构体位域的注册方式，当一个结构体有许多成员时这样注册可以避免将所有成员都注册一遍，那样的话注册`file_operations`就太繁琐了

#### 语句表达式

({ /* do something */ })：语句表达式，其值等于最后一行代码

```c
#define MAX(X,Y) ({\
int x=X;\
int y=Y;\
x>y?x:y;})
```
MAX(X,Y)的值就是三目运算的结果

#### 宏泛型编程与代码生成

下面的RT-Thread的代码使用了该技术，内核中也比较常见  
```c
#define OFW_PROP_READ_UXX_ARRAY_INDEX(bit)                      \
int rt_ofw_prop_read_u##bit##_array_index(                      \
        const struct rt_ofw_node *np, const char *propname,     \
        int index, int nr, rt_uint##bit##_t *out_values)        \
{                                                               \
    int res, max_nr;                                            \
    if (np && propname && index >= 0 && nr >= 0 && out_values)  \
    {                                                           \
        rt_ssize_t len;                                         \
        const fdt##bit##_t *elm;                                \
        elm = rt_ofw_prop_read_raw(np, propname, &len);         \
        max_nr = len / sizeof(*elm);                            \
        if (elm && index < max_nr)                              \
        {                                                       \
            elm += index;                                       \
            max_nr -= index;                                    \
            res = nr > max_nr ? max_nr : nr;                    \
            for (nr = 0; nr < res; ++nr)                        \
            {                                                   \
                *out_values++ = fdt##bit##_to_cpu(*elm++);      \
            }                                                   \
        }                                                       \
        else                                                    \
        {                                                       \
            res = -RT_EEMPTY;                                   \
        }                                                       \
    }                                                           \
    else                                                        \
    {                                                           \
        res = -RT_EINVAL;                                       \
    }                                                           \
    return res;                                                 \
}

OFW_PROP_READ_UXX_ARRAY_INDEX(8)
OFW_PROP_READ_UXX_ARRAY_INDEX(16)
OFW_PROP_READ_UXX_ARRAY_INDEX(32)
OFW_PROP_READ_UXX_ARRAY_INDEX(64)

#undef OFW_PROP_READ_UXX_ARRAY_INDEX

...

#ifdef __CHECKER__
#define FDT_FORCE __attribute__((force))
#define FDT_BITWISE __attribute__((bitwise))
#else
#define FDT_FORCE
#define FDT_BITWISE
#endif

typedef uint16_t FDT_BITWISE fdt16_t;
typedef uint32_t FDT_BITWISE fdt32_t;
typedef uint64_t FDT_BITWISE fdt64_t;
typedef uint64_t unaligned_fdt64_t __attribute__((aligned(4)));

#define EXTRACT_BYTE(x, n)  ((unsigned long long)((uint8_t *)&x)[n])
#define CPU_TO_FDT16(x) ((EXTRACT_BYTE(x, 0) << 8) | EXTRACT_BYTE(x, 1))
#define CPU_TO_FDT32(x) ((EXTRACT_BYTE(x, 0) << 24) | (EXTRACT_BYTE(x, 1) << 16) | \
             (EXTRACT_BYTE(x, 2) << 8) | EXTRACT_BYTE(x, 3))
#define CPU_TO_FDT64(x) ((EXTRACT_BYTE(x, 0) << 56) | (EXTRACT_BYTE(x, 1) << 48) | \
             (EXTRACT_BYTE(x, 2) << 40) | (EXTRACT_BYTE(x, 3) << 32) | \
             (EXTRACT_BYTE(x, 4) << 24) | (EXTRACT_BYTE(x, 5) << 16) | \
             (EXTRACT_BYTE(x, 6) << 8) | EXTRACT_BYTE(x, 7))

static inline uint16_t fdt16_to_cpu(fdt16_t x)
{
    return (FDT_FORCE uint16_t)CPU_TO_FDT16(x);
}
static inline fdt16_t cpu_to_fdt16(uint16_t x)
{
    return (FDT_FORCE fdt16_t)CPU_TO_FDT16(x);
}

static inline uint32_t fdt32_to_cpu(fdt32_t x)
{
    return (FDT_FORCE uint32_t)CPU_TO_FDT32(x);
}
static inline fdt32_t cpu_to_fdt32(uint32_t x)
{
    return (FDT_FORCE fdt32_t)CPU_TO_FDT32(x);
}

static inline uint64_t fdt64_to_cpu(fdt64_t x)
{
    return (FDT_FORCE uint64_t)CPU_TO_FDT64(x);
}
static inline fdt64_t cpu_to_fdt64(uint64_t x)
{
    return (FDT_FORCE fdt64_t)CPU_TO_FDT64(x);
}
#undef CPU_TO_FDT64
#undef CPU_TO_FDT32
#undef CPU_TO_FDT16
#undef EXTRACT_BYTE
```

### 链接

链接过程包括：地址和空间分配，符号决议和重定位  
编译阶段时，具体的函数，变量地址并未确定，每个需要重定位的地方称为重定位入口，因此还需要链接器在链接阶段进行变量，函数的重定位，这样就可以获得程序的加载地址了  

产生的.bss段在文件中并不占用可执行文件的空间，.bss只声明在运行程序时需要所占内存的大小，在运行阶段由加载器解析bss段后分配内存空间

![2024-03-19_21-25](assets/282042521240360.webp)

编译产生的文件被称为目标文件，其包括可执行文件(linux的elf，或者unix的out)，动态链接库文件以及静态链接库(这两位也是按**可执行文件格式**存储的)  

.comment保存的是编译器和系统版本信息，这些信息也是只读的  

符号表的段：.symtab  

链接时最后的exit()函数负责清理收尾工作，如果要自己重定位main函数入口的话，那么在程序最后就不能使用return了，否则会导致段错误  

section header table位于文件最后，它记录了各个段的段名，段大小，偏移值等，可以用readelf或objdump来查看

#### 静态链接  

静态链接重定位过程:
* 静态链接时，由于各个目标文件的各个段需要合并，因此在合并时需要对一些地址操作进行重定位。需要被重定位的代码被统一放在.rel.text段内，而需要被重定向的数据则需要被放在.rel.data段内，这两段也被称为重定位表。重定位时，在分配好目标文件的空间后，编译器会计算PC与需要重定位的数据或指令的地址偏移量，将计算的结果写入到重定位表后就可以找到对应的数据和地址了
* 在链接时还需要进强弱符号裁决，这时需要将弱符号放入COMMON块内，这个段放的是未知大小的数据。由于弱符号是声明但未初始化的符号，因此需要放入COMMON块内。当裁决完毕后，所有符号的大小都被确定了，这时放入COMMON块的如果是未初始化全局变量的弱符号，那么就会被放入bss段

在编译C++代码时，还需要做好重复代码消除和构造与析构的操作，在使用模板，虚函数表或者重载时会产生命名冲突的问题，解决办法是在函数/模板名后加_参数类型来避免符号重名。对于构造与析构解决的方法是是加入.init与.fini段，这两个段里的代码会分别在main函数前后阶段执行  

elf文件加载过程：
对于静态链接，OS首先调用fork来开辟一个新进程，然后使用execve来调用sys_execve，最后调用do_execve来进行elf文件的装载，下面是do_execve做的事
* 装载之前要判断elf文件前的魔数从而获得文件格式(待加载文件也有可能是#!开头的脚本文件)
* 对elf文件各段映射到内存中
* 初始化可执行文件的环境(调用.init和伴随文件传入的若干参数)
* 对于静态链接器来说，需要找到e_entry段从而获得可执行文件入口。对于动态链接来说，需要寻找动态链接.interp段从而找到动态链接器的路径(.interp段的内容是链接时被指定的，通过不同工具链个性化.interp段内容，这也是交叉编译工具链的核心原理)  
这样当从do_execve函数返回时就得到了elf文件的入口

#### 动态链接  

动态链接实际上是把链接过程从装载前推迟到了装载时  

动态链接特点：
* 优点
    * 占用空间小，支持cow
    * 可以动态加载程序，这使得程序编写可以模块化，插件化，对于大型工程来说，这使得不同的子模块分别使用不同的语言成为可能
    * 方便程序进行更新升级
* 缺点  
    * 由于每次运行程序都需要重新链接，因此程序性能受到损失，但是可以通过各种优化使得性能损失减少(优化后总损失约5%)

动态加载程序的地址空间中不仅有程序本身，还有依赖的其他动态库，C语言运行库(libc.so)以及动态链接器(ld-2.6.1.so)  

有趣的是真正的动态链接器位于内核(或者lib/ld.x.y.z.so)，每个进程里的动态链接器是个软链接，而动态链接器本身是以静态链接的方式加载的  

静态链接时的重定位称为链接时重定位，动态链接时重定位称为装载时重定位，也被称为基址重置(Rebasing)  

#### 装载时重定位和地址无关码  

为了实现**代码之间**的地址无关，即多个进程可以使用同一份内存中的代码(这会造成装载和指令取址的问题)，我们可以通过装载时重定位和地址无关码来解决  

动态链接时代码装载时各个指令的地址无法确定，这样会给取指造成一定的困难，动态链接的解决办法是装载时才确定具体的指令地址  
* 装载时重定位：类似于静态链接时的重定位功能，但简单很多。因为程序是整段加载进内存的，不需要考虑像编译阶段那样代码行数和地址操作的改变。所以只需要在地址上统一加上装载时的偏移即可。装载时重定位只考虑了指令和变量的地址安排，但指令具体的地址操作就无能为力了。比如想要取0x80002000地址，对于静态链接这是链接阶段就写好的，而一旦这个地址规定好就只能给一个进程使用了。动态链接的解决办法是让代码段里的代码与地址无关
* 地址无关码(PIC，Position-independent Code)：既然有的代码是与进程本身相关的，那么把这些代码分离出来的话剩下的代码不就与进程无关了么？这样就可以在进程中共享代码了。分离出来的代码放在哪？既然这部分代码与各自进程相关，那就放在对应进程的数据段。因此，在数据段中又分离出了一个新的段(.got，Global Offset Table)，这个段内放置了一个指向地址相关符号的数组，只要对里面元素进行解引用就可以找到符号地址了，这时操作由地址相关转化为地址无关(.got及其内部符号的位置是编译器规定且知晓的)。.got不仅可以保存本进程的地址相关码，也可以保存其他进程的地址相关码，这样就可以共享全局变量和函数了

由于动态链接会有一定的性能损失，这主要由工程内的大量函数引起(因为全局变量会增加模块耦合度，用的很少)，所以想办法降低模块的函数重定位消耗即可，因此我们还需要在PIC上做一定的改进
* 延迟绑定(PLT，Procedure Linkage Table)：本质上是在调用函数时才进行重定位和绑定。plt较为复杂，首先它有两个段.rel.plt与.plt，前者本质是个数据段，用于plt的重定向，里面放置了需要重定向的各种符号，.plt段本质是个代码段，用于检测符号是否初始化完成以及跳转到.got段。延迟绑定的过程如下：
    * 程序需要调用函数时需要在.plt段内判断是否被初始化
        * 若未被初始化则需要执行汇编操作，从.rel.plt中获得符号地址并绑定，具体的绑定结果放入.got段内(具体操作也是在.plt段内执行的)
        * 若已经初始化则跳转到.got段内执行相关函数

程序加载后映射时如何使得内存占用最小
* 无论是动态加载还是静态加载，为了使得内存占用最小。unix将各个段的接壤处不做分割处理，仍然位于同一物理页，但是在映射到虚拟内存的过程中会被映射两次，这样其他程序就可以通过不同的虚拟内存地址找到同一块物理内存，从而可以节省物理内存了

内核模块文件.ko本质上也是动态加载的可重定位目标文件，与普通文件的区别是.ko文件运行在内核空间

#### 强弱符号

[宅学部落](https://www.zhaixue.cc/c-arm/c-arm-weak-attribute.html)

在一个程序中，无论是变量名，还是函数名，在编译器的眼里，就是一个符号而已。符号可以分为强符号和弱符号

* 强符号：函数名、初始化的全局变量名，如int i=10
* 弱符号：未初始化的全局变量名，如int i

对于同名强符号，链接阶段时会被报重定义错误，若强弱符号重名，编译器会优先选择强符号。若弱符号未被定义，则会被编译器初始化为0或NULL(并不严格保证)，因此此时的程序可以过编译链接，但是在运行时可能会得到不正确的结果或段错误

GNU C 通过 \_\_atttribute\_\_ 声明weak属性，可以将一个强符号转换为弱符号

```c
void  __attribute__((weak))  func(void);
int  num  __attribte__((weak));
```

* 编译阶段：编译器以源文件为单位，将每一个源文件编译为一个 .o 后缀的目标文件。每一个目标文件由代码段、数据段、符号表等组成
* 链接阶段：链接器将各个目标文件组装成一个大目标文件。链接器将各个目标文件中的代码段组装在一起，组成一个大的代码段；各个数据段组装在一起，组成一个大的数据段；各个符号表也会集中在一起，组成一个大的符号表。最后再将合并后的代码段、数据段、符号表等组合成一个大的目标文件
* 重定位：因为各个目标文件重新组装，各个目标文件中的变量、函数的地址都发生了变化，所以要重新修正这些函数、变量的地址，这个过程称为重定位

重定位结束后，就生成了可以在机器上运行的可执行程序  

最早的编译器为了支持汇编语言和C的程序可以互相调用，规定了C语言符号前加“_”来避免与汇编语句重名。现代的GCC抛弃了这种做法，但是msvc却保留了。为了支持C++的重载，命名空间不同时支持同名函数的功能，编译器利用了函数名，参数列表和命名空间名称一起修饰符号，从而获得新的符号名

### Linux中的OOP  

为了最大化实现代码复用和分层分离思想，我们可以采用OOP方法

#### 封装  

对于设备树来说，为了统一管理成千上万种设备，内核采用了OOP的思想：
* 首先从所有设备中抽离出kobject对象，这个对象代表了任意一个设备，若干个设备被集合为同一种并被kset对象进行管理，下图中/sys目录下的每一种设备都是kset。因此对于sysfs子系统(也就是/sys目录)来说他有若干个kset组成
![2024-04-10_16-31](assets/517493116268555.webp)

![2024-04-07_16-50](assets/597195016246741.webp)  

* 之后device结构体又对kobject进行了封装，但是在封装的过程中又引入了bus_type，device_driver等特性来支持总线设备驱动模型，这完美体现了OOP思想

![2024-04-07_17-01](assets/538480117266907.webp)

* device只是对总线设备驱动模型的一次封装，对于具体的设备类型我们还需要再次封装来实例化device对象，例如对于USB设备驱动来说它有USB状态，速度等特性，因此有了下面的结构体  

![2024-04-07_17-03](assets/225970417259576.webp)  

总结：
![2024-04-07_17-04](assets/587770417256131.webp)

### alias  

GNU C 扩展了一个 alias 属性，这个属性很简单，主要用来给函数定义一个别名

```c
    void __f(void)
    {
        printf("__f\n");
    }
    void f() __attribute__((alias("__f")));
    int main(void)
    {
        f();
        return 0;   
    }
```
输出结果：
```c
__f
```

### typeof  

GNU C 扩展了一个关键字 typeof，用来获取一个变量或表达式的类型

```c
int main(void)
{
    int i = 2;
    typeof(i) k = 6;
    int *p = &k;
    typeof(p) q = &i;
    printf("k = %d\n", k);
    printf("*p= %d\n", *p);
    printf("i = %d\n" ,i);
    printf("*q= %d\n", *q);
    return 0;
}
```
输出结果：
```c
k  = 6
*p = 6
i  = 2
*q = 2
```

有了typeof后就可以进行“泛型”编程了(虽然C标准不支持泛型)
```c
//swap支持多种类型的a,b进行交换
//宏内部定义的变量不需要括号保护，输入的变量需要加括号来防止宏展开导致的运算优先级问题
#define swap(a, b) \
do {               \
    typeof(a) __tmp = (a);  \
    (a) = (b);         \
    (b) = __tmp; \
} while (0)

//内核中的typeof应用
#define min(x, y) ({                \
    typeof(x) _min1 = (x);          \
    typeof(y) _min2 = (y);          \
    //这里的&_min1 == &_min2两个地址进行比较的意思是：两个指针能够进行比较的前提是类型相同，类型不同的指针进行比较会报需要类型转换的warning，这样就可以通过比较操作来判断出入的参数类型是否相同了           \
    //使用void是为了忽略未使用表达式的编译警告    \
    (void) (&_min1 == &_min2);      \
    _min1 < _min2 ? _min1 : _min2; })

#define max(x, y) ({                \
    typeof(x) _max1 = (x);          \
    typeof(y) _max2 = (y);          \
    (void) (&_max1 == &_max2);      \
    _max1 > _max2 ? _max1 : _max2; })
```

### container_of 宏实现  

```c
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
#define  container_of(ptr, type, member) ({    \
         const typeof( ((type *)0)->member ) *__mptr = (ptr); \
         (type *)( (char *)__mptr - offsetof(type,member) );})
```

### 内核中的符号导出EXPORT_SYMBOL()

本质上是通过将符号单独放入一个段内来导出，并在导出的过程中使用__visible保持目标在当前编译文件中可见  
[The Linux Kernel Macro Journey — __visible](https://medium.com/@boutnaru/the-linux-kernel-macro-journey-visable-a03f7ba273b3)  

内核中常用的修饰符`__used `和`__visible`也来源于gcc，前者代表即使程序中没有用到该符号也不要让gcc优化，防止运行时符号丢失，__visible代表可以被其他程序访问，用于导出符号  
```c
#define __used         __attribute__((__used__))
#define __visible      __attribute__((__externally_visible__))
```

```c
#define __EXPORT_SYMBOL(sym, sec)				\
	extern typeof(sym) sym;					\
	__CRC_SYMBOL(sym, sec)					\
	static const char __kstrtab_##sym[]			\
	__attribute__((section("__ksymtab_strings"), aligned(1))) \
	= VMLINUX_SYMBOL_STR(sym);				\
	extern const struct kernel_symbol __ksymtab_##sym;	\
	__visible const struct kernel_symbol __ksymtab_##sym	\
	__used							\
	__attribute__((section("___ksymtab" sec "+" #sym), unused))	\
	= { (unsigned long)&sym, __kstrtab_##sym }

#define EXPORT_SYMBOL(sym)					\
	__EXPORT_SYMBOL(sym, "")
```
[linux 内核中EXPORT_SYMBOL（）分析与实践](https://www.cnblogs.com/iriczhao/p/15493106.html)

### VDSO  

vdso(Virtual Dynamic Shared Object)，其本质是个.so文件  
发展历程：当APP想要触发软件中断时intel平台会触发sysenter，而AMD也会提供自己的指令，但是这些指令与内核int80中断在实现上有很大区别，为了弥合这些差异，Linux推出了vsyscall机制，其本质是对上面指令的二次封装。但是由于vsyscall采用了固定加载的方式产生了安全的问题。因此Linux又进一步将vsyscall变为了动态加载的.so文件。至此，对于经常触发系统调用的gettimeofday()，time()和getcpu()等APP来说，vsyscall不仅解决了兼容性的问题，在后期还解决了int80中断性能低下的问题  
vdso的出现还解决了glibc在内核中地位的问题，早期的glibc不仅要支持linux各版本还要支持bsd，hurd等os。glibc和linux两个项目都需要进行协调，这在linux内核发行版兼容性上产生了很大的问题，为此linux允许将glibc这个项目作为内核的一部分发行，但运行时为了防止内核膨胀就禁止其运行在内核空间。这样，在磁盘中并没有单独的glibc项目(因为已经随内核发行而被隐藏在内核内部了)，在运行时glibc为了避免内核膨胀而运行在用户态，同时glibc又管理着众多APP，因此glibc被加入了vdso使其在系统运行时就自动加载进用户空间

### 自己的printf  

使用自己的printf可以方便的通过宏开关来设置是否打印调试信息，还可以设置打印级别
[宅学部落](https://www.zhaixue.cc/c-arm/c-arm-format.html)

```c
#define DEBUG      //打印开关
void __attribute__((format(printf,1,2))) LOG(char *fmt,...)
{
#ifdef DEBUG
    va_list args;          //定义char*类型的指针args
    va_start(args,fmt);    //根据参数fmt的地址，获取fmt后面参数的地址，并保存在args指针变量中
    vprintf(fmt,args);     //调用vprintf打印字符
    va_end(args);          //将args指针置空  
#endif
}
int main(void)
{
    int num = 0;
    LOG("I am litao, I have %d car\n", num);
    return 0;
}
```

### arm汇编  

#### 标准指令  

B指令：无条件跳转，常用B LOOP代表跳转到LOOP，跳转范围32MB  
BEQ：两个值相等时跳转  
BNE：两个值不相等时跳转  
BL：带链接的跳转，跳转时会保存下一条指令到LR  

C语言中的指针操作，在汇编层次就是使用寄存器间接寻址实现的，即将寄存器中的值作为地址去访问内存  

寄存器和内存之间传送指令使用LDR/STR，寄存器之间传送指令使用MOV

#### 伪指令  

伪指令不是arm指令集中定义的标准指令，而是编译器厂商自定义的辅助指令  

LDR伪指令：LDR R0，=0x80002000  
由于arm指令操作码与操作数共享32位空间，操作码会挤压操作数的寻址空间，因而需要单独的伪指令来完成这一步骤，为了和arm本身的LDR指令区分开，LDR伪指令会在操作数前加“=”。因此LDR指令支持4GB寻址

### 内建函数  

内建函数，顾名思义，就是编译器内部实现的函数。这些函数跟关键字一样，可以直接使用，无须像标准库函数那样要 #include 对应的头文件才能使用  

内建函数的函数命名，通常以 __builtin 开头。这些函数主要在编译器内部使用，主要是为编译器服务的。内建函数的主要用途如下：
* 用来处理变长参数列表；
* 用来处理程序运行异常；
* 程序的编译优化、性能优化；
* 查看函数运行中的底层信息、堆栈信息等；
* C 标准库函数的内建版本

#### __builtin_expect(exp,c)  

内建函数 __builtin_expect 也常常用来编译优化。这个函数有两个参数，返回值就是其中一个参数，仍是 exp。这个函数的意义主要就是告诉编译器：参数 exp 的值为 c 的可能性很大。然后编译器可能就会根据这个提示信息，做一些分支预测上的代码优化

#### 内核中的 likely 和 unlikely  

likely与unlikely本质上是内建函数expect的应用
```c
#define likely(x) __builtin_expect(!!(x),1)
#define unlikely(x) __builtin_expect(!!(x),0)
```

### 内核中的内联函数  

在内核中常见的内联函数定义位于头文件中，这时我们可能会有一点疑惑：头文件如果包含定义的话，而包含头文件的源文件又是多个，这对于作用域是全局的函数来说是致命的，因为可能导致重定义错误  
* 那么为什么还要把内联函数放在头文件中？这是因为inline关键字只对定义有效，而对声明无效，要想其他文件能够引用内联函数就必须将其定义在头文件中
* 那么怎么解决上述问题呢？为了防止重定义错误，我们只需要改变内联函数的作用范围就行了，因此我们可以加上关键字static。这就变成了我们在内核中经常看到的内联函数：
```c
static inline void func(int, int)
{
    //func body
}
```

### 编译后的产物  

elf文件：由elf文件头和bin格式的执行代码构成，内部包含段表以及调试信息，因此在获得bin文件后还要保留对应的elf文件，否则可能导致丢失源代码后无法调试。值得注意的是使用`gcc -o3`生成的elf文件不会生成调试信息，想要保留调试信息还需要添加-g选项：`gcc -o3 -g`  
hex文件：包含地址信息，相比bin而言添加了地址信息，类型信息以及校验和，但并未生成各段。虽然没有段的生成，但是仍然可以按段加载，这是因为内部含有地址信息，可以手工指定地址进行段加载。同时由于内部包含段的信息，因此可以直接烧录到硬件。需要注意的是，hex并不包含调试信息  
bin文件：最直接的代码映像，只包含指令，不包含地址信息，所有地址均通过计算或指令寻址获得，可以直接烧录但需要指明烧录地址  
axf文件：包含调试信息，该文件是arm出品的对标elf的文件格式，因此elf拥有的段以及段表，符号表等信息在axf文件中也可被找到，并针对arm平台做了优化  

对于上述文件的区别需要从体系结构方面来理解：  
首先是elf，对于linux专有的文件格式，elf会被加载器按段加载(虽然加载器的一部分工作已经被编译器所取代)，这样就需要有mmu硬件支持(mmu有支持按段加载的能力，可以进行权限判别，否则就需要使用软件加载器了，而这会造成效率问题).并且由于elf本质上是执行文件，其内部的执行段的代码和bin文件内容是一样的。也就是说，elf≈elf头+bin  
axf实际上是elf文件格式的变种，只是针对arm平台做了优化  
hex可以理解为能够按段加载的bin，因此支持分段烧录，这也是各厂家的烧录器选择了hex的原因：要烧录的地址已经在烧录软件内部进行集成了，可以通过选择开发板来确定预设的烧录地址。由于按段加载的特性，hex文件可以用于bootloader  
bin则是最直接的运行文件，可以直接烧录到单片机上，但是由于没有段和地址信息，在烧录时需要指明烧录到flash的哪个位置，这也是需要在烧录软件或命令中指明地址的原因：`esptool.py -b 115200 --before default_reset --after hard_reset write_flash --flash_mode dio --flash_size detect --flash_freq 80m 0x0 builtin_imgs/bootloader.bin 0x08000 builtin_imgs/partition-table.bin 0x010000 rtthread.bin`

### 程序文件与运行文件  

程序文件的区域(在嵌入式领域存储于flash上)：  
* 代码区
* 数据区
* 常量区  

通过链接将各种.o文件链接为程序文件，链接过程中，各个程序文件的相同段被分配在一起并且还要计算出在编译阶段时没有填充的虚拟地址，但在可执行文件中分配的.bss段不占用文件空间。bss虽然在可执行文件中不占用空间，但是我们依然可以使用readelf或者objdump来查看section header中.bss的大小，这也是程序**运行时**的bss段大小

运行文件的区域(存储于ram上)：
* 堆
* 栈
* 数据(.data/.bss)
* 代码  

程序文件加载到RAM时会被OS分配页表项(PTE)，使得OS和MMU分配的物理地址能够与进程虚拟地址相对应。还需要注意的是，在加载过程中，不同进程的相同段也会如程序文件那般被统一分配在一起  

因此为了能够在不同进程中相同的虚拟地址下访问不同的物理地址，OS是通过内核空间中不同进程的页表来访问物理地址的  

为了防止黑客获取程序信息，内核本身，堆，栈，mmap区在每次机器启动时都会相对其标准地址有一个偏移。在程序运行时，黑客可以通过利用内存溢出而覆盖LR的漏洞来跳转到自己的函数中，或者直接修改got表来达到自己目的

### 缺页异常  

当创建用户程序时只进行页表的复制而不进行页复制，当确实需要改变进程的内容时再进行页复制，此时会触发缺页中断。这被称为写时复制

### kfifo  


### 栈相关  

#### 栈大小

Linux默认给每一个用户进程栈分配8MB大小的空间。栈的容量如果设置得过大，则会增加内存开销和启动时间；如果设置得过小，则程序超出栈设置的内存空间又容易发生栈溢出(Stack Overflow)，产生段错误，修改栈大小使用ulimit命令  

Linux内核栈大小是固定的，默认为8k  

#### 函数栈与进程栈  

函数栈：保存了局部变量，函数参数，并预留一部分临时存储区  
进程栈：保存了CPU寄存器，被打断的地址，任务现场。这是因为一个任务由多个函数构成，这些函数也会调用其他的函数，这一系列调用关系也就是一系列函数的栈帧组成了进程的栈

#### 内核栈与用户栈  

两者都是进程栈并且维护的都是函数调用关系的一系列栈帧。不同之处在于，用户态无法访问内核栈，因此需要在内核态开辟一块空间来存储内核态的函数的调用关系。在arm中使用msp寄存器保存内核栈或中断栈的栈指针，psp保存用户栈或进程栈的栈指针

### 中断与不可重入函数  

因为中断函数返回时需要cpu恢复现场，此时中断函数返回地址、状态不确定，所以中断处理函数没有返回值。再由于中断函数被调用的时间地点无法确定，因此不能给中断函数传参  

由于在中断中只保存了必要的寄存器，返回地址等少量数据，因此当在中断中访问其他区域的数据，如全局变量和静态变量时，程序的行为就会不可控。例如某些全局变量有锁，那么中断中访问这些变量的时间就不可确定，有可能造成中断丢失的现象  
为了解决上述问题，我们将函数分为可重入函数和不可重入函数。可重入函数指的是在执行过程中可以被任意中断，不可重入函数指的是在执行过程中不可以被中断。同时在中断内也不能调用不可重入函数，满足下列要求之一的就被称为不可重入函数：
* 函数内部使用了全局变量或静态局部变量
* 函数返回值是一个全局变量或静态变量
* 函数内部调用了malloc()/free()函数
* 函数内部使用了标准I/O函数
* 函数内部调用了其他不可重入函数  

值得注意的是，不可重入函数只在中断环境中才有讨论的意义。可我们在函数中总要使用全局变量的，这样的话大部分函数就是不可重入的了？有什么解决办法么？我们虽然不能解决在中断中不能使用不可重入函数这个问题，但是我们可以解决不可重入函数被中断的问题：加锁或者更为粗暴的关中断，虽然后者代价会很大(不能相应其他中断)。了解这些后对于为什么不能在中断中使用malloc就好理解了，malloc要维护一个全局的brk指针，这个指针位于glibc库中，这涉及全局变量，更何况malloc是耗时操作。虽然加锁后的malloc是线程安全的，它仍没有解决不可重入这一问题。对于标准IO函数来说来说，它不仅要维护相关的全局变量，这也是耗时操作，还有可能在中断中获取文件锁，这会造成死锁  

从上面的结论可知，可重入函数一定是线程安全的，但是线程安全的不一定是可重入函数(例如持有互斥锁的线程就是不可重入的)

### 进程间通信  

对于不同进程间的通信，Linux有以下工具可以使用：
* 无名管道:只能用于具有亲缘关系的进程之间的通信
* 有名管道:任意两进程间通信
* 信号量:进程间同步,包括system V信号量、POSIX信号量
* 消息队列:数据传输,包括system V消息队列、POSIX消息队列
* 共享内存:数据传输,包括system V共享内存、POSIX共享内存
* 信号:主要用于进程间的异步通信
* Linux新增API:signalfd、timerfd、eventfd
* Socket:套接字缓冲区,不同主机不同进程之间的通信
* D-BUS:主要用于桌面应用程序之间的通信

### 线程池和协程

在一些频繁创建销毁线程的场景中，我们会产生额外的开销。而线程池就是为解决这一问题诞生的  
一个线程池会首先创建很多线程，这些线程统一由管理线程的模块管理。当线程无任务时会被阻塞在线程池中，有任务时就会被调度器调度。这样我们就可以减少创建和销毁线程的开销了

虽然线程池技术极大的缓解了创建和销毁线程的开销，但是对于一些互联网开发领域，面对频繁，大量的互联网并发请求时，线程池就无能为力了。这就跟一家三口使用卫生间一样：如果每个人上厕所都要先申请锁，锁门，再开门，释放锁，时间久了会让人感觉很麻烦。一个更好的解决方法是上厕所时大家协商着来，这样就不用频繁地加锁、解锁了  
协程就是按照这个思路实现的，将对共享资源的访问交给程序本身维护和控制，不再使用锁对共享资源互斥访问，无调度开销，执行效率会更高。协程一般适用在彼此熟悉的合作式多任务中，上下文切换成本低，更适合高并发请求的应用场景  
从切换成本上看，进程的切换成本最大，协程的切换成本最低。而从安全性上看，进程因为有内存管理保护反而最安全，一个进程崩溃了，操作系统会终止这个进程的运行，并不会影 响其他进程的正常运行，当然也不会影响到操作系统本身。 协程虽然上下文切换成本最低，但是也有缺陷，如无法利用多核CPU实现真正的并发。但这并不妨碍它在编程市场上的受欢迎程度，很多语言都开始支持使用协程编程：Python提供了yield/send协程编程接口，从Python3.5开始又新增了async/await接口。在C语言编程领域，虽然C语言本身并没有提供支持协程的机制，但目前市面上也有很多使用C/C++实现的协程库，用户可以通过库接口函数去实现协程编程

### ATPCS规则  

ATPCS规则定义了子程序函数调用规则  
子程序间要通过寄存器R0~R3(可记作a0\~a3)传递参数，**当参数个数大于4时，剩余的参数使用父函数的堆栈来传递**，参数地址位于父函数的末尾，因此传递时利用FP寄存器存储的值并向高地址偏移若干位来获得各参数值  
* 子程序通过R0~R1返回结果
* 子程序中使用R4~R11(可记作v1\~v8)来保存局部变量
* R11作为调用过程中的临时寄存器，一般用来保存函数的栈帧基址，记作FP
* R13作为堆栈指针寄存器，一般记作SP
* R14作为链接寄存器，用来保存函数调用者的返回地址，记作LR
* R15作为程序计数器，总是指向当前正在取指的指令，记作PC

### 生命周期与作用域  

全局变量的作用域如下
* 全局变量的作用域由文件来限定
* 可使用extern进行扩展，被其他文件引用
* 也可以使用static进行限制，只能在本文件中被引用

局部变量的作用域如下
* 局部变量的作用域由{}限定
* 可以使用static修饰局部变量来改变它们的存储属性(生命周期)，但不能改变其作用域

### 数据存储，溢出，读取与对齐  

小端存储：低数据位在低地址  

内存中只有0和1，不区分符号位，是字符还是整型。只有等到使用printf解析时才会根据%来解析内存中的数据，根据不同的解析方式(%d，%u)会产生不同的结果  

对于无符号数，数据溢出会从0重新开始，对于有符号数溢出则会产生一个**ub**  

结构体进行数据对齐时会按照结构体内数据类型的最大成员的对齐模数进行对齐，如果最大成员的对齐模数超过编译器的对齐模数的话就按照编译器的对齐模数来确定**结构体整体的对齐模数**。例如，对于GCC来说，对齐模数是4，即使结构体内部有double类型的数据，结构体整体也会按照4字节进行对齐。当结构体内嵌其他结构体来说对齐方式会按照**内嵌结构体内部成员**的最大对齐模数来对齐整个结构体。也就是说，对于普通的多层结构体来说，大概率对齐模数是8或者编译器规定的最大对齐模数  

size_t的一个优点是其大小跟随平台不同而不同，可以用来表征针对某平台的最大长度，因此它可以用来存储该平台地址或者开辟一个复制数据的变量而不担心溢出  

对于指针来说既然指针大小不会改变那为什么还要指定指针的类型呢？
* 方便编译时编译器的类型检查
* 不同类型指针的运算规则不一样  

### 声明与引用

使用函数或者变量前必须声明，单文件编程时因为声明被定义和初始化代替了所以不需要考虑。但是当多文件编程时，如果没有声明而直接使用，编译器会自动在前面采用int类型进行声明，但这会造成隐式类型转换的问题  

extern用于声明其他文件的变量，这主要是为了编译阶段的类型，语法语义的检查。因此当需要extern一个结构体时，我们首先需要在extern前面定义这个结构体，否则编译器就没有类型检查的参考了(跨文件的将变量替换是在链接阶段干的事)  

前向引用：如果一个标识符在未声明完成之前，我们就对其引用，这被称为前向引用，一般的前向引用有如下特例：
* 隐式声明(C99/C11已被禁止)
* 语句标号(goto标号)
* 不完全类型

对于一般的链表如
```c
struct list_node{
    int val;
    struct list_node *p;
}
```
我们会产生这样的疑问：为什么可以在list_node结构体未定义完全时就在其内部声明了一个指针变量？这是因为除了常见的对象类型和函数类型外还有一个不完全类型。常见的不完全类型如下
* void
* 未知大小的数组，如int a[]
* 未知内容的结构体或联合体类型，如上文中的链表

当进行不完全类型的前向引用时(如链表)，我们一般只关注参数类型，而忽略其大小，值或者具体实现。这是因为作为不完全类型，虽然他们是不完全的，但是大小，值或者具体实现已经确定了，只是因为某些原因我们不能确定它的类型。例如void就是我们不能确定类型时所给出的暂时的空类型。对于链表这个例子来说，不完全类型的前向引用是个指针，这个指针的大小是完全可以确定的，我们使用的只是这个指针的类型，因此能通过编译。但当链表改为如下时就会编译报错，因为编译器并不知道这个不完全类型的大小
```c
struct list_node{
    int val;
    struct list_node node;//编译器没有办法知道list_node结构体的大小
}
```

在xyz.c包含其本身库文件xyz.h是为了检查定义与声明的一致性，防止编程时粗心产生错误

### 指针与数组  

两指针相减的结果以数据类型的长度为单位  

[]运算符是通过\*来实现的，例如a[n]==\*(a+n)  

数组名与指针的区别：
* 指针与数组名的类型不同，对于int a[5]来说，它的类型是int (\*) [5]
* 数组名在不同场合有不同含义，当进行数组初始化时或者使用数组名和sizeof、取址运算符&结合使用时，数组名表示的是数组类型，此时与指针有本质不同。在其他情况下，数组名都是一个右值，表示数组首元素的地址，但是可以与取指运算符\*构成一个左值表达式，这时数组名就与指针很相似了

### 编程习惯  

预防内存泄漏最好的方法就是：内存申请后及时地释放，两者要配对使用，内存释放后要及时将指针设置为NULL，使用内存指针前要进行非空判断  

在内核进行宏定义时，我们会经常看到`do{}while(0)`的结构，这本质上是防止宏定义展开后与外部语句发生耦合。因此我们在这里需要的只有那个大括号，但是如果只使用大括号会造成语法错误(因为我们使用宏的时候会选择加分号)，这样宏展开后会在大括号末尾处加分号，虽然新的编译器会自动忽略分号但在老的编译器上就很可能报错

### 好用的工具  

#### 内存工具  

内存泄漏检测：MTrace(linux系统自带)
```c
//mtrace.c
#include <stdlib.h>
#include <string.h>
#include <mcheck.h>
int main (void)
{
    mtrace();//开启跟踪
    char *p，*q;
    p=(char *)malloc(8);
    q=(char *)malloc(8);
    strcpy(p,“hello”);
    strcpy(q,“world”);
    free(p);
    muntrace();//关闭跟踪
    return 0;
}
```
之后就可以通过运行后生成的日志文件mtrace.log来定位内存泄漏在程序中的位置啦，注意编译时带上-g  

在实际工作中，如果你运气不好的话，有时候会遇到一种比段错误更头疼的错误:内存踩踏。内存踩踏如幽灵一般，比段错误更加隐蔽、更加难以定位，因为有时候内存踩踏并不会报错，然而你的程序却出现各种莫名其妙地运行错误。当你把代码看了一遍又一遍，找不出任何问题，甚至开始怀疑人生时，就要考虑内存踩踏了  

内存踩踏监测：mprotect(系统API)
```c
//mprotect.c
#include <stdio.h>
#include <sys/mman.h>
#include <malloc.h>
int main (void)
{
    int *p;
    p = memalign(4096, 512);
    *p=100;
    printf("*p=%d\n", *p);
    mprotect(p，512, PROT_READ);//在p指针变量的后512个字节内检测内存踩踏，这段内存正常情况是只读的
    *p= 200;
    printf("*p= %d\n", *p);
    free(p);
    return 0;
}
```

内存检测神器：Valgrind
除了使用系统提供的各种API函数，我们还可以使用内存工具检测不同类型的内存错误。以Valgrind为例，不仅可以检测内存泄漏，还可以对程序进行各种性能分析、代码覆盖测试、堆栈分析及CPU的Cache命中率、丢失率分析等
Valgrind包含一套工具集，其中一个内存检测工具Memcheck可以对我们的内存进行内存覆盖、内存泄漏、内存越界检测

```shell
gcc -g mem_leak.c -o a.out
valgrind --tool=memcheck ./a.out
```

## 体系结构  

### CMSIS  

cmsis是arm同各芯片厂商，工具链供应商推出的涵盖大多数cortex-m处理器以及微控制器产品的软件框架，它为应用以及中间件开发者统一了接口。例如System_Init函数在nxp，st的sdk中的实现方式可能不同，但函数签名是相同的，这样在迁移芯片时就可以大大减少软件适配的工作量  

cmsis包括cmsis-core，cmsis-dsp，cmsis-rtos，cmsis-driver，cmsis-svd，cmsis-dap等组件  
各组件提供了符合规范的api，该规范由arm，芯片供应商(如nxp，stm)，工具链供应商(如gnu，iar，mdk)共同遵守。为了能够提高代码重用性，加快开发周期，若没有cmsis，芯片供应商需要自行开发编译器等工具链，os厂商需自行开发部分驱动及工具库  
cmsis-svd与cmsis-dap就是这样的例子：若没有cmsis，每个芯片供应商都需与各工具链厂商协同开发调试适配器(dap)与监视器(svd)  

核心的cmsis-core组件包含以下内容：
* 内核外设访问层：包括名称定义，地址定义，nvic以及systisck的辅助函数
* 设备外设访问层：寄存器名称定义，地址定义，外设驱动代码
* 外设访问函数：外设访问的可选辅助函数

代码例子如下
```c
#include "vendor_device.h"

void main(){
    //内核访问nvic，该nvic函数符合cmsis接口规范并由arm负责维护，位于<system_xyzdevice.h>文件中
    NVIC_SetPriority(UART1_IRQn, 0x0);
}

void UART1_IRQHandler{    //外设中断的命名是相关的，定义在特定设备的启动文件内，由芯片厂商(以stm为例)提供，位于stm32f1xx_startup.s中
    //do something
}
```

### microcode  

[维基](https://zh.wikipedia.org/wiki/%E5%BE%AE%E7%A8%8B%E5%BA%8F)
微指令(microcode)，又称微码，是在CISC结构下，执行一些功能复杂的指令时，所分解一系列相对简单的指令。相关的概念最早在1947年开始出现

### 流水线冒险  

现在主流CPU有5级流水线：取指/预取，译码，执行，访问内存，写回。但是对于性能强劲的处理器，如Intel i7-3960X，它拥有16级流水线。深度超过5级流水线的被称为超深流水线  

一旦预取指令失败，CPU就会丢失当前执行指令到预取指令间的所有指令，此时流水线就会发生停顿，我们称这种现象为流水线冒险  

流水线冒险一般由于数据冒险(两个不同操作在相邻指令中用到了同一个寄存器)，控制冒险(跳转指令导致取指失败)组成，我们可以采用插入空指令的方式来避免数据冒险(这在超深流水线中很有用)，而对于控制冒险我们可以通过增加分支预测硬件，优化代码和编译优化的方式来避免

### 分支预测

分支预测主要分为动态预测和静态预测，静态预测是通过优化代码和编译优化，如内核中的 likely 和 unlikely 宏就采用了静态预测的方法。动态预测指的是程序运行时的预测优化，这一般由预测算法来实现，常见的动态预测方式有1-bit动态预测、n-bit动态预测、下一行预测、双模态预测、局部分支预测、全局分支预测、融合分支预测、循环预测等  

随着APP的大量涌现，分支预测的硬件结构也越来越复杂，在现代CPU版图上面积占比最大的是Cache，其次就是分支预测结构了

### 乱序执行  

除了前面提到的插入空指令来避免流水线冒险，我们更好的处理方式是将这些空指令替换为与流水线冒险无关的其他指令，这就是CPU的乱序执行  

乱序执行由CPU硬件来保证

### 多发射  

在执行阶段时CPU有不同的执行单元，例如乘法器，加法器，FPU等，为了能够充分利用这些资源，CPU采用了多发射并行执行指令的方法，每一时刻，CPU都在同时运行不同的执行单元，而每个执行单元也都有不同的取指器，译码器，因此这些准备工作也是并行执行的

![2024-03-25_16-41](assets/15434216240366.webp)

### 总线  

![2024-03-25_19-52](assets/90255319258792.webp)

![2024-03-25_19-53](assets/367155319266825.webp)

计算机一般采用两种编址方式：统一编址和独立编址。对于arm架构来说采用的是统一编址模式，这意味着CPU访问外设的内部寄存器就像访问RAM一样。而x86采用了独立编址模式，这意味着内存RAM和外部设备的寄存器独立编址，分别占用不同的地址空间，所以CPU访问外设内部寄存器需要单独的指令

### arm工作模式与寄存器  

![2024-03-25_21-23](assets/491142321259494.webp)

对于arm而言，R0~R12属于通用寄存器，其他的属于特殊寄存器  
R11(FR，Frame Register)：栈底指针寄存器，用来管理堆栈
R13(SP，Stack Pointer)：堆栈指针寄存器，保存了当前运行程序的栈顶  
R14(LR，Link Register)：链接寄存器，保存了上一级函数的下一条指令，当子函数return时会将当前LR的值加载进PC  
R15(PC，Program Counter)：程序计数器，保存了当前取指的地址。对于3级流水线，32位处理器来说，PC比当前执行指令的地址快8字节  
CPSR(Current Processor State Register)：当前状态寄存器  
SPSR(Saved Processor State Register)：当前状态保存寄存器，当CPU从异常状态返回时会从SPSR寄存器中恢复原先的处理器状态，即将SPSR加载进CPSR从而切换到原来的工作模式继续运行  

![2024-03-25_21-31](assets/391243121256049.webp)

在ARM所有的工作模式中，有一种工作模式比较特殊，即FIQ模式。为了快速响应中断，减少中断现场保护带来的时间开销，在FIQ工作模式下，ARM处理器有自己独享的R8~R12寄存器

### 超线程技术  

超线程本质上是欺骗OS，让OS认为CPU有多个Core。一般处理器上的两个线程上下文切换需要20 000个时钟周期，而超线程处理器上的两个线程切换只需要1个时钟周期就可以了，使用此技术可以通过增加5%左右的芯片面积换来CPU 15%~30%的性能提升  

在高并发的服务器场合下，使用超线程技术确实可以提升性能，但在一些对单核性能要求比较高的场合，如大型游戏，开启超线程反而会增加系统开销，影响性能

### 启动方式  

在一个嵌入式系统中，很多人可能认为U-boot是系统上电运行的第一行代码，然而事实并非如此，CPU上电后会首先运行固化在CPU芯片内部的一小段代码，这片代码通常被称为ROMCODE，这部分代码的主要功能就是初始化存储器接口，建立存储映射。它首先会根据CPU管脚或eFuse值来判断系统的启动方式：从NOR Flash、NAND Flash启动还是从SD卡启动
![2024-04-09_15-05](assets/545560515269767.webp)

如果我们将U-boot代码“烧写”在NOR Flash上，设置系统从NORFlash启动，这段ROMCODE代码就会将NOR Flash映射到零地址，然后系统复位，CPU默认从零地址取代码执行，即从NOR Flash上开始执行U-boot指令  
如果系统从NAND Flash或SD卡启动，通过上面的学习我们已经知道，除了SRAM和NOR Flash支持随机读写，可以直接运行代码，其他Flash设备是不支持代码直接运行的，因此我们只能将这些代码从NAND Flash或SD卡复制到内存执行。因为此时DDR SDRAM内存还没有被初始化，所以我们一般会先将NAND Flash或SD卡中的一部分代码(通常为前4KB)复制到芯片内部集成的SRAM中去执行，然后在这4KB代码中完成各种初始化、代码复制、重定位等工作，最后PC指针才会跳到DDRSDRAM内存中去运行

## 术语  

ISP：In System Programing(还有一种ISP指的是通信供应商) ，使用芯片厂商提供的bootloader以及专用接口(JTAG)进行程序烧录  

IAP：In applicating Programing(重要技术，常与OTA搭配) ，应用软件自身通过预留的接口(串口或网口等)进行falsh程序烧写。在IAP程序中一般有两个程序，第一个代码只执行更新操作，第二段代码才是固件包，第二段代码需要通过第一段代码来烧录进flash，因此当破坏IAP，也就是第一段代码时需要返厂进行IAP程序的烧录，否则第二段程序无法正常执行  

OTA：Over-the-Air Technology，通过无线网络进行固件包的下载，下载后的固件包交由IAP进行升级  
OTG：通过U盘进行固件包的下载  

FPU：浮点运算单元  

.a (archive)文件，linux下的静态库，ar最初实际上是个压缩工具，他把.o文件压缩使得方便文件跨设备传输和管理  
.so (shared object)文件，linux下的共享库  

API (application programming interface，应用程序接口)，API定义了源代码和库之间的接口，因此源代码可以在支持这个API的任何系统中**编译**  
ABI (application binary interface，应用二进制接口)，我们把符号修饰标准，变量内存布局，函数调用方式，等这些跟可执行代码二进制兼容性相关的内容称为ABI，支持ABI的系统和平台允许将在这个ABI系统上编译出来代码**运行**在另一台支持同样ABI标准的设备上，实现真正的跨平台运行  

ub (undefined behavior，未定义行为)  

ISA (Instruction Set Architecture)：指令集架构  

CRT (C Running Time，C运行库)  

基类：父类的别称  

虚函数、纯虚函数、抽象类与接口：虚函数是指使用virtual关键字修饰的函数。纯虚函数是指基类中不实现而子类中实现的虚函数。含有纯虚函数的类称为抽象类，在抽象类中允许定义数据成员。而对于接口来说，类中只有方法的实现而不包括数据成员，使用接口可以有效避免菱形继承的问题，即当产生多重继承也就是菱形继承的问题时，我们可以将其改为单继承，另一个继承关系采用接口实现，接口同时也促进了“组合”思想的发展  

初始化与定义：初始化是指开辟内存的过程，定义是指赋值的过程  

saas(Software as a Service，软件即服务)，常用于云计算云存储等行业，服务提供商将软件统一打包售卖，负责产品的运维升级等工作，类似于实体行业的交钥匙项目  

haas(Hardware as a Service，硬件即服务)，常用于嵌入式等领域，服务提供商利用互联网将硬件资源打包售卖，负责硬件的维护工作，这样需求方无需一次性购买全部设备，采用这种按需购买的方式有助于提高设备利用率从而降低成本  

框架：在应用开发的过程中我们会经常遇到重复性工作，比如在开发音视频播放软件，即时通讯软件，输入法软件或者游戏时我们会有对输入事件响应的需求。这种需求如果让应用程序开发者来处理就太低效了，为了进一步提高代码复用率我们就有了框架。例如专职负责输入事件响应的事件处理框架，专职负责显示的QT框架，专职负责音视频解编码的FFmpeg框架等  

模块化编程：随着物联网的兴起和边缘计算的发展，嵌入式系统越来越复杂，也越来越碎片化，为了方便用户自行取舍某些功能，我们引入了模块化编程。比如对于流媒体产品来说，我们只需要Wifi，音视频，事件处理框架即可，而对于低功耗，Lora，USB模块则可以裁剪掉  

开闭原则：对扩展行为开放源代码，对修改行为关闭源代码

