1-应用程序与基本执行环境

课后练习

编程题

- 实现一个 linux 应用程序 A，显示当前目录下的文件名。（用 C 或 Rust 编程）

use std::fs;
use std::io::{self, Write};
 
fn main() {
    // 获取当前目录
    if let Ok(entries) = fs::read_dir(".") {
        let mut file_list = String::new();
        for entry in entries {
            if let Ok(entry) = entry {
                // 获取文件名
                let file_name = entry.file_name();
                // 将文件名转换成字符串
                if let Some(name) = file_name.to_str() {
                    println!("{}", name);
                    // 添加文件名到文件列表字符串
                    file_list.push_str(name);
                    file_list.push_str("\n");
                }
            }
        }
 
        // 将文件列表写入文件
        if let Err(err) = write_file_list(&file_list) {
            eprintln!("Error writing file list: {}", err);
        }
    }
}
 
fn write_file_list(file_list: &str) -> io::Result<()> {
    let mut file = fs::File::create("file_list.txt")?;
    file.write_all(file_list.as_bytes())?;
    Ok(())
}

*** 实现一个 linux 应用程序 B，能打印出调用栈链信息。（用 C 或 Rust 编程）以使用 GCC 编译的 C 语言程序为例，使用编译参数 -fno-omit-frame-pointer 的情况下，会保存栈帧指针 fp 。

fp 指向的栈位置的负偏移量处保存了两个值：

-8(fp) 是保存的 ra
-16(fp) 是保存的上一个 fp

因此我们可以像链表一样，从当前的 fp 寄存器的值开始，每次找到上一个 fp ，逐帧恢复我们的调用栈：

#include <inttypes.h>
#include <stdint.h>
#include <stdio.h>

// Compile with -fno-omit-frame-pointer
void print_stack_trace_fp_chain() {
    printf("=== Stack trace from fp chain ===\n");

    uintptr_t *fp;
    asm("mv %0, fp" : "=r"(fp) : : );

    // When should this stop?
    while (fp) {
        printf("Return address: 0x%016" PRIxPTR "\n", fp[-1]);
        printf("Old stack pointer: 0x%016" PRIxPTR "\n", fp[-2]);
        printf("\n");

        fp = (uintptr_t *) fp[-2];
    }
    printf("=== End ===\n\n");
}

但是这里会遇到一个问题，因为我们的标准库并没有保存栈帧指针，所以找到调用栈到标准的库时候会打破我们对栈帧格式的假设，出现异常。

我们也可以不做关于栈帧保存方式的假设，而是明确让编译器告诉我们每个指令处的调用栈如何恢复。在编译的时候加入 -funwind-tables 会开启这个功能，将调用栈恢复的信息存入可执行文件中。

有一个叫做 libunwind 的库可以帮我们读取这些信息生成调用栈信息，而且它可以正确发现某些栈帧不知道怎么恢复，避免异常退出。

正确安装 libunwind 之后，我们也可以用这样的方式生成调用栈信息：

#include <inttypes.h>
#include <stdint.h>
#include <stdio.h>

#define UNW_LOCAL_ONLY
#include <libunwind.h>

// Compile with -funwind-tables -lunwind
void print_stack_trace_libunwind() {
    printf("=== Stack trace from libunwind ===\n");

    unw_cursor_t cursor; unw_context_t uc;
    unw_word_t pc, sp;

    unw_getcontext(&uc);
    unw_init_local(&cursor, &uc);

    while (unw_step(&cursor) > 0) {
        unw_get_reg(&cursor, UNW_REG_IP, &pc);
        unw_get_reg(&cursor, UNW_REG_SP, &sp);

        printf("Program counter: 0x%016" PRIxPTR "\n", (uintptr_t) pc);
        printf("Stack pointer: 0x%016" PRIxPTR "\n", (uintptr_t) sp);
        printf("\n");
    }
    printf("=== End ===\n\n");
}

** 实现一个基于 rcore/ucore tutorial 的应用程序 C，用 sleep 系统调用睡眠 5 秒（in rcore/ucore tutorial v3: Branch ch1）

注：尝试用 GDB 等调试工具和输出字符串的等方式来调试上述程序，能设置断点，单步执行和显示变量，理解汇编代码和源程序之间的对应关系。

问答题

- 应用程序在执行过程中，会占用哪些计算机资源？
- 请用相关工具软件分析并给出应用程序 A 的代码段 / 数据段 / 堆 / 栈的地址空间范围。简便起见，我们静态编译该程序生成可执行文件。使用 readelf 工具查看地址空间：

数据段（.data）和代码段（.text）的起止地址可以从输出信息中看出。
应用程序的堆栈是由内核为其动态分配的，需要在运行时查看。将 A 程序置于后台执行，通过查看 /proc/[pid]/maps 得到堆栈空间的分布：

- 请简要说明应用程序与操作系统的异同之处。
** 请基于 QEMU 模拟 RISC—V 的执行过程和 QEMU 源代码，说明 RISC-V 硬件加电后的几条指令在哪里？完成了哪些功能？在 QEMU 源码 ¹ 中可以找到“上电”的时候刚执行的几条指令，如下：

uint32_t reset_vec[10] = {
    0x00000297,                   /* 1:  auipc  t0, %pcrel_hi(fw_dyn) */
    0x02828613,                   /*     addi   a2, t0, %pcrel_lo(1b) */
    0xf1402573,                   /*     csrr   a0, mhartid  */
#if defined(TARGET_RISCV32)
    0x0202a583,                   /*     lw     a1, 32(t0) */
    0x0182a283,                   /*     lw     t0, 24(t0) */
#elif defined(TARGET_RISCV64)
    0x0202b583,                   /*     ld     a1, 32(t0) */
    0x0182b283,                   /*     ld     t0, 24(t0) */
#endif
    0x00028067,                   /*     jr     t0 */
    start_addr,                   /* start: .dword */
    start_addr_hi32,
    fdt_load_addr,                /* fdt_laddr: .dword */
    0x00000000,
                                  /* fw_dyn: */
};

完成的工作是：

读取当前的 Hart ID CSR mhartid 写入寄存器 a0
（我们还没有用到：将 FDT (Flatten device tree) 在物理内存中的地址写入 a1）
跳转到 start_addr ，在我们实验中是 RustSBI 的地址

- RISC-V 中的 SBI 的含义和功能是啥？ GitHub - riscv-non-isa/riscv-sbi-doc: Documentation for the RISC-V Supervisor Binary Interface

SBI (Supervisor Binary Interface) is an interface between the Supervisor Execution Environment (SEE) and the supervisor. It allows the supervisor to execute some privileged operations by using the ecall instruction. Examples of SEE and supervisor are: M-Mode and S-Mode on Unix-class platforms, where SBI is the only interface between them, as well as the Hypervisor extended-Supervisor (HS) and Virtualized Supervisor (VS).

Discussion of SBI occurs on the RISC-V Platform Runtime Services list. It is publicly readable but posting requires being a member of the RISC-V Foundation. Any new SBI extension needs to be discussed and approved there before being merged.

A list of implementations introduces SBI to M-Mode and HS-Mode software. See section “SBI Implementation IDs”

** 为了让应用程序能在计算机上执行，操作系统与编译器之间需要达成哪些协议？

编译器依赖操作系统提供的程序库，
操作系统执行应用程序需要编译器提供段位置、符号表、依赖库等信息。
ELF 就是比较常见的一种文件格式。

** 请简要说明从 QEMU 模拟的 RISC-V 计算机加电开始运行到执行应用程序的第一条指令这个阶段的执行过程。

接第 5 题，跳转到 RustSBI 后，SBI 会对部分硬件例如串口等进行初始化，然后通过 mret 跳转到 payload 也就是 kernel 所在的起始地址。kernel 进行一系列的初始化后（内存管理，虚存管理，线程（进程）初始化等），通过 sret 跳转到应用程序的第一条指令开始执行。

** 为何应用程序员编写应用时不需要建立栈空间和指定地址空间？

应用程度对内存的访问需要通过 MMU 的地址翻译完成，应用程序运行时看到的地址和实际位于内存中的地址是不同的，栈空间和地址空间需要内核进行管理和分配。应用程序的栈指针在 trap return 过程中初始化。此外，应用程序可能需要动态加载某些库的内容，也需要内核完成映射。

*** 现代的很多编译器生成的代码，默认情况下不再严格保存 / 恢复栈帧指针。在这个情况下，我们只要编译器提供足够的信息，也可以完成对调用栈的恢复。

我们可以手动阅读汇编代码和栈上的数据，体验一下这个过程。例如，对如下两个互相递归调用的函数：

void flip(unsigned n) {
	if ((n & 1) == 0) {
		flip(n >> 1);
	} else if ((n & 1) == 1) {
		flap(n >> 1);
	}
}

void flap(unsigned n) {
	if ((n & 1) == 0) {
		flip(n >> 1);
	} else if ((n & 1) == 1) {
		flap(n >> 1);
	}
}

在某种编译环境下，编译器产生的代码不包括保存和恢复栈帧指针 fp 的代码。以下是 GDB 输出的本次运行的时候，这两个函数所在的地址和对应地址指令的反汇编，为了方便阅读节选了重要的控制流和栈操作（省略部分不含栈操作）：

(gdb) disassemble flap
Dump of assembler code for function flap:
   0x0000000000010730 <+0>:     addi    sp,sp,-16    // 唯一入口
   0x0000000000010732 <+2>:     sd      ra,8(sp)
   ...
   0x0000000000010742 <+18>:    ld      ra,8(sp)
   0x0000000000010744 <+20>:    addi    sp,sp,16
   0x0000000000010746 <+22>:    ret                  // 唯一出口
   ...
   0x0000000000010750 <+32>:    j       0x10742 <flap+18>

(gdb) disassemble flip
Dump of assembler code for function flip:
   0x0000000000010752 <+0>:     addi    sp,sp,-16    // 唯一入口
   0x0000000000010754 <+2>:     sd      ra,8(sp)
   ...
   0x0000000000010764 <+18>:    ld      ra,8(sp)
   0x0000000000010766 <+20>:    addi    sp,sp,16
   0x0000000000010768 <+22>:    ret                  // 唯一出口
   ...
   0x0000000000010772 <+32>:    j       0x10764 <flip+18>
End of assembler dump.

启动这个程序，在运行的时候的某个状态将其打断。此时的 pc, sp, ra 寄存器的值如下所示。此外，下面还给出了栈顶的部分内容。（为阅读方便，栈上的一些未初始化的垃圾数据用 ??? 代替。）

(gdb) p $pc
$1 = (void (*)()) 0x10752 <flip>

(gdb) p $sp
$2 = (void *) 0x40007f1310

(gdb) p $ra
$3 = (void (*)()) 0x10742 <flap+18>

(gdb) x/6a $sp
0x40007f1310:   ???     0x10750 <flap+32>
0x40007f1320:   ???     0x10772 <flip+32>
0x40007f1330:   ???     0x10764 <flip+18>

根据给出这些信息，调试器可以如何复原出最顶层的几个调用栈信息？假设调试器可以理解编译器生成的汇编代码。

解答：

首先，我们当前的 pc 在 flip 函数的开头，这是我们正在运行的函数。返回给调用者处的地址在 ra 寄存器里，是 0x10742 。因为我们还没有开始操作栈指针，所以调用处的 sp 与我们相同，都是 0x40007f1310 。
0x10742 在 flap 函数内。根据 flap 函数的开头可知，这个函数的栈帧大小是 16 个字节，所以调用者处的栈指针应该是 sp + 16 = 0x40007f1320。调用 flap 的调用者返回地址保存在栈上 8(sp) ，可以读出来是 0x10750 ，还在 flap 函数内。
依次类推，只要能理解已知地址对应的函数代码，就可以完成恢复操作。

实验练习

实验练习包括实践作业和问答作业两部分。

实践作业

彩色化 LOG

lab1 的工作使得我们从硬件世界跳入了软件世界，当看到自己的小 os 可以在裸机硬件上输出 hello world 是不是很高兴呢？但是为了后续的一步开发，更好的调试环境也是必不可少的，第一章的练习要求大家实现更加炫酷的彩色 log。

详细的原理不多说，感兴趣的同学可以参考 ANSI 转义序列，现在执行如下这条命令试试

$ echo -e "\x1b[31mhello world\x1b[0m"

如果你明白了我们是如何利用串口实现输出，那么要实现彩色输出就十分容易了，只需要用需要输出的字符串替换上一条命令中的 hello world，用期望颜色替换 31(代表红色) 即可。

以下内容仅为推荐实现，不是练习要求，有时间和兴趣的同学可以尝试。

我们推荐实现如下几个等级的输出，输出优先级依次降低：

log 等级推荐
名称	颜色	用途
ERROR	红色 (31)	表示发生严重错误，很可能或者已经导致程序崩溃
WARN	黄色 (93)	表示发生不常见情况，但是并不一定导致系统错误
INFO	蓝色 (34)	比较中庸的选项，输出比较重要的信息，比较常用
DEBUG	绿色 (32)	输出信息较多，在 debug 时使用
TRACE	灰色 (90)	最详细的输出，跟踪了每一步关键路径的执行

我们可以输出比设定输出等级以及更高输出等级的信息，如设置 LOG = INFO，则输出 ERROR、WARN、INFO 等级的信息。简单 demo 如下，输出等级为 INFO:

为了方便使用彩色输出，我们要求同学们实现彩色输出的宏或者函数，用以代替 print 完成输出内核信息的功能，它们有着和 prinf 十分相似的使用格式，要求支持可变参数解析，形如：

// 这段代码输出了 os 内存空间布局，这到这些信息对于编写 os 十分重要

info!(".text [{:#x}, {:#x})", s_text as usize, e_text as usize);
debug!(".rodata [{:#x}, {:#x})", s_rodata as usize, e_rodata as usize);
error!(".data [{:#x}, {:#x})", s_data as usize, e_data as usize);

info("load range : [%d, %d] start = %d\n", s, e, start);

在以后，我们还可以在 log 信息中增加线程、CPU 等信息（只是一个推荐，不做要求），这些信息将极大的方便你的代码调试。

实验要求

实现分支：ch1
完成实验指导书中的内容并在裸机上实现 hello world 输出。
实现彩色输出宏 (只要求可以彩色输出，不要求 log 等级控制，不要求多种颜色)
隐形要求可以关闭内核所有输出。从 lab2 开始要求关闭内核所有输出（如果实现了 log 等级控制，那么这一点自然就实现了）。
利用彩色输出宏输出 os 内存空间布局输出 .text、.data、.rodata、.bss 各段位置，输出等级为 INFO。

challenge: 支持多核，实现多个核的 boot。

实验检查

├── os(内核实现)
│   ├── Cargo.toml(配置文件)
│   ├── Makefile (要求 make run LOG=xxx 可以正确执行，可以不实现对 LOG 这一属性的支持，设置默认输出等级为 INFO)
│   └── src(所有内核的源代码放在 os/src 目录下)
│       ├── main.rs(内核主函数)
│       └── ...
├── reports
│   ├── lab1.md/pdf
│   └── ...
├── README.md（其他必要的说明）
├── ...

报告命名 labx. md/pdf，统一放在 reports 目录下。每个实验新增一个报告，为了方便修改，检查报告是以最新分支的所有报告为准。

检查

$ cd os
$ git checkout ch1
$ make run LOG=INFO

可以正确执行 (可以不支持 LOG 参数，只有要彩色输出就好)，可以看到正确的内存布局输出，根据实现不同数值可能有差异，但应该位于 linker.ld 中指示 BASE_ADDRESS 后一段内存，输出之后关机。

tips

对于 Rust, 可以使用 crate log ，推荐参考 rCore
对于 C，可以实现不同的函数（注意不推荐多层可变参数解析，有时会出现不稳定情况），也可以参考 linux printk 使用宏实现代码重用。
两种语言都可以使用 extern 关键字获得在其他文件中定义的符号。

问答作业

请学习 gdb 调试工具的使用 (这对后续调试很重要)，并通过 gdb 简单跟踪从机器加电到跳转到 0x80200000 的简单过程。只需要描述重要的跳转即可，只需要描述在 qemu 上的情况。
tips:

事实上进入 rustsbi 之后就不需要使用 gdb 调试了。可以直接阅读代码。rustsbi 起始代码。

可以使用示例代码 Makefile 中的 make debug 指令。

一些可能用到的 gdb 指令：

x/10i 0x80000000 : 显示 0x80000000 处的 10 条汇编指令。

x/10i $pc : 显示即将执行的 10 条汇编指令。

x/10xw 0x80000000 : 显示 0x80000000 处的 10 条数据，格式为 16 进制 32bit。

info register: 显示当前所有寄存器信息。

info r t0: 显示 t0 寄存器的值。

break funcname: 在目标函数第一条指令处设置断点。

break *0x80200000: 在 0x80200000 处设置断点。

continue: 执行直到碰到断点。

si: 单步执行一条汇编指令。

实验练习的提交报告要求

简单总结本次实验你编程的内容。（控制在 5 行以内，不要贴代码）
由于彩色输出不好自动测试，请附正确运行后的截图。
完成问答问题。
(optional) 你对本次实验设计及难度 / 工作量的看法，以及有哪些需要改进的地方，欢迎畅所欲言。

boot.c ↩

🌰Senjl's Digital Garden🐉

Recent writing

Welcome to Senj's Digital Garden

2-批处理操作系统

3-多道程序与分时多任务

探索

1-应用程序与基本执行环境

课后练习

编程题

问答题

实验练习

实践作业

彩色化 LOG

实验要求

实验检查

tips

问答作业

实验练习的提交报告要求

关系图谱

目录

🌰Senjl's Digital Garden🐉

Recent writing

Welcome to Senj's Digital Garden

2-批处理操作系统

3-多道程序与分时多任务

探索

1-应用程序与基本执行环境

课后练习

编程题

问答题

实验练习

实践作业

彩色化 LOG

实验要求

实验检查

tips

问答作业

实验练习的提交报告要求

Footnotes

关系图谱

目录