bpf,ebpf及其逆向

bpf

BPF 的全称是 Berkeley Packet Filter，是一个用于过滤(filter)网络报文(packet)的架构。（例如tcpdump)，目前称为Cbpf（Classical bpf）。BPF 在数据包过滤上引入了两大革新：

一个新的虚拟机 (VM) 设计，可以有效地工作在基于寄存器结构的 CPU 之上；
应用程序使用缓存只复制与过滤数据包相关的数据，不会复制数据包的所有信息。这样可以最大程度地减少BPF 处理的数据；

由于这些巨大的改进，所有的 Unix 系统都选择采用 BPF 作为网络数据包过滤技术，直到今天，许多 Unix 内核的派生系统中（包括 Linux 内核）仍使用该实现。

ebpf

eBPF演进为一个通用执行引擎，可基于此开发性能分析工具、软件定义网络等诸多场景，原来的 BPF 就被称为经典 BPF，缩写cBPF（classic BPF），cBPF现在已经基本废弃。现在，Linux 内核只运行eBPF。

eBPF全称extended BPF，Linux Kernel 3.15 中引入的全新设计, 是对既有BPF架构进行了全面扩展，一方面，支持了更多领域的应用，比如：内核追踪(Kernel Tracing)、应用性能调优/监控、流控(Traffic Control)等；另一方面，在接口的设计以及易用性上，也有了较大的改进。

eBPF支持在用户态将C语言编写的一小段“内核代码”注入到内核中运行，注入时要先用llvm编译得到使用BPF指令集的 ELF 文件，然后从ELF文件中解析出可以注入内核的部分，最后用 bpf_load_program() 方法完成注入。用户态程序和注入到内核中的程序通过共用一个位于内核的 eBPF MAP实现通信。为了防止注入的代码导致内核崩溃，eBPF 会对注入的代码进行严格检查，拒绝不合格的代码的注入。

eBPF prog load的严格的verify机制
eBPF访问内核资源需借助各种eBPF 的helper func，helper func函数能在最坏的情况下保证安全
现在，Linux 内核只运行 eBPF，内核会将加载的BPF字节码透明地转换成 eBPF 再执行

Untitled

eBPF程序执行过程

编译：将eBPF程序转成BPF bytecode
加载：特权进程通过pbf系统调用将BPF bytecode提交给内核（pbf系统在eBPF诞生后，成为了内核的一个顶级子系统）
验证：在执行前进行安全性校验，如无限循环、不能导致内核崩溃、可完成等，保证eBPF程序操作的安全性
内核态执行：通过kprobo、uprobe、perf_event等方式调用

用户态程序与内核态程序交互