详细介绍
TheAuditor 是一个数据库优先(database-first)的代码情报与静态安全分析平台,旨在为大型多语言代码库提供可验证的事实查询与精确的数据流追踪。它将代码索引到结构化的 SQLite 数据库,替代频繁的文件扫描,从而支持子秒级查询、跨文件污点追踪与架构热点检测。TheAuditor 侧重准确性与可验证性,为开发者与智能体提供可供核验的“事实”,减少模型在代码分析中的幻觉。
主要特性
- 数据库优先索引:增量索引整个代码库,查询直接基于索引而非文件 I/O,查询更快且一致。
- 完整数据流(taint)分析:支持跨文件、跨模块的源到汇(source-to-sink)追踪,识别 SQL 注入、命令注入等高危路径。
- 四向量汇聚(FCE):通过静态、结构、过程与流量四个维度汇聚证据,提高检测置信度。
- 架构与影响分析:自动发现调用图、耦合热点,并在变更前计算潜在影响范围(blast radius)。
使用场景
TheAuditor 适用于有严格安全合规或架构可观测需求的工程团队,尤其是大型多语言仓库(Python、TypeScript、Go、Rust 等)。常见场景包括安全审计、迁移前影响评估、AI 智能体任务的事实核验(为 LLM 提供确定性查询)、以及持续集成流水线中的深度静态分析。
技术特点
- 多语言语义分析:对 Python 与 TypeScript 使用语言原生编译器进行深度语义解析,其他语言采用高保真解析器(tree-sitter)补充。
- 数据库驱动查询:使用 SQLite 存储符号、调用关系与分析结果,支持复杂递归 CTE 查询以快速定位证据。
- 可组合 CLI 工具链:丰富的命令(如
aud full,aud taint,aud blueprint,aud fce)便于在 CI/本地与智能体工作流中调用。 - 本地优先、安全隐私:分析默认在本地执行,网络功能可选,支持离线模式以满足敏感代码库的隔离要求。