EN
北京邮电大学 · 网络空间安全学院

STAIR
Lab

Security  ·  Trust  ·  Artificial Intelligence  ·  Resilience

专注于安全、可信、人工智能与韧性四大方向的前沿研究。

平台与项目

工程化系统将安全研究落地为可复用的评测、治理与防护能力,覆盖红队测评、舆情与网暴治理、社会行为仿真以及生产级护栏框架。

PASA 系统首页:LLMs Safety Assessment 与可信大模型安全测试入口
红队测评

PASA · 可信大模型安全测试

可信大模型安全测试 · Vue + Django 工程化测评工作台

  • 测试管理、测试分析与配置管理一体化侧栏导航
  • 测评增强与合规模型扩展,支撑可插拔安全策略
  • 首页一键「创建测试套件」,衔接自动化测评流水线
Vue Django MySQL Redis Celery
网暴治理一体化平台数据概览大屏:监控总量与事件趋势
治理

网暴治理一体化平台

数据概览 · 发现 · 报告 · 指令与任务

深色可视化大屏聚合多平台帖子、评论与事件指标,按严重程度分级展示,并配合趋势曲线支撑研判与处置闭环。

数据大屏 事件分级 趋势分析
社交事件模拟系统:左侧模拟参数配置与右侧事件、任务列表
仿真

社交事件模拟系统

参数配置 · 事件列表 · 模拟任务监控

深色控制台集中配置用户规模、传播/反馈策略与消息投递,联动事件时间轴与任务运行态(等待、运行、结束),便于复现实验与对照组研究。

任务编排 运行态 可复现
X-Guardrail:护栏配置与对话试用界面
护栏

X-Guardrail 协同防御工作台

输入 / 内生 / 输出护栏 · 实时对话验证

左侧完成大模型 API 与多层护栏勾选,中部展示当前启用的检测组件,右侧历史对话可观察输入拦截与输出审核过程,便于调参与上线前演练。

PplDetector SafeDecoding 对话审计
最新论文
完整列表 →
ICML'26
Towards the Explainability of Temporal Graph Networks via Memory Backtracking and Topological Attribution
Yazheng Liu, Xi Zhang, Sihong Xie, Hui Xiong
International Conference on Machine Learning · 2026
ICML'26
X-EviProbe: Post-hoc Parameter-free Evidential Uncertainty Quantification for Frozen Graph Neural Networks
Chenghua Guo, Sihong Xie, Xi Zhang
International Conference on Machine Learning · 2026
ACL'26
Beyond Surface-Level Detection: Towards Cognitive-Driven Defense Against Jailbreak Attacks via Meta-Operations Reasoning
Rui Pu, Chaozhuo Li, Rui Ha, Litian Zhang, Lirong Qiu, Xi Zhang
Annual Meeting of the Association for Computational Linguistics · 2026
CVPR'26
Diffusion with a Linguistic Compass: Steering the Generation of Clinically Plausible Future sMRI Representations for Early MCI Conversion Prediction
Zhihao Tang, Chaozhuo Li, Litian Zhang, Xi Zhang
IEEE/CVF Conference on Computer Vision and Pattern Recognition · 2026
TCSS'26
Loki's Dance of Illusions: A Comprehensive Survey of Hallucination in Large Language Models
Ming Lu, Chaozhuo Li, Pengbo Wang, Chenxu Wang, Litian Zhang, Zheng Liu, Qiwei Ye, Yi Hua, Yushan Cai, Yuanbo Xu, Hao Zhao, Feiran Huang, Xi Zhang, Philip S. Yu
IEEE Transactions on Computational Social Systems · 2026