释放双眼,带上耳机,听听看~!
Security Papers
简介:在这项工作中,研究者提出了一种新的LLM服务范式,该范式将隐私敏感计算分布在边缘设备上,并在云中共享计算。只有激活在中心云和边缘设备之间传输,以确保数据的局部性。该研究的核心创新是PrivateLoRA,通过利用低等级的剩余激活来解决具有挑战性的通信开销,实现95%以上的通信减少。
简介:在这项工作中,研究者提出了一种新的LLM服务范式,该范式将隐私敏感计算分布在边缘设备上,并在云中共享计算。只有激活在中心云和边缘设备之间传输,以确保数据的局部性。该研究的核心创新是PrivateLoRA,通过利用低等级的剩余激活来解决具有挑战性的通信开销,实现95%以上的通信减少。