您的位置: 首页/ 各期目录/ 文章详情

基于 4 bit 量化的视频大模型算力芯片关键技术研究


针对视频大模型算力芯片资源受限的问题,提出了一种 4 bit 量化的全链路解决方案。该方案通过动态感知激活权重量化技术减少关键权重的量化误差 , 利用自适应分块正交变换量化技术处理帧间激活值的离群值干扰 , 并引入自适应损失平衡多教师蒸馏技术以弥补低比特模型的能力缺口。实验表明,3 种技术的结合有效发挥了算力芯片的可重构并行数据流架构的优势,在视频超分辨率和视频帧插值任务中,该方案能在 4 bit 的精度下接近全精度,同时显著降低内存带宽需求。

网站会员需要登录才能在线预览,点我登录。

如何成为网站会员>>