← 목록으로

KVarN: Huawei의 KV-cache 양자화를 위한 vLLM 네이티브 백엔드

KVarN: Native vLLM backend for KV-cache quantization by Huawei
▲ 143 · github.com · 1일 전 · 15 댓글
원문 보기 → HN에서 보기 →

원문 요약

원문을 요약하고 있습니다…

댓글을 번역하고 있습니다…