I made a kernel 2.2x faster. It made my training loop 3x slower▲ 24 · kyrieblunders.bearblog.dev · 4일 전 · 3 댓글원문 보기 → HN에서 보기 →원문 요약원문을 요약하고 있습니다…