Chen Zhang

H2-LLM: Hardware-Dataflow Co-Exploration for Heterogeneous Hybrid-Bonding-based Low-Batch LLM Inference

Cong Li

• Jun 21, 2025 • 1 min read

Dstc: Dual-side sparsity tensor core for dnns acceleration on modern gpu architectures

Chen Zhang

• Jan 1, 2024 • 1 min read

Rm-stc: Row-merge dataflow inspired gpu sparse tensor core for energy-efficient sparse acceleration

Guyue Huang

• Jan 1, 2023 • 1 min read