福生无量摸鱼天尊

浮生无量摸鱼天尊

paper

3 篇文章

2025-08-14

paper

摸鱼天尊

2025/08/27

【LLM 必读综述】Speed Always Wins：LLM高效架构调查

题目：Speed Always Wins: A Survey on Efficient Architectures for Large Language Models 作者：孙伟高上海人工智能实验室 github：https://github.com/weigao266/Awesome-Effic

56

0

0
paper

摸鱼天尊

2025/08/25

如何最快速的找到最核心的几篇文章

做这期blog的动机很简单，分享一下自己如何快速的上手某个领域的论文。快速了解垂类领域的SOTA论文首先，wispaper 直接搜索最需要的议题，找到20篇文章。

19

0

0
paper

摸鱼天尊

2025/08/14

MLsys24 分类汇总

LLM 推理与服务优化 (LLM Inference and Serving Optimization) KV 缓存管理和优化 (KV Cache Management and Optimization) 这些论文聚焦于 KV 缓存的减少、量化或重用，以提升生成推理效率和降低内存消耗。

27

0

0

基础篇
1 篇文章



算法
0 篇文章



CUDA优化
0 篇文章



ai 编译器
1 篇文章



算子进阶
3 篇文章



Python LLM 编译器
1 篇文章



Triton
1 篇文章



PD分离
1 篇文章



vllm源码
3 篇文章



AMD
2 篇文章



算子
6 篇文章



比赛
2 篇文章



八股
1 篇文章



github
1 篇文章



GPU
3 篇文章



ubuntu
1 篇文章



WSL2
1 篇文章



cuda/Triton
7 篇文章



MLsys24
1 篇文章



paper
3 篇文章



blog
1 篇文章



Halo
1 篇文章