做这期blog的动机很简单,分享一下自己如何快速的上手某个领域的论文。最核心的三个步骤我觉得分别是:
确定自己研究领域的key words,这里是要从上到下的,如LLM -> 微调 和 CoT
确定自己需要研究的题目,如 如何确定CoT的某个环节有益于微调中得到高的得分
根据“and”的检索思想,从小到大的进行检索
先检索key words,确定论文的范围
在页面内只看研究的问题是否符合自己的要求
想要快速了解某个领域的论文,一个是问,问从业者,这是最快的,有人脉,直接问最核心的开发者,受益无穷,少走很多弯路。
那如果没人脉,没人带怎么办呢?那我们就一步一步来吧。
首先当然是在交流群里发,群主主打一天36h为群u服务在微信里直接搜索,检索的内容就是key words,这样能很快的定位相关的论文推荐。比如说我们先检索CoT和微调:(如果你想高效一点可以多加“综述”或者“合集”)

按照我的经验来说:
不看
不看xxxx之路等从古至今的历史文,这种通常是给小白看的
不看xxxxx从零开始xxxx,也是给小白看的
点开一篇文章拉到最后,出现安全和风险评估的,一律视为ai文,直接不看
各种卖课的机构文章,一律不看
能看
单纯的paper文或者叫机翻文,就是拿篇paper过来翻译后直接上文章,没有任何二次思考的,由于文章本来就是经过作者高度思考的,所以能看,但是不见得很好看,只能说省个自己翻译的时间

公司的技术文章,就是著名的大厂或者组织账号:腾讯技术工程、AMD开发者中心、阿里云开发者、阿里技术、datawhale、美团、京东和各种独角兽等,这些公众号平时都要关注,可以第一时间看到公司的技术咨询。
认真看
有作者标注和二次思考的文章,可以躺着看:

高度定制的大厂文章,这里尤其要说明两个大厂:
腾讯技术工程:你永远不知道给你写文章的年薪大包究竟有多骇人,写的文章朴实真诚,拳拳到肉,非常好看,我直接一个逐行阅读,逐字学习,就连参考文章都有备注啊,太猛了。
美团技术团队:不要走错了,是这个网址,并不是公众号的paper文,非常推荐阅读。

当我们在微信中找到了自己心仪的paper,使用connectwithpaper(tb十几块就有会员账号了),在搜索栏中把doi放进去,就可以得到一张引用和被引用的一张图:

我会快速的看看网络里最新年份的工作,锁定3 4篇我觉得很对的,看看共性,这时候要找到的就是这个版面里最常用的方法
需要说明的是,这里肯定不会只有一种方法,而是多种多样的,这里只需要思考的是对于问题来说,你能接受的最简单的解决方法是什么,就选那一篇文章继续往下。这个思考来源于paper中baseline的存在,一定要先有一个基石,再去思考别的神人方法,相信我,这是最好的。
然后挑一篇新一点的,再次进行图生成,重复这个过程,直到你能锚定这个领域最新的方法
需要注意的是,这样极其容易迷失自己的方向,请务必扣紧key words和自己的问题,当一个图的大部分都不是这个问题,那么大概率已经偏移了。当然,如果一个知识图谱大部分都是处理这个问题,那说明对的不能再对了。
这时候就能恭喜你,你在半小时内大概率就能极速的锚定了一个问题最新的几篇论文
🚧施工ing
arxiv 最基本的页面如下:
右上角可以选择领域,可以直接搜对应的关键词
左边红框可以选择领域之后进去进行高级搜索
下面是大领域和对应的垂类领域,点击就可以看垂类最新提交的论文

搜索论文,可以进行选择,然后右边进行下载:
announcement date:是上传的日期,通常大组发的paper都会先发到arxiv去占个位
Submission date:是出刊的日期,质量有保证一点


右侧可以下载,左下角有connectpaper和litmap等第三方论文连接web,但是这些要钱的,可以试试researchrabbitapp,但是这个网站主要是生物方面的,LLM的不太行。