摸鱼天尊 blog
摸一会鱼🐟
概述 LlamaIndex(原名 GPT Index)是一个开源的数据框架,专门用于构建大语言模型(LLM)应用。它解决了 LLM 的一个核心局限性:LLM 在训练后就无法访问私有数据。LlamaIndex 通过检索增强生成(RAG)技术,将用户的私有数据与 LLM 的生成能力无缝连接。与langc
码农圣地 github github众所周知,是最大的同性交友网站开源项目公布网站,每个人都可以在这里share自己的项目。 由于open-source往往由一个团队进行开发,所有有很多开发版本,为了管理不同的开发版本之间的异同,远古linux大神linus写了git的原型来管理不同的fork。每个
旨在排列出看过或者没看过收集的高质量博客 苏神 地址:科学空间 高代 从一个单位向量变换到另一个单位向量的正交矩阵 “对角+低秩”三角阵的高效求逆方法 <
Context Manager 多模态数据的处理 现在大模型系统的对话窗口和处理数据会产生大量的上下文,后续的qa往往会用到其中一部分上下文,所以建立有效的context engine是十分必要的。 NLP 用时问戳标记上下文 一种常见的设计是在每条信息上附加时间戳,以保留其生成的顺序。这种方法由于
github link:https://github.com/gsd-build/get-shit-done/blob/main/README.zh-CN.md 安装命令:npx get-shit-done-cc@latest 更新包:npx get-shit-done-cc@latest 某种原因
如果把近两年的主流开源框架放在一起看,大致可以归成 5 类: 单 Agent runtime架构 代表:OpenAI Agents SDK 图工作流 / State Graph 架构 代表:LangGraph Flow + Crew 分层架构 代表:CrewAI 团队协作 / Swarm / 角色扮
context其实跟infra息息相关,好的infra能支持非常多的idea并发的去实现,而pipeline的高度耦合使得infra变得屎山中的屎山,所以模块化的context infra势在必行。我们想构建一个context playload,一个有序、分层、可度量的 typed blocks 集
一、workflow 我习惯的方式是opencode + gpt5.2 xhigh来吵方案,然后claude code + opus + sonnet来写代码,他们有以下几个区别: gpt通常有包月的套餐,一天能用60~120刀不等,中转站包月通常一个月不会超过80 rmb,是非常实用的大模型套餐
agent最基本的就是ReAct范式,其中最关键的就是agent plan,我们主要探讨的是单agent的plan和多agent不同范式如何plan的更好。 单agent 单agent plan指的是同一个agent在一个 loop 里:规划 → 执行(工具调用)→ 观察 → 反思/重规划 → …
由于codex至今不支持subagent,我实在等不及了,用codex开发确实没那么灵光,先用claude code组建团队,反正逻辑是一致的。这里附上一条codex不询问命令的指令: # 尽量别问我(读写不问,删除之类的问) codex -s workspace-write -a never cl