AI初体验之我的专属大模型(RAG)

我爱免费 · 发表于 2025-1-22 22:27

作者：微信文章

嗨，我是探索AI的鬼鬼，喜欢本号内容的点波关注，不迷路

斜杠小鬼

你有没有遇到过这样的情况：你满怀期待地问AI一个问题，结果它一本正经地给你编了一个离谱的答案？比如，你问“Python是什么？”，它告诉你“Python是一种生活在热带雨林里的蛇，偶尔也会被用来写代码。”——嗯，前半句没错，但后半句好像...也没错？但是这是什么鬼？！

这就是AI生成内容的“坑”：它看起来很聪明，但实际上可能是个“脑补大师”。尤其是当你问一些需要准确答案的问题时，它可能会用流畅的语言给你一个完全错误的回答。这种“胡说八道”的现象，在AI领域被称为“幻觉”(Hallucination)。

那么，有没有一种技术能让AI生成的内容既流畅又靠谱呢？答案是：有！它就是今天的主角——RAG(Retrieval-Augmented Generation)，一个让AI生成内容更靠谱的“救星”。

RAG的核心理念很简单：让AI学会查资料。它不仅能像传统AI一样生成流畅的文字，还能从海量文档中检索出相关信息，确保生成的内容有据可查。换句话说，RAG就像一个“学霸”，既能快速查资料，又能写出一手好文章。

如果你是一个编程初学者，可能会觉得AI技术高深莫测，但别担心！这篇文章就是为你准备的。我们不会堆砌复杂的术语，而是用轻松诙谐的方式，带你了解RAG是什么、它能帮你做什么，以及如何用它来打造你的专属AI助手。

准备好了吗？让我们一起召唤这位AI界的“学霸”，开启你的RAG初体验吧！

PART

ONE

RAG是什么？AI界的“学霸”

RAG的“人设”：查资料狂魔 + 写作高手

RAG的全名是Retrieval-Augmented Generation，翻译过来就是“检索增强生成”。它的核心能力可以分成两部分：

举个例子，如果你问RAG：“Python的列表和元组有什么区别？”它会先跑到“图书馆”（也就是它的知识库）里找到相关的文档，然后生成一段既准确又易懂的解释。相比之下，传统的AI（比如GPT）更像是一个“脑补大师”，它可能会编出一个听起来很合理但实际上完全错误的答案。

RAG能帮你做什么？

既然RAG这么厉害，那它到底能帮你做什么呢？其实，它的应用场景非常多，而其中最典型的例子莫过于：专属知识库(你的私人AI助手)

你可以把自己的文档、笔记甚至代码库交给RAG，让它成为你的专属助手。比如，你可以上传你的学习笔记，然后问RAG：“我之前记的关于Python装饰器的内容是什么？”RAG会从你的笔记中找到相关信息，并生成回答。

再比如你可以把团队沉淀多年的产品和技术文档上传，然后问RAG：“我想优化XXX产品的a功能，请帮我全面的解释下这个功能，优化时需要通盘考虑哪些方面？”。RAG则会把这个功能相关的内容给你找出来，并借助LLM的功能来给你做出解释和给出建议。

接下来，我们就来手把手教你如何“召唤”这位AI学霸！

PART

TWO

如何用RAG？手把手教你“召唤”学霸

今天我们要用的工具是LlamaIndex，它是一个超级好用的库，能帮你轻松搭建RAG系统。

LlamaIndex是什么？

LlamaIndex就像是一个“魔法工具箱”，专门用来帮你把RAG的能力发挥到极致。它的核心功能是帮你把各种文档（比如PDF、Markdown、代码文件）变成RAG可以理解的“知识库”，然后你就可以愉快地向RAG提问了！

手把手教学：召唤RAG学霸

第一步：安装LlamaIndex

首先，你需要安装LlamaIndex和它的好搭档OpenAI。打开你的终端（或者Jupyter Notebook），输入以下命令：
pip install llama-index openai

第二步：设置OpenAI API密钥

基础的RAG可以调用在线大模型的接口来生成答案，所以你需要一个OpenAI的API密钥。如果你还没有，可以去OpenAI平台注册一个。

拿到密钥后，把它设置到环境变量中：
import osos.environ["OPENAI_API_KEY"] = "你的API密钥"

第三步：加载你的文档（链接）

现在，我们需要把文档交给LlamaIndex，让它变成RAG的“知识库”。假设你有一个Markdown文件（my_notes.md），里面记录了你公司自己的产品详细说明。
# 加载文档from llama_index.core import SimpleDirectoryReaderdocuments = SimpleDirectoryReader("path/to/my_notes.md").load_data()# 加载链接from llama_index.readers.web import SimpleWebPageReaderurl = "https://mp.weixin.qq.com/s/Xr1SofPScylWK5pMiaLvNg" # 替换为你要读取的网页URLdocuments = SimpleWebPageReader(html_to_text=True).load_data([url])

第四步：创建索引

接下来，我们需要把这些文档变成RAG可以理解的“索引”。你可以把索引想象成一个超级目录，RAG可以通过它快速找到相关内容。
from llama_index.core import VectorStoreIndex# 创建索引index = VectorStoreIndex.from_documents(documents)

第五步：召唤RAG学霸！

现在，一切准备就绪，你可以开始向RAG提问了！比如，你可以问它：“XXX产品的都有哪些功能？

怎么样？是不是很简单？只需要几行代码，你就能召唤出一个超级“学霸”RAG，帮你解决编程中的各种问题。快去试试吧，让你的编程之旅变得更轻松！

⭐️ colab的访问链接奉上！科学访问就能直接运行了！快来试试~

https://colab.research.google.com/drive/1InfNidPUHiVbXdA9dPO89lhPz8phlw6E?usp=sharing

小提示：如何让RAG更懂你？

PART

THREE

互动

⭐️ 有更多想法和疑问，快快留言吧，下一篇讨论你想知道的AI技术上手指南~

完

END

END

账号		自动登录	找回密码
密码			注册

萍聚头条

AI初体验之我的专属大模型(RAG)

本帖子中包含更多资源

萍聚头条

AI初体验 之 我的专属大模型(RAG)

本帖子中包含更多资源

AI初体验之我的专属大模型(RAG)