Datawhale AI夏令营 RAG篇 task2

科技前沿 • 2026-04-06 10:09 • 阅读 1

Datawhale AI夏令营 RAG篇 task2任务二主要是使用把我们需要的大模型一个用于对话的 LLM 一个用于文本向量化的 Embedding 模型在里配置好我在这里是使用了 Llama index 的官方定制包这是最直接最方便的一种方法 Llama index 为一些主流的大模型厂商提供了官方的专门的集成包比如教程里提到的智谱 AI 和零一万物它们都有自己的和包我们只需要安装这些特定的包

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

任务二主要是使用，把我们需要的大模型：一个用于对话的LLM，一个用于文本向量化的Embedding模型，在里配置好。

不过，很多国内的大模型厂商，为了方便开发者迁移，都提供了与OpenAI完全兼容的API接口。我们可以继续使用Llama-index里为OpenAI设计的类，比如和，只需要在初始化的时候，把参数指向我们国内厂商的服务地址，同时传入对应的和模型名称就行了。

不过，这里有一个坑。Llama-index的OpenAI相关类内部，如果它不认识你传进来的模型名字（比如智谱的），就会报错。

为了绕过这个检查，教程里介绍了两种技巧。第一种是“继承重写”，我们自己新建一个类，比如叫，让它继承自官方的类，然后只重写那个负责返回模型元数据的方法，在里面直接写死一个它认识的上下文窗口大小，从而骗过检查。第二种方法更直接，就是找到Llama-index安装目录里的源代码文件，直接在那个白名单字典里，把我们想用的模型名称手动加进去。修改完源码后，记得重启一下Jupyter内核才能生效。

这种方法几乎适用于所有提供OpenAI兼容接口的模型，适用性非常广。

小讯

2026年阿里云通义千问宣布 Qwen-MT 机器翻译模型：支持 92 种语言互译

上一篇 2026-04-06 10:10

讯飞星火如何删除生成的作品

下一篇 2026-04-06 10:08

2026年阿里云通义千问宣布 Qwen-MT 机器翻译模型：支持 92 种语言互译 1773280903
无需wsl，windows下原生使用claude code+kimi-k2配置保姆级教程 1773280899
2026年优刻得接入智谱GLM-4.7 1773280895
科大讯飞星火课堂分析大模型：AI赋能个性化学习，助力教育数字化转型 1773280891
Cursor MCP使用教程：完整配置指南与推荐Server【2025最新实测】 1773280887
Obsidian使用笔记 1773280879
2026年python实现基于文心一言大模型的sql小工具 1773280875
Android App集成豆包大模型SDK实战：从接入到性能优化全指南 1773280867
2026年通义千问宣布正式推出 Qwen Chat Memory 功能 1773280863
讯飞星火如何删除生成的作品 1773280915
2026年文心一言：百度智能云打造的大模型与AI开发平台解析 1773280919
2026年字节跳动推出豆包大模型 1.6、图像编辑模型 3.0、同声传译模型 2.0，发布企业自有模型托管方案、Responses API 等 1773280927
实用指南：mac 设置cursor （像PyCharm一样展示效果） 1773280931
零代码零基础！小红书MCP全自动化运营【保姆级安装教程】 1773280935
月之暗面数亿美元融资，Kimi k2模型引海内外热议 1773280939
2026年国内开通Claude Pro帐号的教程：支付宝充值订阅Claude Pro会员指南 1773280943
提升工作效率的终极秘籍! 一文掌握Cursor的快捷键汇总篇 1773280947
2026年第五节认识一下Midjourney工具的二次元绘图功能 1773280951

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/220878.html