前面的内容通过Ollama完成了DeepSeek本地部署,并利用CherryStudio桌面客户端实现本地知识库。但此方案使用方式受限,个人办公学习还可以,如果企业要结合业务,通过AI推理和知识检索能力向用户提供更丰富的AI服务,那需要编程开发实现了。
下面的内容,我将逐步搭建简单的企业智能客服系统,通过简单的代码实现让大家了解涉及的每一项大模型领域技术。
一、技术术语
RAG:检索增强生成(Retrieval-augmented Generation),是当下热门的大模型前沿技术之一,结合了语言模型和信息检索技术。当模型需要生成文本或者回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成,从而提高预测的质量和准确性。
Prompt:“提示词”,在AI大模型中,Prompt的作用主要是给AI模型提示输入信息的上下文和输入模型的参数信息。
Vector Databases(向量数据库):将非结构化数据(如文本、图像、音频、视频)转换为向量。向量数据库的功能就是对向量进行高效存储、检索、计算用的数据库。
二、工作流程
三、技术选型
开发语言:Python
大语言模型:DeepSeek-v1:1.5b(本机电脑只能跑这个了)
WEB系统:Streamlit, 一个强大的Python WEB框架。不需要前端开发经验,能够轻松创建美观且实用的交互式 Web 应用
Ollama: 运行大模型的平台
Chroma:向量数据库
Nomic Embed Text:文本嵌入模型,将文档向量化
个人能力有限,现学现卖,不足之处,请各位大神批评指正!
未完待续。。。。