https://ollama.com/library?sort=popular 查看比较热门的一些大模型吧,这里随便进行指定吧,无所谓的嗯
Docker 安装ollama 实现吧
docker pull ollama实现的是拉取对应的镜像吧docker run -d --gpus=all -p 11434:11434 --name ollama ollama/ollama首先 -d 就是指定的是其是后台进程进行运行,核心就是 deamon 的后台进程的效果吧
-p 就是实现的是本地的端口的映射吧
--name 就是指定的是本地运行的 ollama 运行的容器的名称吧
docker run 的可选参数的指定为:
-d就是指定该模式是用于进行的后台进程启动吧-v就是实现的指定我们的容器的卷 volumn 吧-p就是实现的是指定我们的本地和启动后的端口映射吧,ollama 一般是 11434最后就是实现指定我们对应的启动的镜像名吧
docker exec -it <container_name> bash以命令行的形式进行我们的 ollama 容器的拉取实现吧
# docker-compose.dev.yml
version: '3.8'
services:
ollama:
image: ollama/ollama
container_name: ollama-dev
ports:
- "11434:11434"
volumes:
- ollama_data:/root/.ollama
- ./config:/app/config # 挂载本地配置文件
environment:
- OLLAMA_HOST=0.0.0.0
- OLLAMA_DEBUG=1 # 开启调试模式
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: all
capabilities: [gpu]
stdin_open: true # 保持标准输入打开
tty: true # 分配伪终端
restart: unless-stopped
volumes:
ollama_data:Ollama 的核心的命令集成
ollama pull <model_name>实现对应的拉取容器名到本地吧ollama run <model_name>实现的是运行ollama 中本地的大模型ollama list进行查看本地部署的大模型的实现吧以及每个模型的训练量的指定实现吧
3b7b这些都是本次指定的大模型的训练的数据量的指定吧这些就是实现的是定义本身模型的自身的一些维度吧,轻量的大模型,等等其他的吧
Ollama 模型的能力
核心就是参考网站的 Capabilities
注意这些都是配置性的东西吧,核心通过可配置化实现一些功能的实现吧
整体来说可以实现可配置的实现有
1. stream 进行对应的流式处理的能力实现,同时这个也是我们的最重要的一个实现大模型相应的能力实现吧
为什么需要进行流式处理讷?流式处理的原因核心原因是什么讷?
核心是进行优化我们的 TTFB 的能力吧(首字节实践 Time To First Byte)
2. think 思考能力,但是注意有些模型的话 think 能力是不支持的讷
think 能力核心的作用是进行对应的让大模型在进行内部的思考的之前进行对应的内部思考和总结实现吧
提高答案质量 - 经过深思熟虑的回答更准确、更全面
透明度 - 你可以看到模型的思考过程,理解答案是如何得出的
教育价值 - 学习模型的思考方法,提升自己的思维能力
纠错能力 - 模型可以在思考过程中发现并修正自己的错误
模型的深度思考就是和这个字段进行深度绑定进行结合的讷,这里可以进行区分一下吧
用户问题 → 问题分解 → 多角度分析 → 逻辑验证 → 答案合成
3. Embeddings 嵌入)本质上是一种“翻译”:它将文字、图片、声音等非结构化数据,转换成一串计算机能理解的数字(向量)。
4. tool_calling 就是让大模型像人类一样可以使用额外的工具,实现横向的拓展吧
用户问题 → 模型分析 → 决定需要什么工具 → 调用工具 → 获取结果 → 生成最终回答
✅ 从静态知识 → 动态能力
✅ 从理论分析 → 实际执行
✅ 从有限信息 → 无限可能
只要使用了我们的 tool_calling 的能力就可以为我们的大模型增强对应的工具使用,实现对应的 designtocode 的应用,或者说 texttosql 的应用吧,实现横向的功能拓展,让大模型帮助我们完成实际的问题吧
5. web search
用户问题 → 我识别需要实时信息 → 调用搜索工具 → 获取搜索结果 → 分析整理 → 生成回答
Ollama 结合大模型的学习拓展
核心来源于豆包生成,注意辨别,当作学习调研吧
大模型具备能力总结
Streaming(流式输出)、Thinking(思维链)、Structured Outputs(结构化输出)、Vision(视觉)、Embeddings(向量嵌入)、Tool calling(工具调用)、Web search(网络搜索) 是基础能力,当前大模型还具备以下进阶能力: