手把手教你搭建免费的大模型应用
myzbx 2025-01-04 21:51 39 浏览
许多用户因为大模型高昂的调用费用和技术门槛而倍感困扰,即便有众多创新的想法,也往往因为无法顺利实现而受阻。
本文将指导您亲手搭建属于自己的本地大模型服务,让您无拘无束地实现创意,并享受低成本的便利。更重要的是,您还将能够拓展更多开源大模型,为生活和工作效率带来质的飞跃。
一、使用效果
本地部署 LLaMA2-7B,模型大小:3.8GB,效果如下:
1、示例一:who are you
>>> who are you
I'm LLaMA, an AI assistant developed by Meta AI that can understand and respond to human input in a conversational manner. I'm here to help you with any
questions or topics you'd like to discuss! How can I assist you today?2、示例二:Start work on Monday, a week full of vitality and advantages.
>>> Start work on Monday, a week full of vitality and advantages.
Sounds great! I'm glad to hear that you have a productive week ahead of you. Here are some positive affirmations to help you start your week on a high note:
* I am excited and ready to tackle the challenges of the week ahead.
* I am confident in my abilities and know that I can accomplish great things.
* I embrace this week with an open mind and heart, ready to learn and grow.
* I am grateful for the opportunities that lie ahead and look forward to making the most of them.
* I am energized and motivated to make this week a successful and fulfilling one.
Remember, the power to make your week great lies within you. Stay positive, stay focused, and always believe in yourself!3、示例三:你会中文吗
>>> 你会中文吗
我們可以進行中文交流,但是我的語言能力 limited,因為我的訓練只包括一些基本的中文句子和phrases。如果你有任何特定的問題或話題想要談論,我將try my best to help you。二、仓库地址
使用 Llama 2、Mistral、Gemma 和其他大型语言模型。
https://github.com/jmorganca/ollama三、模型库
1、模型库地址
https://ollama.com/library/llama2Model | Parameters | Size |
Llama 2 | 7B | 3.8GB |
Mistral | 7B | 4.1GB |
Dolphin Phi | 2.7B | 1.6GB |
Phi-2 | 2.7B | 1.7GB |
Neural Chat | 7B | 4.1GB |
Starling | 7B | 4.1GB |
Code Llama | 7B | 3.8GB |
Llama 2 Uncensored | 7B | 3.8GB |
Llama 2 13B | 13B | 7.3GB |
Llama 2 70B | 70B | 39GB |
Orca Mini | 3B | 1.9GB |
Vicuna | 7B | 3.8GB |
LLaVA | 7B | 4.5GB |
2、内存要求
- 7b 模型通常需要至少 8GB 的 RAM;
- 13b 模型通常需要至少 16GB 的 RAM;
- 70b 模型通常需要至少 64GB 的 RAM;
四、代码示例
1、下载源码
按照你的操作系统选择不同的下载地址。
# macOS
https://ollama.com/download/Ollama-darwin.zip
# Windows preview
https://ollama.com/download/OllamaSetup.exe
# Linux
curl -fsSL https://ollama.com/install.sh | sh2、启动服务
ollama run llama23、本地请求
本地启动服务后,可通过 API 请求数据:
curl -X POST http://localhost:11434/api/generate -d '{
"model": "llama2",
"prompt":"Why is the sky blue?"
}'4、API 数据
API 数据按照流式返回:
{"model":"llama2","created_at":"2023-12-25T02:23:41.333728Z","response":"\n","done":false}
{"model":"llama2","created_at":"2023-12-25T02:23:41.587704Z","response":"The","done":false}
{"model":"llama2","created_at":"2023-12-25T02:23:41.787339Z","response":" sky","done":false}
{"model":"llama2","created_at":"2023-12-25T02:23:41.97912Z","response":" appears","done":false}
.....
{"model":"llama2","created_at":"2023-12-25T02:24:23.541595Z","response":".","done":false}
{"model":"llama2","created_at":"2023-12-25T02:24:23.755337Z","response":"","done":true,"context":[518,25580,29962,3532,14816,29903,29958,5299,829,14816,29903,6778,13,13,11008,338,278,14744,7254,29973,518,29914,25580,29962,13,13,1576,14744,5692,7254,1363,310,263,27791,265,2000,9596,280,1141,14801,292,29889,1932,6575,4366,24395,11563,29915,29879,25005,29892,372,2094,1309,2153,21577,13206,21337,310,330,2129,1316,408,21767,307,1885,322,288,28596,29889,4525,13206,21337,14801,278,3578,297,599,18112,29892,541,896,14801,20511,313,9539,29897,281,6447,1477,29879,901,1135,5520,313,1127,29897,281,6447,1477,29879,29889,910,338,2998,408,9596,280,1141,14801,292,29889,13,13,2887,263,1121,310,445,14801,292,29892,278,7254,3578,338,29106,287,10106,278,25005,29892,6820,278,14744,967,17443,7254,2927,29889,450,2654,3578,29892,373,278,916,1361,29892,14517,7812,1549,278,25005,411,2217,14801,292,29892,607,338,2020,278,28205,5692,901,2654,1135,278,14744,29889,13,13,1576,7254,2927,310,278,14744,508,884,367,15201,491,916,13879,1316,408,21180,918,29892,19786,29892,322,4094,325,26191,297,278,25005,29892,607,508,14801,278,3578,297,1422,5837,322,7738,263,3464,310,11955,29889,2398,29892,278,1667,4556,310,278,7254,2927,310,278,14744,338,9596,280,1141,14801,292,29889],"total_duration":56899446480,"load_duration":10037867844,"prompt_eval_count":26,"prompt_eval_duration":4662218000,"eval_count":210,"eval_duration":42167419000}5、流式输出
前端拿到数据后通过 SSE 协议进行流式输出:
SSE:Server-Sent Events (SSE) 是一种基于 HTTP 协议的服务器推送技术,它允许服务器向客户端发送数据和信息。与 WebSocket 不同,SSE 是一种单向通信方式,只有服务器可以向客户端推送消息。SSE 是 HTML5 规范的一部分,使用非常简单,主要由服务端与浏览器端的通讯协议(HTTP协议)和 EventSource 接口来处理 Server-sent events 组成,服务器端的响应的内容类型是“text/event-stream”。
6、监听数据变化
前端实现非常简单,创建一个 SSE 的实例然后监听数据的状态即可:
let reply = ''
const evtSource = new EventSource(`${baseUrl}/chat?content=你好`);
evtSource.onmessage = (event) => {
// 流式数据最后一条的状态为[DONE]代表结束返回
if(event.data === '[DONE]') {
console.log(`回答完毕!:${reply}`)
} else {
const res = JSON.parse(event.data)
reply += res.choices[0].delta.content || ''
}
}原创热门文章分享
相关推荐
- 如何设计一个优秀的电子商务产品详情页
-
加入人人都是产品经理【起点学院】产品经理实战训练营,BAT产品总监手把手带你学产品电子商务网站的产品详情页面无疑是设计师和开发人员关注的最重要的网页之一。产品详情页面是客户作出“加入购物车”决定的页面...
- 怎么在JS中使用Ajax进行异步请求?
-
大家好,今天我来分享一项JavaScript的实战技巧,即如何在JS中使用Ajax进行异步请求,让你的网页速度瞬间提升。Ajax是一种在不刷新整个网页的情况下与服务器进行数据交互的技术,可以实现异步加...
- 中小企业如何组建,管理团队_中小企业应当如何开展组织结构设计变革
-
前言写了太多关于产品的东西觉得应该换换口味.从码农到架构师,从前端到平面再到UI、UE,最后走向了产品这条不归路,其实以前一直再给你们讲.产品经理跟项目经理区别没有特别大,两个岗位之间有很...
- 前端监控 SDK 开发分享_前端监控系统 开源
-
一、前言随着前端的发展和被重视,慢慢的行业内对于前端监控系统的重视程度也在增加。这里不对为什么需要监控再做解释。那我们先直接说说需求。对于中小型公司来说,可以直接使用三方的监控,比如自己搭建一套免费的...
- Ajax 会被 fetch 取代吗?Axios 怎么办?
-
大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发!今天给大家带来的主题是ajax、fetch...
- 前端面试题《AJAX》_前端面试ajax考点汇总
-
1.什么是ajax?ajax作用是什么?AJAX=异步JavaScript和XML。AJAX是一种用于创建快速动态网页的技术。通过在后台与服务器进行少量数据交换,AJAX可以使网页实...
- Ajax 详细介绍_ajax
-
1、ajax是什么?asynchronousjavascriptandxml:异步的javascript和xml。ajax是用来改善用户体验的一种技术,其本质是利用浏览器内置的一个特殊的...
- 6款可替代dreamweaver的工具_替代powerdesigner的工具
-
dreamweaver对一个web前端工作者来说,再熟悉不过了,像我07年接触web前端开发就是用的dreamweaver,一直用到现在,身边的朋友有跟我推荐过各种更好用的可替代dreamweaver...
- 我敢保证,全网没有再比这更详细的Java知识点总结了,送你啊
-
接下来你看到的将是全网最详细的Java知识点总结,全文分为三大部分:Java基础、Java框架、Java+云数据小编将为大家仔细讲解每大部分里面的详细知识点,别眨眼,从小白到大佬、零基础到精通,你绝...
- 福斯《死侍》发布新剧照 "小贱贱"韦德被改造前造型曝光
-
时光网讯福斯出品的科幻片《死侍》今天发布新剧照,其中一张是较为罕见的死侍在被改造之前的剧照,其余两张剧照都是死侍在执行任务中的状态。据外媒推测,片方此时发布剧照,预计是为了给不久之后影片发布首款正式预...
- 2021年超详细的java学习路线总结—纯干货分享
-
本文整理了java开发的学习路线和相关的学习资源,非常适合零基础入门java的同学,希望大家在学习的时候,能够节省时间。纯干货,良心推荐!第一阶段:Java基础重点知识点:数据类型、核心语法、面向对象...
- 不用海淘,真黑五来到你身边:亚马逊15件热卖爆款推荐!
-
Fujifilm富士instaxMini8小黄人拍立得相机(黄色/蓝色)扫二维码进入购物页面黑五是入手一个轻巧可爱的拍立得相机的好时机,此款是mini8的小黄人特别版,除了颜色涂装成小黄人...
- 2025 年 Python 爬虫四大前沿技术:从异步到 AI
-
作为互联网大厂的后端Python爬虫开发,你是否也曾遇到过这些痛点:面对海量目标URL,单线程爬虫爬取一周还没完成任务;动态渲染的SPA页面,requests库返回的全是空白代码;好不容易...
- 最贱超级英雄《死侍》来了!_死侍超燃
-
死侍Deadpool(2016)导演:蒂姆·米勒编剧:略特·里斯/保罗·沃尼克主演:瑞恩·雷诺兹/莫蕾娜·巴卡林/吉娜·卡拉诺/艾德·斯克林/T·J·米勒类型:动作/...
- 停止javascript的ajax请求,取消axios请求,取消reactfetch请求
-
一、Ajax原生里可以通过XMLHttpRequest对象上的abort方法来中断ajax。注意abort方法不能阻止向服务器发送请求,只能停止当前ajax请求。停止javascript的ajax请求...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 简介 (30)
- HTML 响应式设计 (31)
- HTML URL 编码 (32)
- HTML Web 服务器 (31)
- HTML 表单属性 (32)
- HTML 音频 (31)
- HTML5 支持 (33)
- HTML API (36)
- HTML 总结 (32)
- HTML 全局属性 (32)
- HTML 事件 (31)
- HTML 画布 (32)
- HTTP 方法 (30)
- 键盘快捷键 (30)
- CSS 语法 (35)
- CSS 轮廓宽度 (31)
- CSS 谷歌字体 (33)
- CSS 链接 (31)
- CSS 定位 (31)
- CSS 图片库 (32)
- CSS 图像精灵 (31)
- SVG 文本 (32)
- 时钟启动 (33)
- HTML 游戏 (34)
- JS Loop For (32)
