Board logo

标题: 以后确实内存越大越好,没上限 [打印本页]

作者: 随便走走    时间: 2026-6-17 16:52     标题: 以后确实内存越大越好,没上限

posted by wap, platform: Firefox
什么16G够用,24G舒服都过时了,就是越大越好,哪怕不是做开发的

最近和chatgpt聊天,聊一会就给我干到10G左右,出词都一卡一卡的,想想这个估计也没办法解决,未来趋势AI就是一个人工大脑,什么都要存在内存里最快,不可能思考过程还要读硬盘

普通人哪怕只用线上模型,未来的上下文窗口也是海量的,日积月累,这种体验很好,记忆的时间和内容越多越好,都是内存
作者: 爱猫咪的薛定谔    时间: 2026-6-17 17:08

posted by wap, platform: Android
上下文为啥要占用很大内存?

而且你用chargpt为啥要用本地内存?

本帖最后由 爱猫咪的薛定谔 于 2026-6-17 09:08 通过手机版编辑
作者: dzgxg    时间: 2026-6-17 17:11

posted by wap, platform: MAC OS X
网页版的chatgpt确实卡,尤其是富媒体内容多了之后
作者: hqqttjiang    时间: 2026-6-17 17:13

果然 负激骚 是有意义的
作者: 爱猫咪的薛定谔    时间: 2026-6-17 17:15

posted by wap, platform: Android
引用:
原帖由 @dzgxg  于 2026-6-17 09:11 发表
网页版的chatgpt确实卡,尤其是富媒体内容多了之后
为啥会占用本地内存?
作者: dzgxg    时间: 2026-6-17 17:23

posted by wap, platform: MAC OS X
引用:
原帖由 @爱猫咪的薛定谔  于 2026-6-17 17:15 发表
为啥会占用本地内存?
网页占用啊,可以看到内存占用的,不管是gemini还是本地部署的openwebui,对话长了,占用的内存都会显著上升,gemini算优化比较好的,我最多用到过3g,然后切换到空对话闲置一段时间会降低回到几百m。所以网页使用ai比较适合用pwa方式,可以单独退出ai占用不影响其他页面
作者: 爱猫咪的薛定谔    时间: 2026-6-17 17:33

posted by wap, platform: Android
引用:
原帖由 @dzgxg  于 2026-6-17 09:23 发表
网页占用啊,可以看到内存占用的,不管是gemini还是本地部署的openwebui,对话长了,占用的内存都会显著上升,gemini算优化比较好的,我最多用到过3g,然后切换到空对话闲置一段时间会降低回到几百m。所以网页使用ai比较适合用pwa方式,可以单独退出ai占用不影响其他页面
原理是什么?我想不出有什么内容会占用内存,手机版一样用,也没说对配置有要求啊
作者: sigmaxion    时间: 2026-6-17 17:37

posted by wap, platform: VIVO
也就是以后的大宗消费不再是房车而是内存了么,人均100PB走起,祖宗十八代的陈谷子烂芝麻破事都要记得牢牢的
作者: 爱猫咪的薛定谔    时间: 2026-6-17 17:44

posted by wap, platform: Android
引用:
原帖由 @sigmaxion  于 2026-6-17 09:37 发表
也就是以后的大宗消费不再是房车而是内存了么,人均100PB走起,祖宗十八代的陈谷子烂芝麻破事都要记得牢牢的
现在商用的模型最大上下文也就百万token,存了也用不了
作者: 查理王    时间: 2026-6-17 17:49

posted by wap, platform: iPhone
我现在用的64G,确实用不完,开几个虚拟机也还剩很多
作者: 随便走走    时间: 2026-6-17 17:57

posted by wap, platform: iPhone
引用:
原帖由 @爱猫咪的薛定谔  于 2026-6-17 17:08 发表
上下文为啥要占用很大内存?

而且你用chargpt为啥要用本地内存?

本帖最后由 爱猫咪的薛定谔 于 2026617 09:08 通过手机版编辑
你用过客户端吗,没用就杠?至于为什么,你去问OpenAI啊
作者: 爱猫咪的薛定谔    时间: 2026-6-17 18:05

posted by wap, platform: Android
引用:
原帖由 @随便走走  于 2026-6-17 09:57 发表
你用过客户端吗,没用就杠?至于为什么,你去问OpenAI啊
你说说看啊,为啥会占用内存,那用网页版会怎么样
作者: 爱猫咪的薛定谔    时间: 2026-6-17 18:05

posted by wap, platform: Android
引用:
原帖由 @随便走走  于 2026-6-17 09:57 发表
你用过客户端吗,没用就杠?至于为什么,你去问OpenAI啊
你说说看啊,为啥会占用内存,那用网页版会怎么样
作者: bsseven    时间: 2026-6-17 18:09

posted by wap, platform: Android
确实,我云游戏,一开光追,立马爆内存了,估计那光线太多,网速不够传输
作者: 随便走走    时间: 2026-6-17 18:10

posted by wap, platform: iPhone
引用:
原帖由 @爱猫咪的薛定谔  于 2026-6-17 18:05 发表
你说说看啊,为啥会占用内存,那用网页版会怎么样
网页版我很久没用了,客户端原理很简单,一个对话session的全部聊天都在内存里,因为每一轮对话模型实际上都会根据历史对话形成上下文输入,所以全部对话都在内存里,你关掉重开就没有了,我最多一次都20多g了,都是最新版本。
作者: 爱猫咪的薛定谔    时间: 2026-6-17 18:17

posted by wap, platform: Android
引用:
原帖由 @随便走走  于 2026-6-17 10:10 发表
网页版我很久没用了,客户端原理很简单,一个对话session的全部聊天都在内存里,因为每一轮对话模型实际上都会根据历史对话形成上下文输入,所以全部对话都在内存里,你关掉重开就没有了,我最多一次都20多g了,都是最新版本。
上下文最多才百万token,而且在服务器端,本地要这数据没有用处,实在看不出占用g内存的理由
作者: ginaamix    时间: 2026-6-17 18:37

posted by wap, platform: Chrome
就是codex优化不行
作者: 随便走走    时间: 2026-6-17 19:02

posted by wap, platform: Firefox
引用:
原帖由 @爱猫咪的薛定谔  于 2026-6-17 18:17 发表
上下文最多才百万token,而且在服务器端,本地要这数据没有用处,实在看不出占用g内存的理由
token是token,缓存是缓存,token不会平白无故产生,其实还是来着缓存, 这是很明显也很好理解的

而且随着智能体上下文空间越来越大,记忆内容肯定也越来越多,缓存必然也会相应膨胀
作者: 随便走走    时间: 2026-6-17 19:05

posted by wap, platform: Firefox
引用:
原帖由 @ginaamix  于 2026-6-17 18:37 发表
就是codex优化不行
你告诉我哪个agent或harness不占内存的,我现在就去换
作者: yfl2    时间: 2026-6-17 19:22

引用:
原帖由 随便走走 于 2026-6-17 19:02 发表
posted by wap, platform: Firefox
token是token,缓存是缓存,token不会平白无故产生,其实还是来着缓存, 这是很明显也很好理解的

而且随着智能体上下文空间越来越大,记忆内容肯定也越来越多,缓存必然也会相应 ...
缓存在服务端,本地缓存有啥用?
而且缓存是为了再次命中,缓存大只会加快速度(如果命中就不需要重新算了),怎么会越来越慢?
作者: yfl2    时间: 2026-6-17 19:24

引用:
原帖由 随便走走 于 2026-6-17 19:05 发表
posted by wap, platform: Firefox
你告诉我哪个agent或harness不占内存的,我现在就去换
llm不占用啊,比如豆包...
作者: yfl2    时间: 2026-6-17 19:34

长对话卡顿的核心原因在于网页 DOM 节点过多。随着消息气泡、代码块、公式、图片及交互按钮的累积,浏览器在重排版、样式计算和内存管理上的压力显著增加。尤其是超过 30 至 50 轮的对话,离屏消息仍占用大量节点,导致交互性能下降。


喷了,和大模型上下文和缓存都没关系,就是页面太大了
作者: pocketmom    时间: 2026-6-17 19:37

posted by wap, platform: Android
1t内存的路过,跑本地deepseek模型只有18tokens
作者: 随便走走    时间: 2026-6-17 19:54

posted by wap, platform: iPhone
引用:
原帖由 @爱猫咪的薛定谔  于 2026-6-17 18:05 发表
你说说看啊,为啥会占用内存,那用网页版会怎么样
网页版我很久没用了,客户端原理很简单,一个对话session的全部聊天都在内存里,因为每一轮对话模型实际上都会根据历史对话形成上下文输入,所以全部对话都在内存里,你关掉重开就没有了,我最多一次都20多g了,都是最新版本。
作者: ginaamix    时间: 2026-6-17 20:06

posted by wap, platform: Chrome
cc和codex的聊天记录默认都是存在本地jsonl文件里,一个session撑死100MB不到,又不是本地跑LLM存kv cache哪里要这么多内存
codex肯定是有不少内存泄漏bug,随便一搜都是内存被吃满的例子
https://www.reddit.com/r/codex/comments/1tyiz7g/possible_codex_memory_leak_42gb_ram_usage_on_m4/
作者: 随便走走    时间: 2026-6-17 20:14

posted by wap, platform: iPhone
引用:
原帖由 @yfl2  于 2026-6-17 19:34 发表
长对话卡顿的核心原因在于网页 DOM 节点过多。随着消息气泡、代码块、公式、图片及交互按钮的累积,浏览器在重排版、样式计算和内存管理上的压力显著增加。尤其是超过 30 至 50 轮的对话,离屏消息仍占用大量节点,导致交互性能下降。


喷了,和大模型上下文和缓存都没关系,就是页面太大了
那为什么要留这些页面在内存里呢,你要不要再多问问ai
作者: dreamlost    时间: 2026-6-17 20:18

posted by wap, platform: Firefox
这种模型在远程 本地还占用那么多内存的话 肯定是有内存泄漏了
作者: yfl2    时间: 2026-6-17 20:27

引用:
原帖由 随便走走 于 2026-6-17 20:14 发表
posted by wap, platform: iPhone
那为什么要留这些页面在内存里呢,你要不要再多问问ai
你看看别人说的就知道了
你说的缓存什么都不在本地,和上下文也没有关系

这个程序不在意你本地的内存,它又不像微信只显示少部分内容,其他随着滚动再读取,所以导致当前页面不断膨胀,实际上,上下文早就不在了

[ 本帖最后由 yfl2 于 2026-6-17 20:28 编辑 ]
作者: 随便走走    时间: 2026-6-17 22:53

posted by wap, platform: Firefox
引用:
原帖由 @yfl2  于 2026-6-17 20:27 发表
你看看别人说的就知道了
你说的缓存什么都不在本地,和上下文也没有关系

这个程序不在意你本地的内存,它又不像微信只显示少部分内容,其他随着滚动再读取,所以导致当前页面不断膨胀,实际上,上下文早就不在了
上下文其实就是模型的记忆,记忆也分长期记忆和短期记忆,最终的上下文和长期记忆在云端没问题,但短期记忆很可能还是依赖本地,我试过切换一下设备,同账号比如从桌面端到手机端,模型对刚刚提到的内容都健忘失忆了

因此本地缓存和短期记忆还是有关的,不会完全不参与模型交互
作者: yfl2    时间: 2026-6-17 23:06

引用:
原帖由 随便走走 于 2026-6-17 22:53 发表
posted by wap, platform: Firefox
上下文其实就是模型的记忆,记忆也分长期记忆和短期记忆,最终的上下文和长期记忆在云端没问题,但短期记忆很可能还是依赖本地,我试过切换一下设备,同账号比如从桌面端到手机端, ...
本地没有记忆,因为不参与计算,只是让你看聊天历史而已,存硬盘上也不影响

你切换设备失去上下文,是因为服务方就是这么设置的,同一设备新开一个窗口,上下文都能清空

你想想看,你本地10g“短期记忆”,给openai处理吗?233

[ 本帖最后由 yfl2 于 2026-6-17 23:08 编辑 ]
作者: 焚岚    时间: 2026-6-17 23:50

posted by wap, platform: iPhone
鸡同鸭讲。
作者: richiter    时间: 2026-6-18 06:47

posted by wap, platform: Android
内存有没有上限不知道,有些没下限是真的,233
作者: shoukon    时间: 2026-6-18 07:20

posted by wap, platform: iPhone
笑死,我 16G 内存的 Mac mini M4,使
用 Codex 做本地Vibe Coding开发,整个系统做好并且部署上服务器了,也一点都不卡
你和 ChatGPT 聊天聊点什么能够聊到 10 个 G
作者: dragong    时间: 2026-6-18 08:19

手机都能用,怎么可能对电脑内存有要求
作者: jidatui    时间: 2026-6-18 08:53

posted by wap, platform: Android
我用的64g内存,就是上网和看片
作者: cc0128    时间: 2026-6-18 15:31

posted by wap, platform: iPhone
引用:
原帖由 @爱猫咪的薛定谔  于 2026-6-17 18:17 发表
上下文最多才百万token,而且在服务器端,本地要这数据没有用处,实在看不出占用g内存的理由
服务器存的是kv cache,本地的harness提供的context非常重要。
作者: yfl2    时间: 2026-6-18 15:42

引用:
原帖由 cc0128 于 2026-6-18 15:31 发表
posted by wap, platform: iPhone
服务器存的是kv cache,本地的harness提供的context非常重要。
看不懂,楼主用的是chatgpt的客户端,也没有用agent,所以你说的harness是干嘛的,而且这也不占用什么内存啊
作者: Adriatico    时间: 2026-6-18 20:54

posted by wap, platform: Samsung
确实,现在ue5游戏内存爆的比显存还快
作者: Lucifer6E    时间: 2026-6-19 11:42

posted by wap, platform: iPhone
这贴让我想起存片了,好久没见他了
作者: lvcha    时间: 2026-6-19 15:32

posted by wap, platform: Firefox
扯淡呢。
作者: haihai6    时间: 2026-6-30 15:19

posted by wap, platform: Chrome
网页版chatgpt确实,页面长了就卡,优化十分垃圾。 但是我感觉跟本地内存大小没关系,我48g内存,占不满也很卡。开新的对话就不卡了
作者: 香蕉一号    时间: 2026-6-30 17:00

posted by wap, platform: Chrome
引用:
原帖由 @Lucifer6E  于 2026-6-19 11:42 发表
这贴让我想起存片了,好久没见他了
疫情前永封了。
作者: taishen001    时间: 2026-6-30 17:35

posted by wap, platform: Android
道理都懂,问题是钱包允许不?
作者: sceic    时间: 2026-6-30 17:48

引用:
原帖由 shoukon 于 2026-6-18 07:20 发表
posted by wap, platform: iPhone
笑死,我 16G 内存的 Mac mini M4,使
用 Codex 做本地Vibe Coding开发,整个系统做好并且部署上服务器了,也一点都不卡
你和 ChatGPT 聊天聊点什么能够聊到 10 个 G
这个比喻不合理,相当于有钱老板说钱雇人搞定一切,他一条内存都不买。

[ 本帖最后由 sceic 于 2026-6-30 18:18 编辑 ]
作者: wifi王道    时间: 2026-6-30 20:15

银行存款也是越多越好




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0