TGFC Lifestyle - Powered by Discuz! Board

标题: 以后确实内存越大越好，没上限 [打印本页]

作者: 随便走走 时间: 2026-6-17 16:52 标题: 以后确实内存越大越好，没上限

posted by wap, platform: Firefox
什么16G够用，24G舒服都过时了，就是越大越好，哪怕不是做开发的

最近和chatgpt聊天，聊一会就给我干到10G左右，出词都一卡一卡的，想想这个估计也没办法解决，未来趋势AI就是一个人工大脑，什么都要存在内存里最快，不可能思考过程还要读硬盘

普通人哪怕只用线上模型，未来的上下文窗口也是海量的，日积月累，这种体验很好，记忆的时间和内容越多越好，都是内存

作者: 爱猫咪的薛定谔 时间: 2026-6-17 17:08

posted by wap, platform: Android
上下文为啥要占用很大内存？

而且你用chargpt为啥要用本地内存？

本帖最后由爱猫咪的薛定谔于 2026-6-17 09:08 通过手机版编辑

作者: dzgxg 时间: 2026-6-17 17:11

posted by wap, platform: MAC OS X
网页版的chatgpt确实卡，尤其是富媒体内容多了之后

作者: hqqttjiang 时间: 2026-6-17 17:13

果然负激骚是有意义的

作者: 爱猫咪的薛定谔 时间: 2026-6-17 17:15

posted by wap, platform: Android

引用:

原帖由 @dzgxg 于 2026-6-17 09:11 发表
网页版的chatgpt确实卡，尤其是富媒体内容多了之后

为啥会占用本地内存？

作者: dzgxg 时间: 2026-6-17 17:23

posted by wap, platform: MAC OS X

引用:

原帖由 @爱猫咪的薛定谔于 2026-6-17 17:15 发表
为啥会占用本地内存？

网页占用啊，可以看到内存占用的，不管是gemini还是本地部署的openwebui，对话长了，占用的内存都会显著上升，gemini算优化比较好的，我最多用到过3g，然后切换到空对话闲置一段时间会降低回到几百m。所以网页使用ai比较适合用pwa方式，可以单独退出ai占用不影响其他页面

作者: 爱猫咪的薛定谔 时间: 2026-6-17 17:33

posted by wap, platform: Android

引用:

原帖由 @dzgxg 于 2026-6-17 09:23 发表
网页占用啊，可以看到内存占用的，不管是gemini还是本地部署的openwebui，对话长了，占用的内存都会显著上升，gemini算优化比较好的，我最多用到过3g，然后切换到空对话闲置一段时间会降低回到几百m。所以网页使用ai比较适合用pwa方式，可以单独退出ai占用不影响其他页面

原理是什么？我想不出有什么内容会占用内存，手机版一样用，也没说对配置有要求啊

作者: sigmaxion 时间: 2026-6-17 17:37

posted by wap, platform: VIVO
也就是以后的大宗消费不再是房车而是内存了么，人均100PB走起，祖宗十八代的陈谷子烂芝麻破事都要记得牢牢的

作者: 爱猫咪的薛定谔 时间: 2026-6-17 17:44

posted by wap, platform: Android

引用:

原帖由 @sigmaxion 于 2026-6-17 09:37 发表
也就是以后的大宗消费不再是房车而是内存了么，人均100PB走起，祖宗十八代的陈谷子烂芝麻破事都要记得牢牢的

现在商用的模型最大上下文也就百万token,存了也用不了

作者: 查理王 时间: 2026-6-17 17:49

posted by wap, platform: iPhone
我现在用的64G，确实用不完，开几个虚拟机也还剩很多

作者: 随便走走 时间: 2026-6-17 17:57

posted by wap, platform: iPhone

引用:

原帖由 @爱猫咪的薛定谔于 2026-6-17 17:08 发表
上下文为啥要占用很大内存？

而且你用chargpt为啥要用本地内存？

本帖最后由爱猫咪的薛定谔于 2026617 09:08 通过手机版编辑

你用过客户端吗，没用就杠？至于为什么，你去问OpenAI啊

作者: 爱猫咪的薛定谔 时间: 2026-6-17 18:05

posted by wap, platform: Android

引用:

原帖由 @随便走走于 2026-6-17 09:57 发表
你用过客户端吗，没用就杠？至于为什么，你去问OpenAI啊

你说说看啊，为啥会占用内存，那用网页版会怎么样

作者: 爱猫咪的薛定谔 时间: 2026-6-17 18:05

posted by wap, platform: Android

引用:

原帖由 @随便走走于 2026-6-17 09:57 发表
你用过客户端吗，没用就杠？至于为什么，你去问OpenAI啊

你说说看啊，为啥会占用内存，那用网页版会怎么样

作者: bsseven 时间: 2026-6-17 18:09

posted by wap, platform: Android
确实，我云游戏，一开光追，立马爆内存了，估计那光线太多，网速不够传输

作者: 随便走走 时间: 2026-6-17 18:10

posted by wap, platform: iPhone

引用:

原帖由 @爱猫咪的薛定谔于 2026-6-17 18:05 发表
你说说看啊，为啥会占用内存，那用网页版会怎么样

网页版我很久没用了，客户端原理很简单，一个对话session的全部聊天都在内存里，因为每一轮对话模型实际上都会根据历史对话形成上下文输入，所以全部对话都在内存里，你关掉重开就没有了，我最多一次都20多g了，都是最新版本。

作者: 爱猫咪的薛定谔 时间: 2026-6-17 18:17

posted by wap, platform: Android

引用:

原帖由 @随便走走于 2026-6-17 10:10 发表
网页版我很久没用了，客户端原理很简单，一个对话session的全部聊天都在内存里，因为每一轮对话模型实际上都会根据历史对话形成上下文输入，所以全部对话都在内存里，你关掉重开就没有了，我最多一次都20多g了，都是最新版本。

上下文最多才百万token,而且在服务器端，本地要这数据没有用处，实在看不出占用g内存的理由

作者: ginaamix 时间: 2026-6-17 18:37

posted by wap, platform: Chrome
就是codex优化不行

作者: 随便走走 时间: 2026-6-17 19:02

posted by wap, platform: Firefox

引用:

原帖由 @爱猫咪的薛定谔于 2026-6-17 18:17 发表
上下文最多才百万token,而且在服务器端，本地要这数据没有用处，实在看不出占用g内存的理由

token是token，缓存是缓存，token不会平白无故产生，其实还是来着缓存，这是很明显也很好理解的

而且随着智能体上下文空间越来越大，记忆内容肯定也越来越多，缓存必然也会相应膨胀

作者: 随便走走 时间: 2026-6-17 19:05

posted by wap, platform: Firefox

引用:

原帖由 @ginaamix 于 2026-6-17 18:37 发表
就是codex优化不行

你告诉我哪个agent或harness不占内存的，我现在就去换

作者: yfl2 时间: 2026-6-17 19:22

引用:

原帖由 随便走走 于 2026-6-17 19:02 发表
posted by wap, platform: Firefox
token是token，缓存是缓存，token不会平白无故产生，其实还是来着缓存，这是很明显也很好理解的

而且随着智能体上下文空间越来越大，记忆内容肯定也越来越多，缓存必然也会相应 ...

缓存在服务端，本地缓存有啥用？
而且缓存是为了再次命中，缓存大只会加快速度（如果命中就不需要重新算了），怎么会越来越慢？

作者: yfl2 时间: 2026-6-17 19:24

引用:

原帖由 随便走走 于 2026-6-17 19:05 发表
posted by wap, platform: Firefox
你告诉我哪个agent或harness不占内存的，我现在就去换

llm不占用啊，比如豆包...

作者: yfl2 时间: 2026-6-17 19:34

长对话卡顿的核心原因在于网页 DOM 节点过多。随着消息气泡、代码块、公式、图片及交互按钮的累积，浏览器在重排版、样式计算和内存管理上的压力显著增加。尤其是超过 30 至 50 轮的对话，离屏消息仍占用大量节点，导致交互性能下降。

喷了，和大模型上下文和缓存都没关系，就是页面太大了

作者: pocketmom 时间: 2026-6-17 19:37

posted by wap, platform: Android
1t内存的路过，跑本地deepseek模型只有18tokens

作者: 随便走走 时间: 2026-6-17 19:54

posted by wap, platform: iPhone

引用:

原帖由 @爱猫咪的薛定谔于 2026-6-17 18:05 发表
你说说看啊，为啥会占用内存，那用网页版会怎么样

作者: ginaamix 时间: 2026-6-17 20:06

posted by wap, platform: Chrome
cc和codex的聊天记录默认都是存在本地jsonl文件里，一个session撑死100MB不到，又不是本地跑LLM存kv cache哪里要这么多内存
codex肯定是有不少内存泄漏bug，随便一搜都是内存被吃满的例子
https://www.reddit.com/r/codex/comments/1tyiz7g/possible_codex_memory_leak_42gb_ram_usage_on_m4/

作者: 随便走走 时间: 2026-6-17 20:14

posted by wap, platform: iPhone

引用:

原帖由 @yfl2 于 2026-6-17 19:34 发表
长对话卡顿的核心原因在于网页 DOM 节点过多。随着消息气泡、代码块、公式、图片及交互按钮的累积，浏览器在重排版、样式计算和内存管理上的压力显著增加。尤其是超过 30 至 50 轮的对话，离屏消息仍占用大量节点，导致交互性能下降。

喷了，和大模型上下文和缓存都没关系，就是页面太大了

那为什么要留这些页面在内存里呢，你要不要再多问问ai

作者: dreamlost 时间: 2026-6-17 20:18

posted by wap, platform: Firefox
这种模型在远程本地还占用那么多内存的话肯定是有内存泄漏了

作者: yfl2 时间: 2026-6-17 20:27

引用:

原帖由 随便走走 于 2026-6-17 20:14 发表
posted by wap, platform: iPhone
那为什么要留这些页面在内存里呢，你要不要再多问问ai

你看看别人说的就知道了
你说的缓存什么都不在本地，和上下文也没有关系

这个程序不在意你本地的内存，它又不像微信只显示少部分内容，其他随着滚动再读取，所以导致当前页面不断膨胀，实际上，上下文早就不在了

[ 本帖最后由 yfl2 于 2026-6-17 20:28 编辑 ]

作者: 随便走走 时间: 2026-6-17 22:53

posted by wap, platform: Firefox

引用:

原帖由 @yfl2 于 2026-6-17 20:27 发表
你看看别人说的就知道了
你说的缓存什么都不在本地，和上下文也没有关系

这个程序不在意你本地的内存，它又不像微信只显示少部分内容，其他随着滚动再读取，所以导致当前页面不断膨胀，实际上，上下文早就不在了

上下文其实就是模型的记忆，记忆也分长期记忆和短期记忆，最终的上下文和长期记忆在云端没问题，但短期记忆很可能还是依赖本地，我试过切换一下设备，同账号比如从桌面端到手机端，模型对刚刚提到的内容都健忘失忆了

因此本地缓存和短期记忆还是有关的，不会完全不参与模型交互

作者: yfl2 时间: 2026-6-17 23:06

引用:

原帖由 随便走走 于 2026-6-17 22:53 发表
posted by wap, platform: Firefox
上下文其实就是模型的记忆，记忆也分长期记忆和短期记忆，最终的上下文和长期记忆在云端没问题，但短期记忆很可能还是依赖本地，我试过切换一下设备，同账号比如从桌面端到手机端， ...

本地没有记忆，因为不参与计算，只是让你看聊天历史而已，存硬盘上也不影响

你切换设备失去上下文，是因为服务方就是这么设置的，同一设备新开一个窗口，上下文都能清空

你想想看，你本地10g“短期记忆”，给openai处理吗？233

[ 本帖最后由 yfl2 于 2026-6-17 23:08 编辑 ]

作者: 焚岚 时间: 2026-6-17 23:50

posted by wap, platform: iPhone
鸡同鸭讲。

作者: richiter 时间: 2026-6-18 06:47

posted by wap, platform: Android
内存有没有上限不知道，有些没下限是真的，233

作者: shoukon 时间: 2026-6-18 07:20

posted by wap, platform: iPhone
笑死，我 16G 内存的 Mac mini M4，使
用 Codex 做本地Vibe Coding开发，整个系统做好并且部署上服务器了，也一点都不卡
你和 ChatGPT 聊天聊点什么能够聊到 10 个 G

作者: dragong 时间: 2026-6-18 08:19

手机都能用，怎么可能对电脑内存有要求

作者: jidatui 时间: 2026-6-18 08:53

posted by wap, platform: Android
我用的64g内存，就是上网和看片

作者: cc0128 时间: 2026-6-18 15:31

posted by wap, platform: iPhone

引用:

原帖由 @爱猫咪的薛定谔于 2026-6-17 18:17 发表
上下文最多才百万token,而且在服务器端，本地要这数据没有用处，实在看不出占用g内存的理由

服务器存的是kv cache，本地的harness提供的context非常重要。

作者: yfl2 时间: 2026-6-18 15:42

引用:

原帖由 cc0128 于 2026-6-18 15:31 发表
posted by wap, platform: iPhone
服务器存的是kv cache，本地的harness提供的context非常重要。

看不懂，楼主用的是chatgpt的客户端，也没有用agent，所以你说的harness是干嘛的，而且这也不占用什么内存啊

作者: Adriatico 时间: 2026-6-18 20:54

posted by wap, platform: Samsung
确实，现在ue5游戏内存爆的比显存还快

作者: Lucifer6E 时间: 2026-6-19 11:42

posted by wap, platform: iPhone
这贴让我想起存片了，好久没见他了

作者: lvcha 时间: 2026-6-19 15:32

posted by wap, platform: Firefox
扯淡呢。

作者: haihai6 时间: 2026-6-30 15:19

posted by wap, platform: Chrome
网页版chatgpt确实，页面长了就卡，优化十分垃圾。但是我感觉跟本地内存大小没关系，我48g内存，占不满也很卡。开新的对话就不卡了

作者: 香蕉一号 时间: 2026-6-30 17:00

posted by wap, platform: Chrome

引用:

原帖由 @Lucifer6E 于 2026-6-19 11:42 发表
这贴让我想起存片了，好久没见他了

疫情前永封了。

作者: taishen001 时间: 2026-6-30 17:35

posted by wap, platform: Android
道理都懂，问题是钱包允许不？

作者: sceic 时间: 2026-6-30 17:48

引用:

原帖由 shoukon 于 2026-6-18 07:20 发表
posted by wap, platform: iPhone
笑死，我 16G 内存的 Mac mini M4，使
用 Codex 做本地Vibe Coding开发，整个系统做好并且部署上服务器了，也一点都不卡
你和 ChatGPT 聊天聊点什么能够聊到 10 个 G

这个比喻不合理，相当于有钱老板说钱雇人搞定一切，他一条内存都不买。

[ 本帖最后由 sceic 于 2026-6-30 18:18 编辑 ]

作者: wifi王道 时间: 2026-6-30 20:15

银行存款也是越多越好

欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/)