想了解 AI 大模型,包括 deepseek 的,可以进来咨询,我懂这里面的技术问题
前端时间看了一遍国外的万字论文,基本摸清楚了 deepseek 的细节了。 除了API,有什么好的接入方式或者调用方式本地部署除外,性价比太低 斯坦福李飞飞是蒸馏。
DEEPSEEK也是蒸馏 底层算法什么原理?
这个搞不懂。 补天 发表于 2025-2-14 13:33
底层算法什么原理?
这个搞不懂。
1+1=3这样的 请教 :
我在生活中能用它做什么?
补天 发表于 2025-2-14 13:33
底层算法什么原理?
这个搞不懂。
这个问题太宽泛了,不好几句解释清楚。补帝可以先花 2 个小时了解一下 AI 的基础深度学习,然后就可以沟通具体问题了。你是程序员,理解起来没那么困难。 九手 发表于 2025-2-14 14:59
请教 :
我在生活中能用它做什么?
用处太多了,你可以百度一下。医疗,机器人,自动驾驶,普通人可以用来文生图,可以搜索问答 chatgpt的蒸馏,不是什么创新,天花板就是gpt
打个比方说就是在抖音的基础上开发了一个抖音极速版
在使用效率和成本上有所降低,方便了普通用户 对du徒有无帮助 小和尚啥都懂一点,就是不懂投机 王老板 发表于 2025-2-14 16:31
chatgpt的蒸馏,不是什么创新,天花板就是gpt
打个比方说就是在抖音的基础上开发了一个抖音极速版
在使用效 ...
看来你没有仔细看 deepseek 的论文,蒸馏这只是 deepseek 的一个小小发现,不值一提,deepseek 的贡献很大的。 虚竹不懂装懂 你懂个✓八 说deepseek靠蒸馏的都是二傻 Deepseek老是繁忙,就用集成了deepseek的腾讯元宝了,差不多
页:
[1]