虚竹 发表于 2025-2-14 11:53:45

想了解 AI 大模型,包括 deepseek 的,可以进来咨询,我懂这里面的技术问题

前端时间看了一遍国外的万字论文,基本摸清楚了 deepseek 的细节了。

uoxrious 发表于 2025-2-14 12:00:19

除了API,有什么好的接入方式或者调用方式
本地部署除外,性价比太低

慧交艺 发表于 2025-2-14 13:25:23

斯坦福李飞飞是蒸馏。
DEEPSEEK也是蒸馏

补天 发表于 2025-2-14 13:33:44

底层算法什么原理?

这个搞不懂。

2014 发表于 2025-2-14 13:36:49

补天 发表于 2025-2-14 13:33
底层算法什么原理?

这个搞不懂。

1+1=3这样的

九手 发表于 2025-2-14 14:59:02

请教 :

我在生活中能用它做什么?

虚竹 发表于 2025-2-14 15:23:02

补天 发表于 2025-2-14 13:33
底层算法什么原理?

这个搞不懂。

这个问题太宽泛了,不好几句解释清楚。补帝可以先花 2 个小时了解一下 AI 的基础深度学习,然后就可以沟通具体问题了。你是程序员,理解起来没那么困难。

虚竹 发表于 2025-2-14 15:26:15

九手 发表于 2025-2-14 14:59
请教 :

我在生活中能用它做什么?

用处太多了,你可以百度一下。医疗,机器人,自动驾驶,普通人可以用来文生图,可以搜索问答

王老板 发表于 2025-2-14 16:31:08

chatgpt的蒸馏,不是什么创新,天花板就是gpt
打个比方说就是在抖音的基础上开发了一个抖音极速版
在使用效率和成本上有所降低,方便了普通用户

牛十八 发表于 2025-2-14 16:59:58

对du徒有无帮助

俺也一样 发表于 2025-2-14 17:04:06

小和尚啥都懂一点,就是不懂投机

虚竹 发表于 2025-2-14 17:29:41

王老板 发表于 2025-2-14 16:31
chatgpt的蒸馏,不是什么创新,天花板就是gpt
打个比方说就是在抖音的基础上开发了一个抖音极速版
在使用效 ...

看来你没有仔细看 deepseek 的论文,蒸馏这只是 deepseek 的一个小小发现,不值一提,deepseek 的贡献很大的。

交钱哥放人 发表于 2025-2-14 18:12:32

虚竹不懂装懂

姐姐我错了 发表于 2025-2-14 18:19:06

你懂个✓八

够猴一万亿哦 发表于 2025-2-14 18:20:30

说deepseek靠蒸馏的都是二傻

刘三荣 发表于 2025-2-14 20:14:49

Deepseek老是繁忙,就用集成了deepseek的腾讯元宝了,差不多
页: [1]
查看完整版本: 想了解 AI 大模型,包括 deepseek 的,可以进来咨询,我懂这里面的技术问题