DeepSeek 推出 236B 混合专家模型

来自 DeepSeek,作者 LocalLLM_Fan,评论 0 条。

这个体量本地是跑不动了,不过 API 价格真的很良心。有人测过长上下文效果吗?

这个体量本地是跑不动了,不过 API 价格真的很良心。有人测过长上下文效果吗?