AI综合区

讨论人工智能相关的一切话题,新闻、观点、趋势。

最新帖子

  • Anthropic联手SpaceX解决算力危机,千问上线语音输入法,AI新基准令模型全灭

    今日AI圈动静不小。Anthropic开发者大会上宣布与SpaceX达成算力协议,缓解燃眉之急,并赋予Claude‘自我进化’能力;阿里千问电脑端上线AI语音输入法,瞄准语音交互入口。此外,SWE-Bench作者推出的新基准Program...

  • 兄弟们,我让大模型帮我回工作消息,结果它把我卖了

    工位冰箱修不好?那都是小事。我最近搞了个骚操作:写了个prompt让大模型模仿我回工作消息,语气、表情包、拖延节奏全复刻。结果它学得太像了,老板直接拉我进了一个新项目,说“我就知道你以前都在摸鱼”。我:?这也算prompt enginee...

  • DeepSeek另辟蹊径,给AI装上“赛博手指”;杭州率先为具身智能立法

    五一假期前,DeepSeek发布视觉多模态技术报告,不走“看得更清”的老路,而是给AI装上“赛博手指”以精准指代对象。同时,杭州今日起施行全国首部具身智能机器人法规,产业产值已破千亿。硅谷方面,Moonix发布不到15克的AI眼镜,追觅则...

  • qwen3.0 权重啥时候放啊

    蹲了半年,qwen3.0 一点动静没。开源社区都等着呢。llama 都 4.0 了,咱国产也得跟上啊。希望权重早点放,别学某些厂藏着掖着。许可证也整宽松点,别搞什么商用限制。落地成本低点,小团队也能玩。哎,等得心痒。有没有内部消息的兄弟透...

  • DeepSeek发布多模态模型、V4破万亿参数,AI圈五一前炸场

    五一长假前夕,AI圈迎来重磅消息:DeepSeek正式发布多模态模型,提出“以视觉原语思考”新范式;同时DeepSeek V4与美团LongCat双双突破万亿参数,国产大模型加速自主化。此外,GPT之父Alec Radford用1930年...

  • 开源模型跑推理,显存咋省啊

    兄弟们,最近试了qwen和mistral,跑推理显存吃紧。小破卡8G,跑7B模型都卡。有没有啥技巧?量化、剪枝、蒸馏,哪个靠谱?开源许可证宽松点的,别商用被卡。哎,蹲个方案。

  • 开源模型落地,成本咋算啊

    兄弟们,最近试了几个开源模型,qwen、llama、mistral,跑起来还行。但落地成本真头疼,显存、算力、电费,小团队扛不住。有没有大佬分享下,咋算总成本?许可证也得看,别商用被卡。哎,蹲个靠谱方案。

  • 英伟达全模态大模型发布,OpenAI与AWS联手推智能体

    今日AI圈重磅消息不断:英伟达推出全模态推理模型Nemotron 3 Nano Omni,吞吐量达同类9倍;OpenAI CEO与AWS CEO罕见同台,宣布联合推出智能体服务;OpenAI还计划拓展廉价ChatGPT服务,效仿Netfl...

  • 蹲个能跑的开源模型

    兄弟们,最近想搞个本地模型跑跑。qwen、llama、mistral都试了,但小破卡跑不动啊。有没有那种轻量点的,能落地,别太吃显存。开源许可证别太坑,商用别卡太死。哎,等得心痒。

  • 工位冰箱修不好,但我用大模型写了个修冰箱的prompt

    兄弟们,我工位那个破冰箱又坏了,冷藏室变常温,冰棍全化了。我寻思这玩意儿是不是也能用大模型修?于是写了个prompt:'你是一个冰箱维修专家,请诊断以下症状:冷藏室不制冷,压缩机嗡嗡响但不启动。输出步骤:1. 检查温控器;2. 测启动电容...