0605 版本则在 AIDER Polyglot 等基准测试中继续领先,同时在 GPQA 和人类终极考试(HLE)等极具挑战性的基准测试中表现出“顶级性能”,这些测试评估了模型的数学、科学、知识和推理能力 …
Tag: DeepSeek
AI coding 这条 AI 行业今年的主线,在最近这段时间愈发清晰。除了上周刷屏的编程新王 Claude Opus 4 ,新版 DeepSeek R1 也把更新重点也放在了代码能力 …
OpenAI CEO Sam Altman再度走进美国国会山,面对AI监管、全球竞争、产业基础设施等敏感议题,做出了一系列直接回应。他不仅点名了DeepSeek…
小米推出专注推理能力的开源大模型MiMo,仅用7B参数规模在数学推理和代码竞赛测评中超越OpenAI的闭源模型o1-mini以及阿里32B规模的QwQ。
今天凌晨五点,Qwen 3 正式发布和开源,make China great again !省流版重点信息汇总…
DeepSeek 凭借其 R1 模型席卷 AI 世界之后,目前正在准备发布一款据称性能得到大幅改进的全新 DeepSeek R2 模型。
“周周有发布,天天有更新。”这是百度创始人李彦宏最新对大模型竞速的感慨,但……卷王实际就是百度自己,因为就这一个多月…
我用 AI Coding 工具手搓了一个 iOS App,并且上架了 App Store,App 的名称叫做「SafeMark」。一款专为身份证等证件图片加水印的小工具,图片处理均在本地处理,保证信息安全,适合在转发证件信息时使用。