上线App Store,背后正是由此前火爆全网的“国产之光”DeepSeek V3模型提供支持。
支持用户完成对话、语言翻译、创意写作、编程、解题、文献解读、旅行规划等用途,相当于说是网页版的各种功能都支持。
最后再来试试那个经典话题,Strawberry有多少个r,结果它就是开启了深度思考模式,也还是没搞清楚。。
App背后的模型正是前段时间爆火的DeepSeek V3——以1/11算力训练超越Llama 3的模型,震撼一整个AI圈。
它是一个参数量为671B的MoE模型,激活37B,在14.8T高质量token上进行了预训练。
而如果要平衡性能和成本,它成了DeepSeek官方绘图中唯一闯进“最佳性价比”三角区的模型。
0 条