国产大模型ToB应用哪家强?IDC公布第一梯队,商汤日日新表现突出
6月12日,国际数据公司IDC发布《中国大模型市场主流产品评估,2024》,从基础能力到应用能力7大维度对11家大模型厂商的16款市场主流产品进行实测。
结果显示:商汤日日新5.0位列第一梯队,商汤旗下生成式AI产品“商量”和“秒画”不仅在问答理解类、推理类、创作表达类、数学类等多个维度的基础能力上表现突出,还在toB特定行业类的应用能力方面具备领先优势。
这是IDC首次对国产大模型进行测评,采取了实测的方式,并成立产品测试团队,通过多个维度对基础大模型及相关产品进行评测,并邀请外部专家团队深入分析各个产品答案准确性、合理性等,在审核委员会的监督下,最终得出各厂商的评估结果,供用户选型参考。
作为进入实测评分最高的大模型之一,商汤科技被IDC列为第一梯队,“日日新5.0”大模型及AI产品商量、秒画在基础能力方面表现出色:
在基础能力-问答理解方面,其常识、专业知识表现突出,助力用户准确获取信息;
在基础能力-推理方面,其情感推理、逻辑推理、归纳推理等能力优越,可以帮助人更加深入地理解事物,发现新的问题和解决方案;
在基础能力-创作表达方面,其内容文字创作&创意等细分维度具备优势,产品成熟度高;
在基础能力-数学方面,处理高中数学、高等数学等高阶数学题目时表现突出;
在基础能力-代码方面,其生成代码文档能力具备优势;
而应用方面,IDC报告还指出商汤“日日新5.0”大模型体系及产品在面向toB行业、解决行业的实际应用问题的能力具备优势,尤其是在咨询服务(财报分析&市场分析)、互联网/媒体营销、零售/电商、医疗等toB特定行业。
事实上,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代,并将先进的大模型能力转化为落地实际场景的产品应用,在金融、手机、医疗、电信、汽车、地产、能源、传媒、工业制造等众多垂直行业,已与上海电信、小米小爱、金山办公、海通证券、筑梦岛等超过500家客户建立深度合作,助力千行百业的企业解决实际应用难题。