奔走相告汽车评测app(汽车评测哪个app最权威)
信息来源:互联网 发布时间:2023-10-01
上周国内主流大模型应用研究公司陆续发布了它们的大模型APP,本文将对目前热度较高的几款APP进行功能测评,一起来看看各家的表现吧。测评对象:讯飞
上周国内主流大模型应用研究公司陆续发布了它们的大模型APP,本文将对目前热度较高的几款APP进行功能测评,一起来看看各家的表现吧测评对象:讯飞星火(科大讯飞)、文心一言(百度)、豆包(字节)【初始问题】。
请对大模型APP文心一言、讯飞星火和豆包进行功能对比分析,并进行推荐。讯飞星火
首轮沟通失败后,让它换个角色尝试,还是失败
文心一言
续上
续上
续上
每款产品都有优缺点,也算是面面俱到的同时又有点不同的侧重了,不过豆包不是字节研发的么,回答准确性待验证豆包
这个写的确实比较通俗易懂,便于抓住重点,但事实如何且待接下来的问题验证!对比总结:讯飞的回答虽然没有问题,但对自己的定位略微死板,这样怎么还能和用户友好的玩cosplay呢;文心一言面面俱到(罗里吧嗦),但内容一多,上下文就容易出现自相矛盾,不合逻辑的地方,对用户来说就有点困扰了(要检查一堆内容准确性);豆包回答更为简洁明了,如果准确性也没太大问题就OK了。
【顾问型问题】帮助我识别汽车行业中的新兴趋势和发展,并建议如何调整我的技能和知识以保持领先地位。讯飞星火
主流趋势:电动化、网联化、自动驾驶和新能源基础设施文心一言
续上
除了讯飞的电动智能网联,还补充了轻量化和循环经济设计豆包
范围最少,但重点都有,文下列了出处,这一点做的更细致对比总结:三个模型的回答都还OK,基本都是按点分类进行文本的结构化呈现,其中讯飞的总结话术更符合自然语言的交流习惯,文心一言的列举最为全面,内容充分但有时需再次归纳总结,豆包回答最为聚焦,且有文章出处,便于说明引用,但建议内容有些重复,不够精炼。
【算术类问题】:小明在静水中划船的速度为10千米/时,今往返于某条河,逆水用了9小时,顺水用了6小时,求该河的水流速度。(初中数学)讯飞星火
看着像模像样,可惜方程解错文心一言
回答正确!豆包
方程都没列对,题意还未识别准确对比总结:文心一言最优,讯飞次之,豆包次次之【逻辑推理型】测算每天进入虹桥火车站的电动车有多少?讯飞星火
文心一言
豆包
对比总结:大家目前都不具备复杂逻辑推理能力,主要还是基于现有的公开信息,进行拼接重组或提炼总结只是讯飞的建议更像是听懂了我想干嘛以上是对三款大模型APP在顾问式问答、基础计算和逻辑推理三个方面的对比总结。
callback豆包对初始问题的回答:“文心一言的回答通常比较全面,能够提供多种可能性和解释”、“讯飞星火的回答通常比较简洁明了,适合快速获取信息”、“豆包的回答通常比较有趣,能够与用户进行良好的互动”,本轮测试下来感觉。
文心确实更全面但不一定准,可做启发与参考;讯飞回复比较简洁,且更自然,更有对话感觉;豆包回复最为精炼简单,但没有感觉到有趣不过本次测试问题有限,结果可能有失偏颇,请大家按需采纳~接下来会持续对其进行文本加工、文案生成及图形绘画等功能的测评对比,欢迎感兴趣的小伙伴持续关注。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186

