网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
02月26日
漏签
0
天
deepseek吧
关注:
99,133
贴子:
163,671
看贴
图片
吧主推荐
游戏
1
2
3
4
5
6
下一页
尾页
75
回复贴,共
6
页
,跳到
页
确定
<返回deepseek吧
>0< 加载中...
市面上具有代表性的22款模型深度测评
取消只看楼主
收藏
回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
之前发过一个测评帖,坑开的有点大,出现了各种问题,所以整理了一下重新开一个。
测试包括市面上具有代表性的22款优秀模型,20个问题,共440多轮对话,涵盖各个方面进行全面的总结。
送TA礼物
IP属地:陕西
1楼
2025-02-17 22:43
回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
测了一部分了已经,贴吧排版太难受了,我先测完整理好再发。
IP属地:陕西
3楼
2025-02-17 22:48
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
总算测完了
IP属地:陕西
来自
Android客户端
6楼
2025-02-19 09:41
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
坑开的太大了全文总结了5万多字,我勒个天。
IP属地:陕西
来自
Android客户端
7楼
2025-02-19 09:44
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
本来我寻思给百度的面子加了一个百度的免费小模型。然后发现那玩意儿是真的不行,然后换成通义千问的一个小模型了。
IP属地:陕西
来自
Android客户端
8楼
2025-02-19 09:45
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
IP属地:陕西
9楼
2025-02-19 09:46
回复(2)
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
IP属地:陕西
10楼
2025-02-19 09:47
回复(1)
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
先介绍以下参赛选手。
deepseek全家桶自不必多说
Anthropic,openai,谷歌家的旗舰也很出名
IP属地:陕西
11楼
2025-02-19 09:48
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Doubao-1.5-vision-pro和qwen2.5-vl-72b大家可能不太熟,算是国内乃至国际最强的两个视觉模型了。除去GPT这样的多模态大模型,他俩的识别能力可以说是天花板了。
有时候deepseek没有图像输入能力就很难受,就可以试试他俩,语言能力也不差,视觉能力顶呱呱
IP属地:陕西
12楼
2025-02-19 09:51
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Llama-3.3-70b和deepseek-70b应该是一个模型,然后从r1蒸馏的参数。可以对比一下看看进步大不大
IP属地:陕西
13楼
2025-02-19 09:52
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
doubao-1.5-lite,gpt-4o-mini以及qwen-Turbo都是蛮好用的轻量级模型,价格都在1元/百万token以内,非常划算。不需要太高智商的话,单纯问个问题聊聊天啥的,或者当个翻译工具足矣。
IP属地:陕西
14楼
2025-02-19 09:54
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
第一题,豆包的视觉模型拉跨了,其余全对。
其实这一题不太能代表什么,就是一个幻觉而已。看个乐子吧。
IP属地:陕西
15楼
2025-02-19 09:56
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
2,3题也一样,代表不了什么智商。尤其是第三题,全军覆没,只能说现在的AI缺乏常识。
deepseek1.5B数字母都能数对,和智商关系不大的。
IP属地:陕西
16楼
2025-02-19 09:59
回复(8)
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
个人感觉Claude不一定是最聪明的,但是是最能体会用户潜台词的模型。
豆包这一题发挥也还行。
总结太多了,大伙看个分儿就行了
IP属地:陕西
17楼
2025-02-19 10:03
回复
收起回复
社會主义好
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
前五题用处都不大,体现不出智商。
这题以前是个经典的幻觉,现在基本都修复了。
deepseek-7B和1.5B实际上不是识别不出来,是话都说不利索。
IP属地:陕西
19楼
2025-02-19 10:06
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
王祖贤在贴吧官宣创业
2589090
2
表白收到摩斯密码怎么破
2027245
3
AL淘汰JDG晋级决赛
1885324
4
分享我和妹妹难以启齿的故事
1604205
5
南师大博士女友出轨已婚导师
1138878
6
特朗普被说是俄国克格勃特工
960075
7
娜可露露重做野区霸主归来
845160
8
崩坏3.2遐蝶技能强度爆炸
629119
9
未来的农村宅基地还值钱吗
462946
10
尹锡悦的最终时刻即将到来
461055
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示