不看后悔!国内AI大比拼的精彩看点全汇总

至2022年AI爆发后,在中国已催生了上千个AI产品。

这些产品涵盖了从头部大厂到高等院校,再到初创企业的广泛阵容。

如:

  • 大厂:百度文心、阿里通义、腾讯元宝、字节豆包、讯飞星火等
  • 高校:清华大学、北京大学等
  • 初创:月之暗面KIMI、深度求索DeepSeek也已崭露头角,推出了独具特色的AI产品。

到这里有个问题就浮现了,应该选择哪个AI,哪个AI适合自己?

这里是清华SuperBench的测评数据

类似这样的测评报告互联网上已经很多,真正哪个合适自己还是自己尝试一下

以下是个人的一些经验分享让大家少走些路,仅供参考一下:

目前在国际上顶端的还是gpt4与claude 3,国内主要就是文心4与清华GLM-4。

在国内选择的话:

  • 如果花钱的话,可以选择文心一言4.0
  • 免费AI
    • 考虑到综合能力的话可以选择字节的豆包
    • 只考虑文本类的话deepseek也是不错的选择
    • 偏搜索引擎类的话秘塔AI、KIMI

前期文心一言3.5的表现的确是很差,可以对比自己之前问的问题,差别是非常大的。之前胡说八道的回答还是比较多的,现在比如增加了联网搜索等功能,可以说文心一言已经迭代级了很多。

这里我选择其中的5个AI产品进行对比

一、信息更新程度

在信息更新程度来说通义千问与豆包的表现非常好,当然这个测试还是比较片面的,大家可以在遇到其它时效性问题时也进行对比一下。

以下是具体的对比情况:

问题一

2024年福建高考录取分数线?

此问题是在2024年06月24日16时26分公布的,问题是在公布后5分钟左右内问的

目前国内关注性最高的应该就是高考分数线公布与填写高考志愿了。目前已经有几个省公布了高考分数线,刚才看了一下最近2024年06月24日16时26分福建省也公布了分数线,这是福建省教育考试院官方网截图。

我们来看看几款国内的AI产品的信息更新情况:

1)文心一言3.5&4.0

  • 文心一言3.5

物理类431分,是不对的。

历史类453分,也是不对的,可以看到括号里的说明,它已经找到了正确的文章2分数是正确的,还找到文章3是错误的分数,然而最后AI判断后选择了错误的文章3的结果。

  • 文心一言4.0

文心一言4.0能给出正确的答案,实时度非常的高。

2)通义千问

通义千问输出的结果是对的,不但输出的2024年正确的结果,同时还给出了历年的分数线数据。

3)KIMI

KIMI没有查询到福建省的高考录取分数线。

4)豆包

豆包也能正确的输出答案,同时也给出了近几年的录取分数线。

5)DeepSeek

显然deepseek的知识库和以上的几款AI是不同的,它不是实时的它是截至2023年的知识库。

问题二

2024年上海高考录取分数线?

此问题是在2024年06月23日13时42分公布的,问题是在公布后1天后问的

看看上海的分数线,公布的比较早是2024年06月23日13时42分公布的,这是上海市教育考试院官方网截图。

只要是知识库是实时的,基本是对的

二、图片解析能力


通过一张网络上流传的比较广的一张图
 


这张“不干了”的图片,看看AI们是如何解析它的
1)文心一言3.5
文心一言3.5支持上传word、pdf及图片格式的文件,上传图片后它可以解析出图片中木板上刻着“不幹了”字样,但无法给不出图片中描述的是哪些历史人物。


2)文心一言4.0
文心一言4.0也可以识别出木板上的文字,同时进了一步就是把繁体“不幹了”翻译成简体“不干了”。同样也无法给不出图片中描述的是哪些历史人物。


3)通义千问


识别出来的是“不辩了”,识别能力还是不行


4)KIMI


KIMI支持上传pdf、doc、xlsx、ppt、txt、图片等文件,没有识别出木板上的文字


5)豆包


豆包支持的文件类型:PDF、Docx、xlsx、txt、pptx、csv。所以我把图片放到docx里再上传给豆包。它可以识别出木板上的文字


6)Copilot
看完这些后或许得到的结论就是AI只能识别出木板上的文字,推理不出描述的是哪位历史人物,我们来看看微软的Copilot的回答。鲁迅终于出现了。。。。
 

三、图像生成功能


生成以下要求的图片:
中国古代女子,女子有几缕青丝垂于耳畔,头上插着一支玉簪,簪头镶嵌着一颗小巧的珍珠,闪烁着温润的光泽。
1)文心一言3.5
 


2)文心一言4.0
 


3)通义千问
 


4)豆包
 


生成图片方面个人感觉还是豆包比较符合审美风格

小结

以上都是一些非专业的对比,只是基于个人的使用体验。当然也有一些机构输出也专业的测试报告。

比如:这份《中文大模型能力评测榜单》综合能力得分为分类能力、信息抽取能力、阅读理解能力、数据分析能力四者得分的平均值。

其实可以看到不同机构输出的报告都有所不同,最终怎么样我们可以自己试试。

https://www.zhihu.com/question/658607807/answer/3549831881

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/770685.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

.NET 漏洞分析 | 某ERP系统存在SQL注入

01阅读须知 此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等(包括但不限于)进行检测或维护参考,未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失&#xf…

JAVA导出数据库字典到Excel

文章目录 1、查询某张表字段信息2、TableVo接收sql查询得到的数据3、excel导出4、导出案例 1、查询某张表字段信息 select column_name as columnName, -- 字段名 COLUMN_DEFAULT as colDefault, -- 默认值 column_key as columnKey, -- PRI-主键,UNI-唯一键&…

机器学习原理之 -- 朴素贝叶斯分类器:由来及原理详解

朴素贝叶斯(Naive Bayes)分类器是一类基于贝叶斯定理(Bayes Theorem)的简单而有效的概率分类算法。由于其假设特征之间的条件独立性,因此被称为“朴素”贝叶斯分类器。尽管这种独立性假设在现实中很少完全成立&#xf…

VSCode使用ipynb文件高效地进行功能测试

一、ipynb是什么文件 .ipynb文件是Jupyter Notebook的专用格式,它允许用户在一个网页应用中混合编写Markdown文本、执行代码、查看输出结果及图表。Jupyter Notebook的本质是一个Web应用程序,支持运行40多种编程语言,包括Python。它的主要用…

Elasticsearch运维系列_ES之max_result_window 含义-对性能影响及参数调整

如果你觉得这篇文章能给你带来收获,请关注我公众号: 这篇文章主要给大家介绍max_result_window参数及其对性能影响。 Part1 背景描述 当前某个业务xxxdb单个索引值较大,每日单个索引大小在二三百G,当前索引保留15天,如果拉取一个…

初入Node.js必备知识

Node.js因什么而生,作用是干什么? Node.js是一个用c和c打造的一个引擎,他能够读懂JavaScript,并且让JavaScript能够和操作系统打交道的能力 JavaScript 原本只能在浏览器中运行,但随着Web应用程序越来越复杂,仅靠客户端JavaScri…

零基础入门怎么学习老挝语字母表?《老挝语翻译通》App真人发音教学,学习老挝语字母发音和词汇句子!

这段老挝文字翻译成中文是什么意思?有什么好用的老挝语翻译工具推荐吗? 快速翻译:中老语言无缝转换,实时翻译,让沟通更流畅。 学习工具:零基础入门到流利对话,老挝语真人发音,让你的…

MacOS 安装 mtr 网络检测工具

Install sudo brew install mtr sudo chown root $(which mtr) sudo chmod us $(which mtr) sudo chown root $(which mtr-packet) sudo chmod us $(which mtr-packet) Test mtr google.com

Build a Large Language Model (From Scratch)附录E(gpt-4o翻译版)

来源:https://github.com/rasbt/LLMs-from-scratch?tabreadme-ov-file https://www.manning.com/books/build-a-large-language-model-from-scratch

VTK学习日志:基于VTK9.3.0+Visual Studio c++实现DICOM影像MPR多平面重建+V R体绘制4个视图展示功能的实现(二)

前段时间对VTK9.3.0进行了编译,开发了MPRVR实现的demo,显示效果不是很理想,正好趁着周末有时间,再度对之前的程序进行优化和完善,先展示下效果: VTK实现MPRVR四视图 再次讲解下基于VTK的MPRVR实现的简单项目创建过程&a…

Kamailio-命令行指令kamctl与kamcmd

前文也有提到几种指令的用处,与web页面相比,它就是更原始、面向运维的,正常如果有管理页面也需要使用到: kamailio - SIP 服务器脚本kamdbctl - 创建和管理数据库的脚本,比如你使用MySQL作为其存储时就需要使用到这个…

每天五分钟计算机视觉:人体姿势识别

本文重点 人体姿势识别是计算机视觉领域的一个重要研究方向,旨在通过图像或视频数据自动检测并识别出人体的各种姿势和动作。随着深度学习技术的快速发展,基于神经网络的方法在这一领域取得了显著进展。神经网络,特别是卷积神经网络(CNN)和循环神经网络(RNN),因其强大…

安装opencv-python出错,怎么办?

安装opencv-python出错 解决方法: 具体版本号,python3.6对应的就是4.3.0.38 pip install opencv-python4.3.0.38 -i https://pypi.tuna.tsinghua.edu.cn/simple

检测水管缺水的好帮手-管道光电液位传感器

管道光电液位传感器是现代清水管道管理中的重要技术创新,不仅提高了检测液位的精确度,还解决了传统机械式和电容式传感器存在的诸多问题,成为检测管道缺水的可靠利器。 该传感器采用先进的光学感应原理,利用红外光学组件通过精密…

2G 3G 4G常用知识点

名词解释 LTE网络、WCDMA网络、2G、3G 4G 区别及联系? 2G (第二代移动通信技术) 2G是最早的数字移动电话标准,主要支持语音通话和短信服务。代表性技术有GSM (Global System for Mobile Communications) 和CDMA (Code Division Multiple Access)。 3G (第三代移动…

相亲交友APP系统婚恋交友社交软件开发语音视频聊天平台定制开发-婚恋相亲交友软件平台介绍——app小程序开发定制

互联网飞速发展的时代,相亲交友软件成为了许多年轻人首选的相亲方式,越来越多的单身男女希望在婚恋交友软件平台上寻找灵魂伴侣,相亲交友软件因此具有很高的市场价值。 多客婚恋相亲交友系统是一款定位高端,到手就能运营的成熟婚恋…

Java入门编码10个注意点,大家注意“避坑”

插: AI时代,程序员或多或少要了解些人工智能,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家(前言 – 人工智能教程 ) 坚持不懈,越努力越幸运,大家…

FileZilla的安装和使用(快速上手版)

下载 登陆官网下载下载 - FileZilla中文网 服务端 我们选择一个中文安装最新版本下载 客户端 我们选择绿色免安装版进行下载 安装 安装服务端 双击运行下载好的服务端安装包 点击 我接受 点击 下一步 设置好安装路径,点击 下一步 这里默认即可,点击…

智慧园区可视化:构建全方位智能管理体系

通过图扑的 2D、 3D 和 GIS 可视化技术结合倾斜摄影、数字孪生和视频融合等技术,将园区各类数据集成展示,实时监控和分析环境与设施状况,提升管理效能和安全水平,实现智慧园区的全方位智能化运营。

属性加密技术:保障数据安全的新利器

随着信息技术的飞速发展,数据安全已成为我国乃至全球关注的焦点。在众多数据安全技术中,属性加密技术以其独特的优势,逐渐成为保障数据安全的新利器。本文将从属性加密技术的原理、特点及其应用场景三个方面进行介绍,以期为读者提…