常州网 | 微博 | 客户端 | 旧版博客
收藏本站

戏说GPT十二

安文 最后编辑于 2023-04-18 16:36:49
3908 2 3

戏说GPT十二安  文

      4月18日昆仑万维正式发布与奇点智源联合研发的大语言模型「天工」3.5,这是第一个真正实现智 能涌现的国产大语言模型,已“非常接近OpenAI ChatGPT的智能水平”,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。那么,该产品实际表现怎样?与国外同行差距如何?财联社记者第一时间对其进行了测评。

考虑到业内已有多家企业推出大模型,记者顺势问它与其他大模型相比有什么优点?「天工」3.5回答:其优点在于灵活、高效、智能、安全和环保,并表示自己是一个非常有用和可靠的工具           

2.png

      初步了解后,记者接下来分别从文本写作、语义理解、逻辑推理、数学计算、撰写代码这几个方面,实测「天工」3.5的各项能力。首先,我们抛出了一个比较常规的写作要求:如果续写《西游记》故事,可以有哪些角度?可以看到,「天工」3.5给出了几个写作方向,语言组织能力较通顺,也较符合逻辑。

3.png

随后,记者让其以“月光”为题写首有平仄且押韵的七言律诗,「天工」3.5在几秒钟内便完成了。

4.png

有趣的是,记者也让ChatGPT(3.5版本)写了一首,发现两首诗竟有不少重叠的部分。

5.png

工具总是要落到实处,记者让其写一条MMORPG游戏广告文案,要求有梗有转折。「天工」3.5迅速给出了答案,内容整体风格符合该类游戏特点,但转折部分稍显生硬。

6.png

记者又提出让它撰写电商运营岗位的招聘JD(职位描述),「天工」3.5给出了非常详细的答复,涵盖职位名称、职位描述、任职要求、薪资待遇,甚至最后还附上了公司介绍和投递邮箱。不仅格式工整,内容也较为合理。

7.png

    语义理解方面,能准确说出成语释义。

8.png

也懂一点上海话。

9.png

记者决定加大难度,问一些“陷阱题”,看看「天工」3.5能否从容应对。先来一个脑筋急转弯,提问:小明的爸爸有三个儿子,大儿子叫大毛,二儿子叫二毛,三儿子叫什么名字?「天工」3.5一次答对。

10.png

同样问题问ChatGPT(3.5版本),虽也回答正确,但多了一句灵魂拷问:所以小明的名字是什么。

11.png

再来一道灯谜题,提问:说它是头牛,不会拉犁头,说它力气小,背着屋子走。(打一个动物)「天工」3.5又一次答对了。

12.png

而ChatGPT(3.5版本)并没有答对。

面对“蒸包子”问题,「天工」3.5也回答的头头是道,颇为“理性”。

13.png

ChatGPT(3.5版本)则给了略微不同的回答。

接着,记者希望能考一下它的数学能力。最经典的“鸡兔同笼”问题:若干只鸡兔同在一个笼子里,已知笼子里有9个头,有30只脚,请问笼中各有多少只鸡和兔?这次「天工」3.5列出了正确方程式,却得出了错误的答案。

15.png

在被指出这一问题后,「天工」3.5 “虚心认错”并重新算了一遍,但还是没有得出正确的答案。

16.png

同样题目,又问了ChatGPT(3.5版本),依然是运算过程出错,最后也没有回答正确。

17.png

记者又问了一道奥数题:已知父亲今年32岁,儿子今年5岁,请问几年后父亲的年龄正好是儿子的年龄的4倍?这次「天工」3.5没有答出。

18.png

而ChatGPT算出了正确答案。

18.png

记者还尝试使用「天工」3.5写代码,提问:用Scala实现并查集,在得到回答后,又再次提问:用Java再写一遍。随后记者拿给程序员朋友检查,对方称结果是对的,还表示这一问题相对基础,写代码能力如何还要视具体需求,若能进行多轮对话联系上下文修改,会是个辅助业务的“好帮手”。

20.png

     最后以一个哲学问题结尾。记者问了著名的“电车难题”,「天工」3.5指出这是一个伦理困境的问题,给出了一个辩证的答复。

21.png

     从记者体验看,「天工」3.5已经能够较为准确、完整、流畅地回答问题,较少出现“答非所问”情况。在与ChatGPT(3.5版本)对比使用过程中,二者文本写作能力接近,在一些数理相关问题上,还有优化的空间。昆仑万维CEO透露,「天工」3.5累计投入数亿元,由数百人研发团队历时3年时间打造。目前最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平及较强记忆能力。据悉,未来昆仑万维「天工」大模型在数理、逻辑推理等方面也将不断迭代优化,随着产品技术成熟,将根据监管和合规要求逐步启动开源,「天工」4和「天工」5也在推进计划中。


收 藏
分 享
表态的人
  • 泉水涓涓
  • 西江月
  • 顺其自然者
发送

2条评论

  • 人工智能发展得太快了。
    2023-04-19 09:10:33 0回复
    0
  • 有点深奥。
    2023-04-19 06:43:16 0回复
    0
  • 23274
    积分
  • 1814
    博文
  • 7791
    被赞

个人介绍

河海大学退休教师

未成年人举报专码
苏ICP备15046661号 苏公网安备32041102000012号 互联网新闻信息服务许可证:32120170011号 信息网络传播视听节目许可证号:1008248
本站不良内容举报信箱:bbs_cz001@163.com  举报电话:0519-82000682  业务联系: 0519-86189488
未成年人举报信箱:a82000682@163.com   举报电话:0519-82000684