常州网 | 微博 | 客户端 | 旧版博客
收藏本站

也说GPT之一:各国GPT实力现状(2)

安老师的学生 最后编辑于 2023-11-04 09:59:45
2445 6 1

也说GPT之一:各国GPT实力现状(2)

安老师的学生

测试时间:2023年11月3日

晚上正准备吃饭,收到了表姐发来的微信,问我忙不忙,说如果有空的话让我帮忙看看外甥的卷子有没有做错的,她自己拿不准,害怕误导了孩子。外甥是她家二胎,今年五年级,五年级的题目本不会有多难,然而表姐已经丢了书本整整二十年,辅导起来难免有些吃力。

其实这也是很普遍的现象,真正能在学业上辅导孩子的家长并不在多数。小学能辅导的,到了初中又辅导不了了,初中能辅导的,到了高中也是犯难。如果家长本身不是211、985出来的,就意味着家长本人在18岁那年做高考的题目也不过得六七十分、四五十分(按满分100分算),在20年后,当年的知识也忘了七七八八了,又如何能来辅导别人。以江苏省为例,2022年211的录取率也不过5.19%,这意味着有能力把孩子从小学辅导到高中的家长也就5%左右。

表姐其实也是第一次向我求助,过去她在孩子教育这块儿都是放养,主要依仗学校老师,自己最多在假期的时候给孩子报个补习班就算完事,孩子成不成才皆是随缘,颇有点无为而治的意思。而我呢,因为叔家、姑家的弟弟妹妹们都是小时聪明,长大后却于上学读书一道一塌糊涂,所以我慢慢地就只关心他们未来的生计如何,对诸多晚辈们的上学读书就再也不关注了。一次跟我妈闲聊,意外得知表姐家的大女儿聪颖过人又沉稳内敛,爱学习也耐得住性子,故而成绩极好,在当地重点中学读书,我心想这或许是个读书种子,万不可再埋没了。于是我当时就给表姐打了电话,聊了一晚上,叮嘱她一定要把孩子的教育重视起来,又支招她应该如何从方方面面给孩子做好辅助工作,并承诺孩子有任何学习方面的问题都可以主动找我帮忙。本意是看重这外甥女,不料却为外甥先找了我,总之因这缘故有了微信找我这事。

言归正传。当时表姐发来了4张卷子照片,我花两分钟看完,一共22道题,错了两道,其中有一题本来是做对了的,然后又涂改掉,写了个错的。我随后将两道题的解题思路和详解回了过去,然后从表姐那儿得知那涂改掉的原本是外甥写的正确答案,表姐认为他答的不对,因为表姐用了一款名叫“作业帮”的app扫描了这些题,而这道题app给出的答案跟外甥的不同,外甥没法,遂改成了错的。我哑然失笑,由此可见表姐一开始的担心——“害怕自己拿不准,误导了孩子”是非常有道理的。

其实我的本意是在教育理念上帮她,教她如何引导孩子,如何辅助孩子,毕竟学习真真是孩子自己的事,外人能引导好、辅助好,孩子自然而然就成了才,事事都手把手,那成了填鸭,成了揠苗助长,孩子也成了提线傀儡,缺乏自主能力,那称不上是教育。很多家长正是因为没有引导好,最后孩子对学习丧失了兴趣和动力,也没有辅助好,甚至很多时候都是在拖后腿,比如管教过严或动辄责骂,对孩子的学习不但没有正向帮助,还给孩子徒增了很多心理压力,再比如安排了过多的作业,浪费了孩子的思考和消化知识的时间、消耗了孩子的专注力,让他本能学好却无法学好,这种家长的瞎干预还不如不干预来的好。

总之,我其实并不太愿意在具体的题目上去给他解惑的,一则与他意义不大,提升很有限,二则我也没那么多的闲空,三则如上面所说,家长能给孩子提供指导的,最终也就5%的比例,所以这个问题一定应该有别的更好的解决方法。依我看,某个题目做错了这样的小事,本该由他自己去探索去发现,或者由老师帮他答疑,或者同学间互相探讨、共同进步,再或者在当下这个科技进步的年代,他也可以借助于AI这样的工具。

用AI来辅助学习,我之前也给表姐推荐了很多次。在我看来,AI是当下解决教育不公问题的最好的工具之一。在教育这方面,城市跟农村之间有差距,重点学校跟普通学校之间有差距,碰到好的老师跟碰到一般的老师之间有差距,父母的教育背景之间有差距,可以购买到更好课外教育资源的有钱人跟穷人之间有差距,而AI,可以极大程度地拉小这些差距,弥补弱势方的先天资源不足,在这方面它有任何其他途径都无可比拟的效果!

于是为了给表姐推荐一款好用的AI工具,我又测试了一把目前市面上的主流大语言模型,用的就是外甥做错的那道题。

题目如下:

某市出租车按以下规定收费,收费标准如下: 

3km及以内,10 元; 

3km以上~15km部分,每千米1.2元(不足1km按1km计算); 

15km以上部分,每千米1.5元(不足1km按 1km计算)。


问题:

(1)叔叔从家乘出租车到16.8km 外的公司,要花多少钱? 

(2)叔叔上班下班一来回乘出租车需要花多少钱? 

(3)叔叔乘该出租车花费 16 元,行驶的路程是?


本次分别选用了国内知名度最高的几个大模型,有百度的文心一言、阿里的通义千问、讯飞的星火大模型、字节跳动(抖音母公司)的豆包。

文心一言:三题全错!

第一题没有注意到不足一公里也按一公里计算,所以错误。

第二题算法错误。

第三题没有回答。

image.png

通义千问:对了半题。

前两题跟文心一言一样的错误,没有注意到不足一公里也按一公里计算,并且数值计算错误

第三题结果答对,但过程有错误。

image.png

星火大模型:三题全错且错得离谱!!!

第一题错的很离谱。

第二题和第三题完全不知所云,离谱中的离谱。

image.png

豆包:三题全错!

前两题跟文心一言一样的错误,第三题不知所云,错的离谱。

image.png

image.png

本意给表姐推荐个国产大模型,因为这些产品在国内用起来方便,只要有个手机或者电脑就能直接使用,只是不料一个小学五年级题目,国产大模型竟全军覆没,最后无奈拿出美国佬的产品,OpenAI的ChatGPT。

GPT4:不出意外,三题全对,且答题过程规范、清晰,一目了然!

image.png

不得不令人唏嘘,中国人竟连个能辅导小学生学习的AI工具都没有,整天净看百度、讯飞之流天天吹牛逼了,个个声称赶超ChatGPT,结果拿来一用却是狗屎不如。

现下国家一直都在强调要实现教育公平,甚至为此直接对教培行业动了刀子,并且下各种举措来规范学校教育、提升教育水平,力求减少因城乡差距、贫富差距带来的教育不公,由此可见国家的决心。而这些在国内有垄断地位的互联网公司,却无视自己的社会责任,做一些草包产品来忽悠老百姓,企业的社会责任感何在?阿里的通义千问、字节的豆包、讯飞的星火,虽然垃圾,但是它是免费的,也不便过于苛责,而百度这么垃圾的文心一言,近期居然开始收费了,50块钱一个月,这是当中国的老百姓是傻子吗?企业的良心何在?

为了能真正有效地减少教育不公,我在此呼吁:

1.希望国产的大模型能够肩负起自己的社会责任,加大人力物力投入,做出真正对老百姓有利的产品。大模型的需求很大、市场很大,你只要能做好,不管多大的投入,最后都能有数倍、数十倍的收益赚回来。

2.希望国家能对国产大模型进行政策上的扶持,尤其是要给予其宽松的生存环境。生成式大模型在发展的过程中肯定会存在些许瑕疵,如果他们的产品出现一点瑕疵就对其进行严厉的处罚,使其运营风险远大于收益,那就严重地打击了他们的积极性,他们压根就不愿也不敢投入太多,宁肯自断双臂,只求糊弄了事。

3.希望国家能重视生成式大模型对国家的重大意义。它不管在教育方面还是在医疗、科研、文化、工作效率提升等方面都有着不可忽视的重要作用,是不可或缺的生产工具,是新时代国家基础建设的重要组成部分。我建议国家或者地方政府成立国有企业,利用政府资源研发国有GPT,本人在GPT研发之难的系列文章里已经提到了一些GPT研发的难点,这些难点从企业层面去解决是非常难的(这也是百度之流做不出好用的GPT的原因),而从政府层面去解决却是非常容易的,不管是语料问题、还是投入问题、还是监管问题,政府来做会比百度、讯飞之流要强得多,现在眼看着百度之流是指望不上了,只能指望政府了。过去十几年,地方政府的土地经济蒸蒸日上,现在正好是转型的契机,很多地方政府都在想尽办法发展高新技术产业,谋求产业升级,发展高质量GDP,AI正是高新技术产业里最耀眼的明星,正在当搞时。

4.希望国家能适当放宽对国外大模型产品的进入限制。目前来说,由于国家的信息安全和国家安全政策,国外的这些产品都是进入不到国内市场的,完全一刀切了。这在一开始,还是很无妨的,一来能保护国家安全和信息安全,二来能在国产大模型还不具竞争力的时候保护国产相关行业的发展,给其一个发展空间。这种做法在一开始是利大于弊,但是依现在的发展形势看来,国产大模型追赶无望,且产品质量低劣,不堪一用,我认为可以在强有力的监管下适当地放开国外大模型产品的进入,以惠及普通老百姓。生成式大模型是可以高度定制的,它的输出内容也是高度可控的,在强有力的监管下,它能带来的国家安全风险也是高度可控的。在强有力的监管下,取其利而避其害,岂不美哉?

总之,如果像我的外甥这样的小学生、中学生能用上GPT4这样高质量的大模型,不管是国产的也好,进口的也好,用上了那学习效率定会得到极大的提高,老师家长也少操心,教育公平也会更大程度地实现,全民素质也能顺带提升了。只是不知这一天,要等到何时?

收 藏
分 享
表态的人
  • 双桂女
发送

6条评论

  • 厉害。验证很重要。这是拿事实说话了。
    2023-12-03 09:12:14 0回复
    1
  • 从小引导孩子自学能力,很重要。
    2023-11-21 08:30:46 1回复
    1
  • 学好基础,不死记硬背,善用大数据,应是大中学生的主要学习状态。
    2023-11-05 09:47:39 1回复
    1
  • 分享、点赞!
    2023-11-04 21:49:44 0回复
    1
  • 取其利,指的是每一个使用它的用户。
    避其害,这个责任主要在运营方。可以是openai自己,也可以是它在中国的代理公司。
    事实上它是完全可以实现由中国公司进行代理和运营,由中国公司对其模型进行把控和微调,使其在中国的法律法规下合法经营,最后让其程序在国内的服务器上运行,把数据都保留在国内。
    其实国外的互联网产品进入中国市场,大多也都是如此操作的。比如美国公司暴雪,它的产品在中国都是由网易代理和运营,用户数据也都在网易手里,暴雪想拿到用户数据也是没有任何办法的。再比如很多人使用的苹果手机,它用来保存照片、视频等用户数据的icloud服务,也是运行在云上贵州服务器上,数据也都保存在国内。
    最后你再看看,中国人用的电脑几乎都是微软的windows系统,用的手机也几乎都是谷歌的安卓系统和苹果的ios系统,这些系统也全是美国的,从信息安全风险的来看,使用外国的操作系统要比使用国外的人工智能模型大几万倍。如果这种风险是不可控的,中国也不会让这些东西进入中国市场。
    2023-11-04 14:57:16 0回复
    0
  • 关键是由谁来取其利而避其害?
    2023-11-04 10:20:00 0回复
    0
  • 1440
    积分
  • 12
    博文
  • 43
    被赞

个人介绍


未成年人举报专码
苏ICP备15046661号 苏公网安备32041102000012号 互联网新闻信息服务许可证:32120170011号 信息网络传播视听节目许可证号:1008248
本站不良内容举报信箱:bbs_cz001@163.com  举报电话:0519-82000682  业务联系: 0519-86189488
未成年人举报信箱:a82000682@163.com   举报电话:0519-82000684