现在的AI还真不行

拿小孩的一道几何题,问了几乎所有能接触到的AI大模型,都号称什么得分90+,结果没有一个可以给出答案和解题过程。

用的AI包括:千问、豆包、元宝、deepseek、KIMI、chatGPT、Gemini、grok;当然翻墙用的都是免费版。

首先,是没有一个给出了正确的答案;告诉了正确答案之后都在那编造,只有Gemini还算是讨论,说我的答案错了,我觉得这已经是比较好的了。

(我的答案是考试给出的正确答案,有方式可以证明,但我没有拿到证明过程,我自己也可以证明,但用的方法超纲了,题本身是初二的。所以我很确定我给的答案本身是正确的。)

其次,编造的过程惨不忍睹,经常出现的是,告诉我同一条直线上的三个点组成了等边三角形;或者就是,明显有交点的线说是平行线,然后说证明出结果了。看他们的解题过程真是浪费我的时间。关键是,有几个深度思考的,光思考过程就8、9屏甚至更多的内容。

真是不知道他们那些评分的系统都是什么题。

站务

最近更新的专栏

全部专栏