
圖片由Grok3生成
有位尊敬的學長問了我這個問題:
目前哪個AI可以解國中題目,解的最好,我用chatgpt照相後,他回答的是錯的…
學長一方面想看AI的進展,一方面也想看看是不是AI能夠把小孩教得更好,可以花錢了。
基於同樣的好奇,筆者做了以下的試驗,結論在最後面會寫出來。
步驟一: 隨意地在網路上搜尋,找兩張國中與高中的考卷。考卷後面有附上答案:
- 網路搜尋了一下,我隨機找到了一張國中考卷,並隨機取了一題

2. 繼續搜尋高中數學,又找到一張高中考卷,也隨意取了一題如下:

步驟二:搜尋相關網站
隨意地在網路上搜尋AI homework,AI Math solver, AI School Helper AI for studying等關鍵字,找第一頁的網站,一個一個登入,試著解上述的題目。作法就是把圖丟上去,按下送出。
除了我手上已經付過費的Gemini與ChatGPT以外,如果遇到一開始就需要付費的服務,筆者就不往下進行測試。
步驟三:記錄答題情形
測試過程中,筆者紀錄兩件事:
a. 答案是否正確,
以及
b. 看起來推導過程的文字是否正確,值得參考。
如果這兩件事都對,就是比較棒的AI家教服務。
另外,由於時間有限,也非專業評測,只做這兩題,每一題目都新開對話,避免上下誤導,並且只給一次機會。如果上傳了圖片,但他不知道要做什麼,我會提示他請解出答案。
測試結果
如下圖:

筆者紀錄 是否答對,以及推導是否正確,並且把AI吐出來的答案與推導截圖保留,方便讀者進一步看每個不同的AI是怎麼回答的。
如果兩題都答題正確,且推導正確,那麼就會得到四個勾。
完整測試表格可點這裡查看。
測試結論
- 兩題都答對的有四位AI夥伴:
- 其他數十個筆者測試的網站幾乎都沒能答對國中題目,有兩個大概打對國中,但在高中題目失敗。整體來看都沒有展現基本的推理能力。筆者猜測表現這麼差的原因是他們背後用的模型是前一代的。
- 筆者已經付費的Google One, ChatGPT Pro。除了平常就是筆者的研究夥伴,思考夥伴與解商業難題的夥伴之外,解決國高中數學問題也是小菜一碟。
- Grok3照道理是個超強的模型,但在免費版答題時,展現了過多的創意與批判性思考,質疑了題目本身,做錯台灣的考試題目或許也是正常發揮?
- 其他沒有在免費版中提供適當推論能力的大語言模型並不能正確答題。(也可能是我沒有按對按鈕。)
- DeepSeek R1免費版果然強悍,解答國高中數學能力,並以中文回答不錯。既然他是開源版本,等台灣版本也訓練完成,加上GPU越來越便宜,應該就可以拿來自架在電腦上使用了。
- MathGPT是筆者搜尋到的數十個宣稱自己能有效解題的AI服務中,唯一兩題都能做對,解釋推導也正確。訂閱費用是每個月9塊美金。比起Google Gemini與OpenAI ChatGPT訂閱來說便宜很多。
- MathGPT是由兩位康乃爾大學資訊工程系的學生做的。筆者查詢了一下,其中一位叫做Nour Gajial。進到MathGPT 的Discord頻道後,筆者有發現他們有作iPhone App, 叫做PocketMath,也歡迎讀者使用了之後,在留言區回報性能如何。

結語
AI日新月異,如同前篇文章提到的,AI時代的變化,堪比前一次Internet時代數十年生產力提升與商業模式變化帶來的驚奇。善用AI學習自己不會的學科,會不會進步的更快?用AI來幫忙學習是不是一個好產業?歡迎留下你的看法!