專家實測6大AI工具可靠度 榜首出人意料

現在人碰到問題,第壹直覺反應就是問 AI!但是到底哪壹個 AI 工具才最准確?或許每個人都有不壹樣的感受,對此英國消費者組織《Which?》就聯合專家,針對六組常見的 AI 工具進行實測,結果 Gemini、ChatGPT 都無法獲得最高分。


《Which?》針對 ChatGPT、Google Gemini、Gemini AI Overview (Google 搜尋的 AI 摘要)、Microsoft Copilot、Meta AI 及 Perplexity 等六個工具進行測試,每個 AI 會被詢問包含個人理財、法律、健康與飲食、消費者權益及旅游等不同面向、共 40 個問題,再由專家確認准確度、清晰度、實用性、倫理責任等指標,進而給出整體評分,結果如下(分數越高越好):

1.Perplexity:71%

2.Gemini AIO:70%

3.Gemini 69%

4.Copilot:68%

5.ChatGPT:64%

6.Meta AI:55%


調查發現,AI 給予的答案存在許多隱憂,例如許多來源引用 Reddit 論壇或未知網站,並非來自權威內容,甚至有的 AI 會提供錯誤的理財、醫療資訊。當旅游碰到意外時,它甚至可能誤導取消機票可以全額退費,或是對於票務規則本身就有錯誤理解,在法律上的專業度也明顯不足,沒有提醒消費者應該征詢專業的法律建議。

《Which?》科技專家 Andrew Laughlin 指出:“我們的研究發現,AI 有太多令人不安且不准確的誤導性陳述,尤其是在碰到財務、法律諮詢等重要議題時。”他警告用戶,使用 AI 務必明確定義問題,並且仍要檢查資訊來源,對於醫療、財務等復雜議題,壹定要尋求專業諮詢後,再做出重大決定。



(示意圖)

[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  •  推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站